planche3autre

publicité
TD3
1. Calcul de probabilités
Rappel : d donne les valeurs P(X=j) (loi de probabilité )
p donne les valeurs P(X<=x) ( fonction de répartition)
Il existe des formules similaires pour les autres lois:
binom, dnbinom, norm, unif, chisq, t, exp, f, gamma, beta,...
a) calcul de la probabilité qu'une variable aléatoire X suivant une loi binomiale de
paramètres n=10 et p=1/3, B(10,1/3), soit égale à 1 ? dbinom()
b) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit égale
à 0,1,2,...10
c) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit
inférieure ou égale à 0,1,2,...10 pbinom()
d) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit
supérieure à 5 ?
e) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5)
soit égale à 0,1,2,...8 ?
f) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5)
soit inférieure ou égale à 0,1,2,...8 ?
g) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5)
soit supérieure à 20 ?
2. Les quantiles
RAPPEL : q donne pour y la valeur x telle que P(X=x)=y
a) calcul de la valeur x, de la loi normale centrée réduite telle que P(X<=x)=0.97:
qnorm()
b) calcul du quantile 2% pour une loi T de Student à 5 ddl qt()
3. Analyse de données: résumé statistique.résumé graphique.
Pour les données continues, on peut calculer moyenne variance quantile, coefficients de
corrélation.
a) Charger le jeu de données mtcars , et regarder ce qu'il contient..Quelles sont les variables
continues?
a) faire quelques essais sur les colonnes de mtcars correspondant à des variables
continues. Donner des résumés statistiques.
On regardera en détail les représentations de ce type de données obtenues à l'aide de
hist(), boxplot().
Pour les données discrètes, on peut utiliser la fonction table()*****. Que fait-elle?
Une représentation sera donnée par (barplot(table())
Charger le jeu de données stackloss
calculer les moyennes, variances et résumés statistiques des variables de stackloss
créer l'histogramme, le boxplot et tracer la loi de distribution empirique pour la
variable stack.loss (fonction ecdf()et plot() pour tracer)
Est-ce que l'hypothèse de normalité parait raisonnable pour cette variable?
on utilisera les fonctions qqnorm() et qqline()
TD3
(suite)
5.Echantillons
a) échantillon de taille 120 d'une loi binomiale B(10,1/3)
b) échantillon de taille 120 d'une loi normale N(5,4)
6.Tirages aléatoires
Des expériences simples comme « choisir un nombre au hasard entre 1 et 100 », ou
« tirer trois boules dans une urnes » peuvent être simulées avec R . De plus les méthodes
comme le bootstrap (tirages répétés dans le même échantillon) sont des outils importants
en statistiques.
La fonction clé est sample(). Etudier les exemples suivants :
urn=c(rep(« red »,8),rep(« blue »,4),rep(« yellow »,3)) ;
sample(urn,6,replace=FALSE)
analyser le résultat de:
plot(0:10,dbinom(0:10,size=10,prob=.25),type="h",lwd=30,col="gray",main="loi
binomiale n=10 p=0.25")
puis de
curve(dnorm(x),from=-3, to=3)
donner un titre au graphe obtenu
même question pour
curve(pnorm(x,mean=10,sd=2),from=4,to=16)
expliquer le script suivant:
donneesimul=rexp(100,rate=0.1)
hist(donneesimul,prob=TRUE,breaks="FD",main="")
curve(dexp(x,rate=.1),add=TRUE)
expliquer en particulier l'effet de l'argument add=TRUE
7.Loi de la moyenne et de la variance empiriques
Fonctions à utiliser : apply(), replicate()
 Générer 100 échantillons issus de la loi normale de paramètres 3 et 1
 Pour chaque échantillon calculer la moyenne et la variance empirique et tracer
l’histogramme de celles ci. Que peut-on observer ?
 Refaire le même essai en remplaçant loi normale par une loi de Poisson de paramètre
5.
Non fait
Récapitulatif
Simuler 100 observations de la distribution normale avec m=50 et v=16. Tracer la fonction de
densité cumulée empirique et superposer la vraie fonction de densité cumulée
Simuler 25 lancers d’une piece.
Générez n=100 puis 1000, puis 10 000 observations d’une loi normale de paramètres
m=3,s=1. Calculez la moyenne empirique et la variance empirique dans chaque cas. Que peut
on observer ?
Tracer l’histogramme ainsi que la densité de ces observations (utiliser les fonctions hist() et
plot(density())). Que peut-on conclure ?
Utiliser les fonctions pnorm()et qnorm() et les comparer avec les données des tables
statistiques.
9.la loi normale
Le tracé de la loi normale pour x variant entre –3 et 3 avec un pas de 1/500 est obtenu ainsi :
w0 <- seq(-3,3,le=500)
plot(w0,dnorm(w0),type="l",main= « loi normale »)#
plot(w0,pnorm(w0),type="l",main= « fonction de répartition »)
Faire de même pour la loi binomiale de paramètres n=10 et p=1/3
On propose le script suivant :
Tracé sur la même page de la loi binomiale - loi théorique de paramètres p= 1/3 et n = 5, 20,
50, 100, 200, 500,1000, 5000.
loibin =function(n,p) {
y <- diff(c(0,pbinom(0:n,n,p)))
x <- ((0:n)-n*p)/sqrt(n*p*(1-p))
etiq0 <- paste( "n=",n)
plot(x,y,xlab=etiq0,ylab="proba",type="h",xlim=c(-3,3))
}
opar=par()
par(mfrow=c(2,4)) ;# partition de l’écran
loibin(5,1/3);loibin(20,1/3);loibin(50,1/3);loibin(100,1/3)
loibin(200,1/3);loibin(500,1/3);loibin(1000,1/3);loibin(5000,1/3)
par(opar)
Téléchargement