MINT TD3 1. Calcul de probabilités RAPPEL : d donne les valeurs P

publicité
MINT
TD3
1. Calcul de probabilités
RAPPEL : d donne les valeurs P(X=j) (loi de probabilité ), p donne les valeurs P(X<=x) ( fonction
de répartition)
Il existe des formules similaires pour les autres lois: binom, norm, unif, chisq, t, exp, f,
gamma, beta,...
a) calcul de la probabilité qu'une variable aléatoire X suivant une loi binomiale de paramètres
n=10 et p=1/3, B(10,1/3), soit égale à 1 ? dbinom()
b) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit égale à
0,1,2,...10
c) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit inférieure
ou égale à 0,1,2,...10 pbinom()
d) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit supérieure
à5?
e) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5) soit
égale à 0,1,2,...8 ?
f) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5) soit
supérieure à 20 ?
2.Les quantiles
RAPPEL : q donne pour y la valeur x telle que P(X<=x)=y
a) Calculer la valeur x, de la loi normale centrée réduite telle que P(X<=x)=0.97: qnorm()
b) Calculer le quantile 2% pour une loi T de Student à 5 ddl qt()
3. RAPPEL:-Pour les données univariées continues, on peut calculer moyenne, variance, quantiles,
on peut donner des représentations avec plot(), hist(), rug(), boxplot()
-Pour des données bivariées continues, coefficients de corrélation, plot(), qqplot().
-Pour les données discrètes univariées, on peut utiliser les fonctions table(), des représentations
barplot(table()), dotchart(table()), plot(table((), type= « h »),().
-Pour des données discrètes bivariées, mosaicplot()
-Dans le cas de données mixtes, boxplot(x~a), plot(x~a), qqplot()
-Dans le cas de donner multivariées, matplot(),pairs(), ggobi().
a) Charger le jeu de données mtcars, et regarder ce qu'il contient. Faire une étude sur les
colonnes de mtcars correspondant à des variables continues, discrètes, puis à des couples
(continue, continue) ou (discrète, continue).
b) Etudier la normalité éventuelle d'une variable continue de votre choix. qqnorm() et qqline()
4. Tirages aléatoires
a) Générer un échantillon gaussien de taille 100, moyenne 12 et écart-type 3, et le stocker
dans une variable x. Représenter les données sous forme d'histogramme.
b)Séparer l'échantillon en deux sous-échantillons équilibrés de taille 50, et stocker dans deux
variables x1 et x2. Afficher séparément deux histogrammes correspondants, puis deux boites
à moustaches parallèles.
c)Le nombre de pile dans une expérience où on lance successivement une pièce équilibrée
suit une loi binomiale de paramètres n=100, p=0,5. Faire un graphique de cette distribution
de probabilité. Superposer la distribution de probabilité associée à p=0,7.(pièce biaisée en
faveur de pile). dbinom(), plot(), lines()
5. Loi de la moyenne et de la variance empiriques
Fonctions à utiliser : apply(), replicate()
a) Générer 100 échantillons de taille n=10 issus de la loi normale de paramètres 3 et 1
b) Pour chaque échantillon calculer la moyenne et la variance empirique et tracer
l’histogramme des moyennes, celui des variances. Que peut-on observer ?
c)Refaire le même essai en remplaçant loi normale par une loi de Poisson de paramètre 5.
6. Des expériences simples comme « choisir un nombre au hasard entre 1 et 100 », ou « tirer trois
boules dans une urne» peuvent être simulées avec R . De plus les méthodes comme le bootstrap
(tirages répétés dans le même échantillon) sont des outils importants en statistiques.
La fonction clé est sample(). Etudier les exemles suivants :
urn=c(rep(« red »,8),rep(« blue »,4),rep(« yellow »,3)) ;
sample(urn,6,replace=FALSE)
analyser le résultat de:
plot(0:10,dbinom(0:10,size=10,prob=.25),type="h",lwd=30,col="gray",main="loi binomiale
n=10 p=0.25")
puis de
curve(dnorm(x),from=-3, to=3)
donner un titre au graphe obtenu
même question pour
curve(pnorm(x,mean=10,sd=2),from=4,to=16)
expliquer le script suivant:
donneesimul=rexp(100,rate=0.1)
hist(donneesimul,prob=TRUE,breaks="FD",main="")
curve(dexp(x,rate=.1),add=TRUE)
expliquer en particulier l'effet de l'argument add=TRUE
Non fait
9.la loi normale
Le tracé de la loi normale pour x variant entre –3 et 3 avec un pas de 1/500 est obtenu ainsi :
w0 <- seq(-3,3,le=500)
plot(w0,dnorm(w0),type="l",main= « loi normale »)#
plot(w0,pnorm(w0),type="l",main= « fonction de répartition »)
Faire de même pour la loi binomiale de paramètres n=10 et p=1/3
On propose le script suivant :
Tracé sur la même page de la loi binomiale - loi théorique de paramètres p= 1/3 et n = 5, 20, 50,
100, 200, 500,1000, 5000.
loibin =function(n,p) {
y <- diff(c(0,pbinom(0:n,n,p)))
x <- ((0:n)-n*p)/sqrt(n*p*(1-p))
etiq0 <- paste( "n=",n)
plot(x,y,xlab=etiq0,ylab="proba",type="h",xlim=c(-3,3))
}
opar=par()
par(mfrow=c(2,4)) ;# partition de l’écran
loibin(5,1/3);loibin(20,1/3);loibin(50,1/3);loibin(100,1/3)
loibin(200,1/3);loibin(500,1/3);loibin(1000,1/3);loibin(5000,1/3)
par(opar)
Téléchargement