MINT TD3 1. Calcul de probabilités RAPPEL : d donne les valeurs P(X=j) (loi de probabilité ), p donne les valeurs P(X<=x) ( fonction de répartition) Il existe des formules similaires pour les autres lois: binom, norm, unif, chisq, t, exp, f, gamma, beta,... a) calcul de la probabilité qu'une variable aléatoire X suivant une loi binomiale de paramètres n=10 et p=1/3, B(10,1/3), soit égale à 1 ? dbinom() b) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit égale à 0,1,2,...10 c) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit inférieure ou égale à 0,1,2,...10 pbinom() d) calcul de la probabilité qu'une variable aléatoire X suivant une loi B(10,1/3) soit supérieure à5? e) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5) soit égale à 0,1,2,...8 ? f) calcul de la probabilité qu'une variable aléatoire X suivant une loi de Poisson P(2.5) soit supérieure à 20 ? 2.Les quantiles RAPPEL : q donne pour y la valeur x telle que P(X<=x)=y a) Calculer la valeur x, de la loi normale centrée réduite telle que P(X<=x)=0.97: qnorm() b) Calculer le quantile 2% pour une loi T de Student à 5 ddl qt() 3. RAPPEL:-Pour les données univariées continues, on peut calculer moyenne, variance, quantiles, on peut donner des représentations avec plot(), hist(), rug(), boxplot() -Pour des données bivariées continues, coefficients de corrélation, plot(), qqplot(). -Pour les données discrètes univariées, on peut utiliser les fonctions table(), des représentations barplot(table()), dotchart(table()), plot(table((), type= « h »),(). -Pour des données discrètes bivariées, mosaicplot() -Dans le cas de données mixtes, boxplot(x~a), plot(x~a), qqplot() -Dans le cas de donner multivariées, matplot(),pairs(), ggobi(). a) Charger le jeu de données mtcars, et regarder ce qu'il contient. Faire une étude sur les colonnes de mtcars correspondant à des variables continues, discrètes, puis à des couples (continue, continue) ou (discrète, continue). b) Etudier la normalité éventuelle d'une variable continue de votre choix. qqnorm() et qqline() 4. Tirages aléatoires a) Générer un échantillon gaussien de taille 100, moyenne 12 et écart-type 3, et le stocker dans une variable x. Représenter les données sous forme d'histogramme. b)Séparer l'échantillon en deux sous-échantillons équilibrés de taille 50, et stocker dans deux variables x1 et x2. Afficher séparément deux histogrammes correspondants, puis deux boites à moustaches parallèles. c)Le nombre de pile dans une expérience où on lance successivement une pièce équilibrée suit une loi binomiale de paramètres n=100, p=0,5. Faire un graphique de cette distribution de probabilité. Superposer la distribution de probabilité associée à p=0,7.(pièce biaisée en faveur de pile). dbinom(), plot(), lines() 5. Loi de la moyenne et de la variance empiriques Fonctions à utiliser : apply(), replicate() a) Générer 100 échantillons de taille n=10 issus de la loi normale de paramètres 3 et 1 b) Pour chaque échantillon calculer la moyenne et la variance empirique et tracer l’histogramme des moyennes, celui des variances. Que peut-on observer ? c)Refaire le même essai en remplaçant loi normale par une loi de Poisson de paramètre 5. 6. Des expériences simples comme « choisir un nombre au hasard entre 1 et 100 », ou « tirer trois boules dans une urne» peuvent être simulées avec R . De plus les méthodes comme le bootstrap (tirages répétés dans le même échantillon) sont des outils importants en statistiques. La fonction clé est sample(). Etudier les exemles suivants : urn=c(rep(« red »,8),rep(« blue »,4),rep(« yellow »,3)) ; sample(urn,6,replace=FALSE) analyser le résultat de: plot(0:10,dbinom(0:10,size=10,prob=.25),type="h",lwd=30,col="gray",main="loi binomiale n=10 p=0.25") puis de curve(dnorm(x),from=-3, to=3) donner un titre au graphe obtenu même question pour curve(pnorm(x,mean=10,sd=2),from=4,to=16) expliquer le script suivant: donneesimul=rexp(100,rate=0.1) hist(donneesimul,prob=TRUE,breaks="FD",main="") curve(dexp(x,rate=.1),add=TRUE) expliquer en particulier l'effet de l'argument add=TRUE Non fait 9.la loi normale Le tracé de la loi normale pour x variant entre –3 et 3 avec un pas de 1/500 est obtenu ainsi : w0 <- seq(-3,3,le=500) plot(w0,dnorm(w0),type="l",main= « loi normale »)# plot(w0,pnorm(w0),type="l",main= « fonction de répartition ») Faire de même pour la loi binomiale de paramètres n=10 et p=1/3 On propose le script suivant : Tracé sur la même page de la loi binomiale - loi théorique de paramètres p= 1/3 et n = 5, 20, 50, 100, 200, 500,1000, 5000. loibin =function(n,p) { y <- diff(c(0,pbinom(0:n,n,p))) x <- ((0:n)-n*p)/sqrt(n*p*(1-p)) etiq0 <- paste( "n=",n) plot(x,y,xlab=etiq0,ylab="proba",type="h",xlim=c(-3,3)) } opar=par() par(mfrow=c(2,4)) ;# partition de l’écran loibin(5,1/3);loibin(20,1/3);loibin(50,1/3);loibin(100,1/3) loibin(200,1/3);loibin(500,1/3);loibin(1000,1/3);loibin(5000,1/3) par(opar)