Travaux dirigés BTS ACSE/GPN/TV
3. Recommencer et observer la fluctuation d’échantillonnage avec 1000 lancers puis 10000 lancers,
100000 lancers et 1000000 lancers.
Quelle conclusion concernant la fluctuation d’échantillonnage peut-on déduire de ce qui précède ?
4. Quand on lance un dé bien équilibré on a 1 chance sur 6 d’obtenir la face 5 (de même pour les autres
faces). Retrouve-t-on ce résultat ?
5. Application : deviner la composition de l’urne.
Une urne bien cachée dans la mémoire de l’ordinateur contient 470 boules de couleurs. Le but de
l’exercice est de trouver la composition de cette urne.
(a) Ouvrir le fichier « Secrets ».
(b) Que réalise l’instruction suivante : s=sample(urnesecrete,1,T) ; s ?
(c) On étudie des échantillons de taille 10 et on observe les tables et les diagrammes obtenus :
s=sample(urnesecrete,10,T) ; t=table(s) ; t ; barplot(t)
Quelles sont les couleurs des boules contenues dans l’urne ?
(d) En modifiant la taille de l’échantillon, déterminer la composition de l’urne en pourcentage. Com-
menter votre démarche et présenter un diagramme qui justifie votre réponse. En déduire la com-
position de l’urne.
3 Le problème des sondages
Nous savons tout, nous voyons tout ! On imagine une population composée de 1000000 d’individus. La
moitié des individus possèdent une certaine caractéristique qui est codée par le chiffre 1. L’autre moitié est
codée par 0. On effectue des sondages dans cette population et étudie les résultats.
1. On définit la population : population=c(rep(0,500000),rep(1,500000))
2. (a) Un échantillon de 1000 : échantillon=sample(population,1000) ; échantillon
(b) Dans cet échantillon, combien d’individus possèdent la caractéristique étudiée ?
s=sum(échantillon)
(c) Quel pourcentage cela représente-t-il? s*100/1000
(d) En abrégé : s=sum(sample(population,1000))/10 ; s
3. En rappelant cette instruction vous obtiendrez le résultat d’autant de sondages que vous le souhai-
tez. . .chose qu’on ne peut pas se permettre en réalité.
(a) Dans quel intervalle se trouvent les résultats observés ?
(b) Dans la population choisie on sait que 50% des personnes possèdent la caractéristique étudiée.
Quelle est la marge d’erreur induite par le sondage ?
4. Pour affiner cette estimation nous allons faire un grand nombre de sondages, par exemple 500 son-
dages.
(a) L’instruction est la suivante :
L=c() ; for(i in 1:500) L=c(sum(sample(population,1000))/10,L)
(b) Pour analyser les résultats : hist(L,prob=TRUE)
Quelle loi de probabilité peut produire cet histogramme ?
Un indice de plus ? Taper l’instruction : hist(L,prob=TRUE,nclass=20)
Un indice de plus ? Taper l’instruction : lines(density(L,bw=1))
(c) Calculons quelques valeurs caractéristiques :
• Taper l’instruction : mean(L), la moyenne µdes 500 échantillons est :
• Taper l’instruction : sd(L), l’écart type σdes 500 échantillons est :
• Taper l’instruction : length(L[(L>mean(L)-sd(L))&(L<mean(L)+sd(L))])/500,
le pourcentage des 500 échantillons dans l’intervalle [µ−σ;µ+σ]est :