CM3b - Christophe Genolini

publicité
Les groupes
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 1
Rappel
• Un amphi de 200 élèves : loi normale moyenne X et écart type s
– Un élève : on peut connaître la probabilité de sa note
– Exemple, X=10, s=2,
• l’élève à 14  Z= (14-10)/2  Top 2,5%
• L’élève à 11  Z= (11-10)/2  Top 31%
• Comment faire pour un groupe d’élèves ?
– Sur un groupe, les bonnes notes sont compensées par les mauvaises
– Extrêmement improbable qu’un groupe ait 14 de moyenne
8 ; 14 ; 16 ; 16 ; 18
– Une moyenne de 12, c’est déjà beaucoup :
8 ; 10 ; 12 ; 14 ; 16
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 2
Comment faire ?
Individu
• On compare la note d’un
individu à la distribution des
notes
• On conclut grâce à la loi
normale
http://christophe.genolini.free.fr
Groupe de taille N
• On compare un groupe de taille
N à la distribution des groupes
de taille N.
 Plus précisément, on compare
la moyenne d’un groupe avec la
distribution des moyennes des
groupes de taille N
• On conclut grâce à la loi
normale
Licence Stat-info
CM3b : 3
Exemple
• VOS notes d’anglais de l’an dernier
• Notes d’anglais par groupe de 4
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 4
Distribution d’échantillonnage des moyennes
• On prend un groupe E au hasard de taille N
• On calcule sa moyenne E = 10,2
• On recommence avec beaucoup de groupes
9,6 9,7 10,3 10,8 10,0 10,3 11,2
• On obtient une distribution
• C’est la distribution d’échantillonnage
des moyennes
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 5
Théorème central limite
• Soit X une variable suivant une loi normale de moyenne X
écart type sx
• On note EX la distribution d’échantillonnage des moyennes.
• Alors
– EX suit une loi normale
– Cette loi normale a pour moyenne X
– Cette loi normale a pour écart type sx / N
E X
EX
http://christophe.genolini.free.fr
sEX  sX
N
Licence Stat-info
CM3b : 6
Exemple des Notes d’anglais
• Les notes d’anglais suivent
– la loi normale (plus ou moins)
– de moyenne X=10,5
– et d’écart type sX = 3
60
50
40
30
20
10
0
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18
• Sa distribution d’échantillonnage des moyennes
(groupes de taille 4)
60
– suit une loi normale
– de moyenne EX=10,5
– et d’écart type sEX =3/4 = 3/2=1,5
50
40
30
20
10
0
1
http://christophe.genolini.free.fr
Licence Stat-info
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16
CM3b : 7
Exemple des notes
• Un amphi de 200 élèves suit
– la loi normale
– de moyenne X=10
– et d’écart type sX = 2
• Sa distribution d’échantillonnage des moyennes
(groupes de taille 25)
– suit une loi normale
– de moyenne EX=10
– et d’écart type sEX =2/25 = 2/5=0,4
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 8
Ne mélangeons pas tout !
• X est la moyenne de la distribution X (moyenne de l’amphi)
• G est la moyenne du groupe G (moyenne des APA, taille 25)
• EX est la distribution d’échantillonnage des moyennes des
groupes de taille 25.
– Comme toute distribution, EX a une moyenne.
• EX est la moyenne de la distribution EX
Si c’est clair, tout le reste est facile !
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 9
Exemple
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 10
Problème
• Un amphi : moyenne X=10, écart type sX=2
• Le groupe des APA (25 élèves) : moyenne G=11
• Quelle la probabilité qu’une groupe de taille 25 ait 11 ou plus ?
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 11
1. H0
• H0 : la différence n’est pas significative.
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 12
2. Données
• G=11, moyenne de l’amphi X=10, écart type sX=2
• On va comparer la moyenne du groupe à la distribution
d’échantillonnage des moyennes EX :
– EX=10
– sEX =2/25 = 2/5=0,4
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 13
3. Test
• On utilise la loi normale :
– Avec un individu : Z 
– Avec un groupe : Z 
http://christophe.genolini.free.fr
xX
s
G  EX
s EX

Licence Stat-info
11  10
 2,5
0,4
CM3b : 14
4. Probabilité
• Z=2,5 P=0,62%
– Un groupe de taille 25 a 0,62% de chances d’avoir une
moyenne dans [11 ; +∞]
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 15
5. Conclusion
• P<5%, on rejette H0
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 16
Autre formulation de la solution
Z GEX
sEX
G  EX G  X
Z

s EX
sX N
Z  1110 2,5
2 25
Z 1110 2,5
0,4
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 17
s et σ
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 18
Quand on ne connaît pas 
• Dans l’exemple précédent, on a comparé la moyenne d’un
groupe G à la moyenne de la population X. Coup de chance,
on connaissait l’écart type de la population.
• Problème : Si on ne connaît pas X, comment faire ?
• Solution : On fait une approximation, on remplace X par sG
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 19
Exemple des salaires
• Un groupe de 10 femmes comparent leur salaire à celui des employés :
• Salaire moyen des employés :
– moyenne=28 k$,
– Écart type=?
• Salaire des 10 femmes : 24, 27, 31, 21, 19, 26, 30, 22, 15, 36
– Moyenne = 25,1 k$
– Écart type = 5,9
• Solution théorique :
http://christophe.genolini.free.fr
Z
28  25,1
s SalaireGénéral / 10
Licence Stat-info
CM3b : 20
Solution réelle
• On approxime l’écart type des salaires moyens des hommes
par l’écart type des salaires moyens des femmes
Z
28  25,1
s SalaireGénéral / 10
est remplacé par
Z
http://christophe.genolini.free.fr
28  25,1
s Salairefemmes/ 10

28  25,1
5,9/ 10
Licence Stat-info
CM3b : 21
T de student
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 22
Approximation : sG n’est pas X
• Si N est grand (N>30) : pas de problème, sG est presque égal à X
• Si N est petit (N<30 ) : sG est une sous estimation de X
– Donc le Z obtenue serait trop grand (par rapport à celui qu’on obtiendrait si
on connaissait X )
Dans ce cas, on remplace Z par le T de Student
GX
T
sG N
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 23
T de Student
• La table du T change selon la taille de l’échantillon
• Un échantillon de taille N a un degré de liberté (ddl) de N-1.
• On trouve la probabilité du T de Student grâce
– A Excel : Loi.Student
– A la table papier
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 24
Table du T
T
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
1
50,00%
46,83%
43,72%
40,72%
37,89%
35,24%
32,80%
30,56%
28,52%
26,67%
25,00%
23,49%
22,11%
20,87%
19,74%
18,72%
17,78%
16,93%
16,14%
15,42%
14,76%
14,15%
13,58%
13,05%
12,57%
12,11%
11,69%
11,29%
10,92%
10,57%
10,24%
2
50,00%
46,47%
43,00%
39,62%
36,39%
33,33%
30,47%
27,82%
25,38%
23,16%
21,13%
19,30%
17,65%
16,16%
14,82%
13,62%
12,54%
11,56%
10,68%
9,89%
9,18%
8,53%
7,94%
7,41%
6,92%
6,48%
6,08%
5,71%
5,37%
5,06%
4,77%
http://christophe.genolini.free.fr
3
50,00%
46,33%
42,71%
39,19%
35,80%
32,57%
29,54%
26,72%
24,11%
21,72%
19,55%
17,58%
15,81%
14,22%
12,80%
11,53%
10,40%
9,38%
8,48%
7,68%
6,97%
6,33%
5,76%
5,25%
4,79%
4,39%
4,02%
3,69%
3,39%
3,13%
2,88%
4
50,00%
46,26%
42,56%
38,96%
35,48%
32,17%
29,04%
26,13%
23,43%
20,95%
18,70%
16,65%
14,82%
13,17%
11,71%
10,40%
9,24%
8,22%
7,31%
6,51%
5,81%
5,18%
4,63%
4,15%
3,72%
3,34%
3,00%
2,70%
2,44%
2,21%
2,00%
5
50,00%
46,21%
42,47%
38,81%
35,28%
31,91%
28,73%
25,76%
23,00%
20,47%
18,16%
16,07%
14,19%
12,52%
11,02%
9,70%
8,52%
7,49%
6,59%
5,79%
5,10%
4,49%
3,95%
3,49%
3,08%
2,72%
2,41%
2,14%
1,90%
1,69%
1,50%
6
50,00%
46,18%
42,40%
38,71%
35,15%
31,74%
28,52%
25,51%
22,71%
20,14%
17,80%
15,67%
13,77%
12,07%
10,55%
9,21%
8,04%
7,00%
6,10%
5,31%
4,62%
4,02%
3,51%
3,06%
2,66%
2,33%
2,03%
1,78%
1,56%
1,37%
1,20%
Licence Stat-info
7
50,00%
46,16%
42,36%
38,64%
35,05%
31,62%
28,37%
25,33%
22,50%
19,90%
17,53%
15,39%
13,46%
11,74%
10,21%
8,86%
7,68%
6,65%
5,74%
4,96%
4,28%
3,69%
3,19%
2,75%
2,37%
2,05%
1,77%
1,53%
1,33%
1,15%
1,00%
8
50,00%
46,14%
42,32%
38,59%
34,98%
31,53%
28,26%
25,19%
22,34%
19,72%
17,33%
15,17%
13,22%
11,49%
9,95%
8,60%
7,41%
6,38%
5,48%
4,70%
4,03%
3,45%
2,95%
2,52%
2,16%
1,85%
1,58%
1,35%
1,16%
0,99%
0,85%
9
50,00%
46,13%
42,30%
38,55%
34,92%
31,45%
28,17%
25,08%
22,22%
19,58%
17,17%
14,99%
13,04%
11,30%
9,75%
8,39%
7,20%
6,17%
5,27%
4,49%
3,83%
3,26%
2,77%
2,35%
1,99%
1,69%
1,44%
1,22%
1,04%
0,88%
0,75%
10
50,00%
46,12%
42,27%
38,52%
34,88%
31,39%
28,09%
24,99%
22,12%
19,46%
17,04%
14,86%
12,89%
11,14%
9,59%
8,23%
7,03%
6,00%
5,10%
4,33%
3,67%
3,10%
2,62%
2,21%
1,87%
1,57%
1,32%
1,12%
0,94%
0,79%
0,67%
CM3b : 25
Exemple des salaires
• On calcule T :
T
GX
sG
N

25,1  28
5,1
10
 1,79
• DDL 9  P=5,27%
On ne peut pas rejeter H0
http://christophe.genolini.free.fr
Licence Stat-info
CM3b : 26
ATTENTION : DDL
Pour le  2
Pour le T de Student
• DDL = (colonnes-1)x(lignes-1)
http://christophe.genolini.free.fr
• DDL = effectifs - 1
Licence Stat-info
CM3b : 27
Récapitulatif
• On connaît sX
• On ne connaît pas X
• N est grand (N>30)
• On ne connaît pas X
• N est petit (N<30)
http://christophe.genolini.free.fr
Z GX
sX N
Z GX
sG N
T GX
sG N
Licence Stat-info
On conclut grâce à la
table de la loi
normale
On conclut grâce à la
table de la loi
normale
On conclut grâce à la
table du T de Student
CM3b : 28
Téléchargement