Les groupes http://christophe.genolini.free.fr Licence Stat-info CM3b : 1 Rappel • Un amphi de 200 élèves : loi normale moyenne X et écart type s – Un élève : on peut connaître la probabilité de sa note – Exemple, X=10, s=2, • l’élève à 14 Z= (14-10)/2 Top 2,5% • L’élève à 11 Z= (11-10)/2 Top 31% • Comment faire pour un groupe d’élèves ? – Sur un groupe, les bonnes notes sont compensées par les mauvaises – Extrêmement improbable qu’un groupe ait 14 de moyenne 8 ; 14 ; 16 ; 16 ; 18 – Une moyenne de 12, c’est déjà beaucoup : 8 ; 10 ; 12 ; 14 ; 16 http://christophe.genolini.free.fr Licence Stat-info CM3b : 2 Comment faire ? Individu • On compare la note d’un individu à la distribution des notes • On conclut grâce à la loi normale http://christophe.genolini.free.fr Groupe de taille N • On compare un groupe de taille N à la distribution des groupes de taille N. Plus précisément, on compare la moyenne d’un groupe avec la distribution des moyennes des groupes de taille N • On conclut grâce à la loi normale Licence Stat-info CM3b : 3 Exemple • VOS notes d’anglais de l’an dernier • Notes d’anglais par groupe de 4 http://christophe.genolini.free.fr Licence Stat-info CM3b : 4 Distribution d’échantillonnage des moyennes • On prend un groupe E au hasard de taille N • On calcule sa moyenne E = 10,2 • On recommence avec beaucoup de groupes 9,6 9,7 10,3 10,8 10,0 10,3 11,2 • On obtient une distribution • C’est la distribution d’échantillonnage des moyennes http://christophe.genolini.free.fr Licence Stat-info CM3b : 5 Théorème central limite • Soit X une variable suivant une loi normale de moyenne X écart type sx • On note EX la distribution d’échantillonnage des moyennes. • Alors – EX suit une loi normale – Cette loi normale a pour moyenne X – Cette loi normale a pour écart type sx / N E X EX http://christophe.genolini.free.fr sEX sX N Licence Stat-info CM3b : 6 Exemple des Notes d’anglais • Les notes d’anglais suivent – la loi normale (plus ou moins) – de moyenne X=10,5 – et d’écart type sX = 3 60 50 40 30 20 10 0 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 • Sa distribution d’échantillonnage des moyennes (groupes de taille 4) 60 – suit une loi normale – de moyenne EX=10,5 – et d’écart type sEX =3/4 = 3/2=1,5 50 40 30 20 10 0 1 http://christophe.genolini.free.fr Licence Stat-info 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 CM3b : 7 Exemple des notes • Un amphi de 200 élèves suit – la loi normale – de moyenne X=10 – et d’écart type sX = 2 • Sa distribution d’échantillonnage des moyennes (groupes de taille 25) – suit une loi normale – de moyenne EX=10 – et d’écart type sEX =2/25 = 2/5=0,4 http://christophe.genolini.free.fr Licence Stat-info CM3b : 8 Ne mélangeons pas tout ! • X est la moyenne de la distribution X (moyenne de l’amphi) • G est la moyenne du groupe G (moyenne des APA, taille 25) • EX est la distribution d’échantillonnage des moyennes des groupes de taille 25. – Comme toute distribution, EX a une moyenne. • EX est la moyenne de la distribution EX Si c’est clair, tout le reste est facile ! http://christophe.genolini.free.fr Licence Stat-info CM3b : 9 Exemple http://christophe.genolini.free.fr Licence Stat-info CM3b : 10 Problème • Un amphi : moyenne X=10, écart type sX=2 • Le groupe des APA (25 élèves) : moyenne G=11 • Quelle la probabilité qu’une groupe de taille 25 ait 11 ou plus ? http://christophe.genolini.free.fr Licence Stat-info CM3b : 11 1. H0 • H0 : la différence n’est pas significative. http://christophe.genolini.free.fr Licence Stat-info CM3b : 12 2. Données • G=11, moyenne de l’amphi X=10, écart type sX=2 • On va comparer la moyenne du groupe à la distribution d’échantillonnage des moyennes EX : – EX=10 – sEX =2/25 = 2/5=0,4 http://christophe.genolini.free.fr Licence Stat-info CM3b : 13 3. Test • On utilise la loi normale : – Avec un individu : Z – Avec un groupe : Z http://christophe.genolini.free.fr xX s G EX s EX Licence Stat-info 11 10 2,5 0,4 CM3b : 14 4. Probabilité • Z=2,5 P=0,62% – Un groupe de taille 25 a 0,62% de chances d’avoir une moyenne dans [11 ; +∞] http://christophe.genolini.free.fr Licence Stat-info CM3b : 15 5. Conclusion • P<5%, on rejette H0 http://christophe.genolini.free.fr Licence Stat-info CM3b : 16 Autre formulation de la solution Z GEX sEX G EX G X Z s EX sX N Z 1110 2,5 2 25 Z 1110 2,5 0,4 http://christophe.genolini.free.fr Licence Stat-info CM3b : 17 s et σ http://christophe.genolini.free.fr Licence Stat-info CM3b : 18 Quand on ne connaît pas • Dans l’exemple précédent, on a comparé la moyenne d’un groupe G à la moyenne de la population X. Coup de chance, on connaissait l’écart type de la population. • Problème : Si on ne connaît pas X, comment faire ? • Solution : On fait une approximation, on remplace X par sG http://christophe.genolini.free.fr Licence Stat-info CM3b : 19 Exemple des salaires • Un groupe de 10 femmes comparent leur salaire à celui des employés : • Salaire moyen des employés : – moyenne=28 k$, – Écart type=? • Salaire des 10 femmes : 24, 27, 31, 21, 19, 26, 30, 22, 15, 36 – Moyenne = 25,1 k$ – Écart type = 5,9 • Solution théorique : http://christophe.genolini.free.fr Z 28 25,1 s SalaireGénéral / 10 Licence Stat-info CM3b : 20 Solution réelle • On approxime l’écart type des salaires moyens des hommes par l’écart type des salaires moyens des femmes Z 28 25,1 s SalaireGénéral / 10 est remplacé par Z http://christophe.genolini.free.fr 28 25,1 s Salairefemmes/ 10 28 25,1 5,9/ 10 Licence Stat-info CM3b : 21 T de student http://christophe.genolini.free.fr Licence Stat-info CM3b : 22 Approximation : sG n’est pas X • Si N est grand (N>30) : pas de problème, sG est presque égal à X • Si N est petit (N<30 ) : sG est une sous estimation de X – Donc le Z obtenue serait trop grand (par rapport à celui qu’on obtiendrait si on connaissait X ) Dans ce cas, on remplace Z par le T de Student GX T sG N http://christophe.genolini.free.fr Licence Stat-info CM3b : 23 T de Student • La table du T change selon la taille de l’échantillon • Un échantillon de taille N a un degré de liberté (ddl) de N-1. • On trouve la probabilité du T de Student grâce – A Excel : Loi.Student – A la table papier http://christophe.genolini.free.fr Licence Stat-info CM3b : 24 Table du T T 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 1 50,00% 46,83% 43,72% 40,72% 37,89% 35,24% 32,80% 30,56% 28,52% 26,67% 25,00% 23,49% 22,11% 20,87% 19,74% 18,72% 17,78% 16,93% 16,14% 15,42% 14,76% 14,15% 13,58% 13,05% 12,57% 12,11% 11,69% 11,29% 10,92% 10,57% 10,24% 2 50,00% 46,47% 43,00% 39,62% 36,39% 33,33% 30,47% 27,82% 25,38% 23,16% 21,13% 19,30% 17,65% 16,16% 14,82% 13,62% 12,54% 11,56% 10,68% 9,89% 9,18% 8,53% 7,94% 7,41% 6,92% 6,48% 6,08% 5,71% 5,37% 5,06% 4,77% http://christophe.genolini.free.fr 3 50,00% 46,33% 42,71% 39,19% 35,80% 32,57% 29,54% 26,72% 24,11% 21,72% 19,55% 17,58% 15,81% 14,22% 12,80% 11,53% 10,40% 9,38% 8,48% 7,68% 6,97% 6,33% 5,76% 5,25% 4,79% 4,39% 4,02% 3,69% 3,39% 3,13% 2,88% 4 50,00% 46,26% 42,56% 38,96% 35,48% 32,17% 29,04% 26,13% 23,43% 20,95% 18,70% 16,65% 14,82% 13,17% 11,71% 10,40% 9,24% 8,22% 7,31% 6,51% 5,81% 5,18% 4,63% 4,15% 3,72% 3,34% 3,00% 2,70% 2,44% 2,21% 2,00% 5 50,00% 46,21% 42,47% 38,81% 35,28% 31,91% 28,73% 25,76% 23,00% 20,47% 18,16% 16,07% 14,19% 12,52% 11,02% 9,70% 8,52% 7,49% 6,59% 5,79% 5,10% 4,49% 3,95% 3,49% 3,08% 2,72% 2,41% 2,14% 1,90% 1,69% 1,50% 6 50,00% 46,18% 42,40% 38,71% 35,15% 31,74% 28,52% 25,51% 22,71% 20,14% 17,80% 15,67% 13,77% 12,07% 10,55% 9,21% 8,04% 7,00% 6,10% 5,31% 4,62% 4,02% 3,51% 3,06% 2,66% 2,33% 2,03% 1,78% 1,56% 1,37% 1,20% Licence Stat-info 7 50,00% 46,16% 42,36% 38,64% 35,05% 31,62% 28,37% 25,33% 22,50% 19,90% 17,53% 15,39% 13,46% 11,74% 10,21% 8,86% 7,68% 6,65% 5,74% 4,96% 4,28% 3,69% 3,19% 2,75% 2,37% 2,05% 1,77% 1,53% 1,33% 1,15% 1,00% 8 50,00% 46,14% 42,32% 38,59% 34,98% 31,53% 28,26% 25,19% 22,34% 19,72% 17,33% 15,17% 13,22% 11,49% 9,95% 8,60% 7,41% 6,38% 5,48% 4,70% 4,03% 3,45% 2,95% 2,52% 2,16% 1,85% 1,58% 1,35% 1,16% 0,99% 0,85% 9 50,00% 46,13% 42,30% 38,55% 34,92% 31,45% 28,17% 25,08% 22,22% 19,58% 17,17% 14,99% 13,04% 11,30% 9,75% 8,39% 7,20% 6,17% 5,27% 4,49% 3,83% 3,26% 2,77% 2,35% 1,99% 1,69% 1,44% 1,22% 1,04% 0,88% 0,75% 10 50,00% 46,12% 42,27% 38,52% 34,88% 31,39% 28,09% 24,99% 22,12% 19,46% 17,04% 14,86% 12,89% 11,14% 9,59% 8,23% 7,03% 6,00% 5,10% 4,33% 3,67% 3,10% 2,62% 2,21% 1,87% 1,57% 1,32% 1,12% 0,94% 0,79% 0,67% CM3b : 25 Exemple des salaires • On calcule T : T GX sG N 25,1 28 5,1 10 1,79 • DDL 9 P=5,27% On ne peut pas rejeter H0 http://christophe.genolini.free.fr Licence Stat-info CM3b : 26 ATTENTION : DDL Pour le 2 Pour le T de Student • DDL = (colonnes-1)x(lignes-1) http://christophe.genolini.free.fr • DDL = effectifs - 1 Licence Stat-info CM3b : 27 Récapitulatif • On connaît sX • On ne connaît pas X • N est grand (N>30) • On ne connaît pas X • N est petit (N<30) http://christophe.genolini.free.fr Z GX sX N Z GX sG N T GX sG N Licence Stat-info On conclut grâce à la table de la loi normale On conclut grâce à la table de la loi normale On conclut grâce à la table du T de Student CM3b : 28