CM3a-2005 - Christophe Genolini

publicité
Loi normale
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 1
Loi
• Une loi est une distribution continue
18
16
14
12
10
8
6
4
2
0
1
http://christophe.genolini.free.fr
Licence Stat-info
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17
CM3a : 2
Exemples
30
18,00%
18,0%
16,0%
16,00%
25
14,0%
14,00%
12,0%
20
12,00%
10,0%
15
10
8,0%
10,00%
6,0%
8,00%
4,0%
6,00%
2,0%
4,00%
5
s
s
s
s
s
s
s
s
s
54 an
59 an
64 an
69 an
74 an
79 an
84 an
89 an
lu s
s
49 an
s et p
90 an
s
44 an
85 à
s
39 an
80 à
s
34 an
75 à
s
29 an
70 à
s
24 an
65 à
s
19 an
ans
14 an
5à9
ans
Note finale de DEUG
des étudiants de licence
60 à
10 11 12 13 14 15 16 17 18 19 20
55 à
9
50 à
8
45 à
7
40 à
6
35 à
5
30 à
4
25 à
3
20 à
2
15 à
1
10 à
0
1à4
0
Moins
de 1
a ns
0,0%
2,00%
0,00%
0
Décès au Canada
1
2
3
4
5
6
7
8
Les impôts
14,00%
12,00%
10,00%
8,00%
6,00%
4,00%
2,00%
0,00%
3
Taille des Français
http://christophe.genolini.free.fr
4
5
6
7
8
9
10
11
12
13
14
15
Somme de 3 dés
Licence Stat-info
16
17
18
Problèmes
comportementaux
chez les collégiens
CM3a : 3
9
Distributions normales
14,00%
12,00%
10,00%
8,00%
6,00%
4,00%
2,00%
0,00%
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Notes des étudiants
Taille des Français
Problèmes comportementaux
chez les collégiens
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 4
Loi normale
• La loi normale est une loi particulière
–
–
–
–
Forme de cloche
Symétrique
Point d’inflexion
Infinie
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 5
Exemples de lois normales
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 6
Loi normale associée à une distribution
• Sur une distribution, on calcule
la moyenne et l’écart type
– Moyenne = 10
– Écart type = 1
• La loi normale associée à la même
moyenne et le même écart type
– Moyenne = 10
– Écart type = 1
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 7
Loi normale
• Moyenne : valeur centrale
• Écart type : distance aux points d’inflexion
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 8
Exemples de lois normales
• Moyenne : 0
• Écart type : 3
• Moyenne : 4
• Écart type : 1
• Moyenne : -1
• Écart type : 0,5
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 9
En pratique
Données
3
2
9
6
…
2
3
4
5
6
7
8
9
10
Effectif
1
2
4
8
9
8
4
2
1
Moyenne
Ecart type
http://christophe.genolini.free.fr
6
1,725
Licence Stat-info
CM3a : 10
Exemple des dés
• Moyenne 7,10
• Écart type 1,97
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 11
Intérêt
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 12
36 valeurs suivent une loi normale.
• Alors, si on fait un tirage au
hasard :
– Probablement proche de la
moyenne
– Faible chance d’être loin
10
9
8
7
6
5
4
3
2
1
0
1
2
3
4
5
6
7
8
9
• « Faible » ? « Proche » ? « Probablement » ?
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 13
Intérêt
• Un individu pris au hasard a :
– 16% de chances d’être dans le gris :
– 2,5% de chances
– 0,15% de chances
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 14
Autre côté
• Un individu pris au hasard a :
– 16% de chances d’être dans le gris :
– 2,5% de chances
– 0,15% de chances
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 15
Loi normale centrée réduite
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 16
Définition
• La loi normale de moyenne 0 ét écart type 1 est
appelé la loi normale centrée réduite
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 17
Utilisation
Sur une loi normale centrée réduite, un individu pris au hasard a :
– 16% de chances d’être dans [1, +∞]
– 2,5% de chances d’être dans [-∞ ; -2]
– 0,15% de chances d’être dans [3 ; +∞]
0
http://christophe.genolini.free.fr
1
Licence Stat-info
CM3a : 18
Loi normale centrée réduite
• La table donne les chances P
d’être dans [Z ; + ∞]
• Exemple
– [0,3 ; +∞], P=38,21%
– [- ∞ ; 1,5], P=6,68%
http://christophe.genolini.free.fr
Licence Stat-info
Z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
P
50,00%
46,02%
42,07%
38,21%
34,46%
30,85%
27,43%
24,20%
21,19%
18,41%
15,87%
13,57%
11,51%
9,68%
8,08%
6,68%
5,48%
4,46%
3,59%
2,87%
2,28%
1,79%
1,39%
1,07%
0,82%
0,62%
0,47%
0,35%
0,26%
0,19%
0,13%
Z
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9
5,0
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9
6,0
P
0,13%
0,10%
0,07%
0,05%
0,03%
0,02%
0,02%
0,01%
0,007%
0,005%
0,003%
0,002%
0,001%
0,0009%
0,0005%
0,0003%
0,0002%
0,0001%
0,00008%
0,00005%
0,00003%
0,00002%
0,00001%
0,00001%
0,000003%
0,000002%
0,000001%
0,000001%
0,0000003%
0,0000002%
0,0000001%
CM3a : 19
Exemple
• La température cet hiver : loi normale de moyenne 0
et d’écart type 1
– 2,5% des jours auront une température de 2 ou plus
– 5% des jours auront une température de -1,6 ou moins
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 20
Problème
• La taille des Françaises suit une loi normale de moyenne 162cm
et d’écart type 6cm. Comment faire ?
• On transforme la loi normale de la taille N(162;6) en loi
normale centrée réduite N(0;1) grâce à la formule :
Z
xX
s
• Puis on trouve P sur la table
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 21
Exemple
La taille des Françaises suit une loi normale de moyenne
162cm et d’écart type 6cm. Combien mesurent plus de
174cm ?
174  162
Z
2
6
• Z=2 P=2,5% (sur la table)
• 2,5% des Françaises mesurent 174m ou plus
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 22
Formellement
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 23
Problème
• Sylvie, 180cm, est grande.
Variabilité biologique ou trop de Mac Do ?
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 24
1. H0
• La taille de Sylvie est du à la variabilité biologique.
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 25
2. Collecte des données
• Taille de Sylvie : 183cm
• Population française
– loi normale
– moyenne X = 162cm
– écart type s = 6cm
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 26
3. Calcul du Z
• La formule du Z :
•
Z
183  162
6
http://christophe.genolini.free.fr
Z
xX
s
 3,5
Licence Stat-info
CM3a : 27
4. Probabilité
• Excel :
– La probabilité que la valeur observée soit grande
uniquement à cause de la variabilité biologique est
donnée par :
P=1 - Loi.normale.standard (Z)
• P=1 - Loi.normale.standard (3,5)=0,02%
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 28
5. Conclusion
• On rejette H0
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 29
Pour aller plus loin
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 30
Jouer avec les intervalles
• Quelle est la probabilité de mesurer moins de 174cm ?
• On calcule P pour plus de 174cm
Z
174  162
6
 2  P174  2,5%
P>174= 2,5%
• Puis 1-P donne la probabilité
de mesurer moins de 174cm
P<174=1-P>174 = 97,5%
P<174= 97,5%
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 31
Jouer avec les intervalles
• Quelle est la probabilité de mesurer moins de 174 et plus de 156 ?
P<156=16%
P>174=2,5%
P>174 et P<156 = 2,5%+16% = 18,5%
P[156 ; 174] = 1-18.5%=71,5%
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 32
Autre sens
• Nous avons fait :
– [x ; +∞]  Z  P
• Mais nous pouvons aussi faire :
– P  Z  [x ; +∞]
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 33
Exemple
• Quel intervalle contient 8% des plus grandes femmes ?
• P= 8 %  Z = 1,4
• Z=1,4  Intervalle [162 + 1,4 x 6 ; +∞] = [170 ; +∞]
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 34
Généralisation
• x suit une loi normale de moyenne X d’écart type s,
alors x a P% de chance d’être dans [X+Z.s ; +∞]
• x suit une loi normale de moyenne 162 d’écart type 6
alors X a 8% de chances d’être dans [170 ; +∞]
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 35
Intervalle de confiance
• Définition : intervalle qui contient 95% des valeurs centrales
• 95 % centre  2,5% en moins en haut et en bas
• P= 2,5 %  Z = 1,96
• Z=1,96  Intervalle [162 - 1,96 x 6 ; 162 + 1,96 x 6]
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 36
Généralisation
• x suit une loi normale de moyenne X d’écart type s,
L’intervalle de confiance de x a 95% est [X-1,96.s ; X+1,96.s]
ou encore
x a 95% de chances d’être dans [X-1,96.s ; X+1,96.s]
• x suit une loi normale de moyenne 162 d’écart type 6
alors x a 95% de chances d’être dans [150,2 ; 173,8]
http://christophe.genolini.free.fr
Licence Stat-info
CM3a : 37
Téléchargement