Lois normales, intervalle de fluctuation, estimation

publicité
Séquence 9
Lois normales, intervalle
de fluctuation, estimation
Sommaire
1. Prérequis
2. Lois normales
3. Intervalles de fluctuation
4. Estimation
5. Synthèse de la séquence
Séquence 9 – MA02
1
© Cned - Académie en ligne
Dans le chapitre 2, après le rappel et l’approfondissement des résultats connus sur les lois binomiales,
le théorème de Moivre-Laplace est énoncé. On introduit alors la loi normale réduite centrée, loi à densité sur , et les autres lois normales.
X
Dans le chapitre 3, on étudie des intervalles de fluctuation des variables aléatoires Fn = n ,
n
fréquences des variables aléatoires binomiales X n de paramètres n et p. On étudie quelques exemples
de prise de décision.
Dans le chapitre 4, on aborde l’estimation d’une proportion inconnue à partir de celle d’un échantillon.
Cette séquence pourra vous paraître difficile au premier abord.
Le monde des probabilités et des statistiques est différent des autres par son sujet et ses méthodes.
Il faut vous y plonger et, au fur et à mesure, vous vous familiariserez avec ces notions.
Les premiers exercices vont montreront comment utiliser les résultats du cours et les calculs sont
souvent simples à réaliser.
2
© Cned - Académie en ligne
Séquence 9 – MA02
1 Prérequis
A
Fonctions
Les lois normales sont des lois à densité, on utilisera donc les résultats des
séquences précédentes sur les fonctions et le calcul intégral.
B
Probabilité
1. Espérance et écart-type d’une variable
aléatoire
On rappelle que, dans le cas fini, on a la propriété suivante.
Propriété
Soit X une variable aléatoire et deux nombres réels a et b.
On a alors : E(aX + b ) = aE( X ) + b et σ (aX + b ) = a σ ( X ).
Signalons que l’on dit aussi « moyenne » pour désigner l’espérance d’une
variable aléatoire.
2. Loi binomiale
Définition
Soit X la variable aléatoire définie par le nombre de succès obtenus quand
on répète n fois de façon indépendante une expérience ayant deux résultats
possibles, réussite de probabilité p et échec de probabilité 1− p. La loi de
probabilité de X est la loi binomiale de paramètres n et p, notée B(n ; p ).
Séquence 9 – MA02
3
© Cned - Académie en ligne
La loi binomiale
n
t On a P ( X = k ) =   p k (1− p )n − k pour tout entier k tel que 0 ≤ k ≤ n , le
k
n
nombre   est un coefficient binomial qui se lit « k parmi n » et qu’on
k
peut déterminer avec une calculatrice.
Propriétés
t On a E( X ) = np et σ ( X ) = np (1− p ).
Représentation graphique d’une loi binomiale
왘
Exemple
n=20 et p=0,7 P(X=k)
0,250
probabilité
0,200
0,150
0,100
0,050
0,000
0 1 2 3 4 5 6 7 8 9 1011121314151617181920
k
Utiliser une calculatrice ou un tableur.
Avec un tableur
Soit X une variable aléatoire suivant la loi binomiale de paramètres n et p.
t La syntaxe LOI.BINOMIALE(k ; n ; p ; FAUX) ou LOI.BINOMIALE(k ; n ; p ; 0)
renvoie la probabilité P ( X = k ).
t La syntaxe LOI.BINOMIALE(k ; n ; p ; VRAI) ou LOI.BINOMIALE(k ; n ; p ; 1)
renvoie la probabilité cumulée P ( X ≤ k ).
Avec une calculatrice TI (84, mais aussi 83 et 82
avec des modifications mineures)
Avec une calculatrice Casio
(graph 35+ ou plus)
Pour calculer P ( X = k ) lorsque X suit la loi
binomiale B(n ; p ), on utilise l’instruction
binomFdp( (que l’on obtient par l’instruction
DISTR (touches 2ND VARS) et la touche 0) que
l’on complète ainsi : binomFdp(n, p, k).
Pour calculer P ( X = k ) lorsque X suit la loi
binomiale B(n ; p ), on utilise le menu STAT,
on choisit DIST (touche F5) puis BINM (touche
F5), Bpd (touche F1) et Var (touche F2).
Ces calculatrices donnent aussi les probabilités
P ( X ≤ k ) par l’instruction binomFREPdp(.
On renseigne la boîte de dialogue : Data :
variable ; valeur désirée : k ; Numtrial : n ; probabilité : p.
Avec une calculatrice Casio graph 25+Pro, pour
calculer P ( X = k ), il faut taper la formule ou
avoir implémenté un programme.
4
© Cned - Académie en ligne
Séquence 9 – MA02
3. Loi à densité
Définition
On dit qu’une fonction f, définie sur un intervalle I de
probabilité sur I lorsque :
, est une densité de
t la fonction f est continue sur I ;
t la fonction f est à valeurs positives sur I ;
t l’aire sous la courbe de f est égale à 1 u.a.
Définition
Soit f une fonction, définie sur I, qui est une densité de probabilité sur I.
On dit que la variable aléatoire X suit la loi de densité f sur l’intervalle I
lorsque, pour tout événement J inclus dans I, la probabilité de l’événement
( X ∈ J) est la mesure, en unités d’aire, de l’aire du domaine :
{M ( x ; y ) ; x ∈ J et 0 ≤ y ≤ f ( x )}.
j
O
c
i
d
Propriété
d
t Pour tout intervalle J = [c ; d ] de I, on a : P (c ≤ X ≤ d ) = ∫ f ( x ) d x .
t Pour tout réel α de I, on a : P ( X = α ) = 0.
c
Séquence 9 – MA02
5
© Cned - Académie en ligne
Définition
Pour deux intervalles J et J’, inclus dans I, tels que J′∩ J = ∅, on a :
P ( X ∈ J ∪ J′) = P ( X ∈ J′) + P ( X ∈ J) .
Propriété
(
)
Soit J un intervalle, on a : P X ∈ J = 1− P ( X ∈ J) .
C
Échantillonnage
En statistiques, un échantillon de taille n est la liste des n résultats obtenus par
n répétitions indépendantes de la même expérience aléatoire. Ici l’expérience
répétée est une épreuve de Bernoulli, c’est-à-dire qu’elle ne prend que deux
valeurs : échec / réussite, oui / non, homme / femme, 0 / 1… Par exemple, un échantillon de taille 100 du lancer d’un dé dont on observe
l’apparition ou non de la face 6 est la liste des résultats obtenus en lançant 100
fois le dé. Pour chaque lancer la probabilité de réussir (d’obtenir la face 6) est p,
1
la probabilité de l’échec (ne pas obtenir 6) est 1− p ( p = si le dé est bien
6
équilibré).
Le nombre de réussites dans un échantillon de taille n suit la loi binomiale
B(n ; p ).
On appelle f la fréquence du nombre de réussites dans l’échantillon.
Définition
Un intervalle de fluctuation au seuil de 95 %, relatif aux échantillons de
taille n, est un intervalle où se situe la fréquence f observée dans un échantillon de taille n avec une probabilité supérieure à 0,95.
On a vu en Seconde que :
1
1 
est un intervalle de fluctuation approché au seuil
L’intervalle  p −
;p+
n
n 

de 95 %, relatif aux échantillons de taille n.
Commentaire
6
© Cned - Académie en ligne
Dans certains cas, la probabilité que la fréquence appartienne à l’intervalle
1
1 

 p − n ; p + n  est très proche de 0,95 mais en étant inférieure, c’est


pourquoi on dit que ce sont des intervalles de fluctuation « approchés ».
Séquence 9 – MA02
Cela a été admis après avoir observé des exemples obtenus, par exemple, par
simulation.
1
1 
pour des probabilités p
Dans la pratique, on utilise l’intervalle  p −
;p+
n
n 

comprises entre 0,2 et 0,8 et des échantillons de taille n supérieure à 25.
Séquence 9 – MA02
7
© Cned - Académie en ligne
2 Lois normales
A
Objectifs du chapitre
t On observe d’abord, dans une activité, des représentations graphiques de lois
binomiales, puis de lois binomiales centrées et réduites.
t Le théorème de Moivre-Laplace est énoncé. Ce théorème théorise les observations de l’activité 2 et montre l’utilité de la loi normale N (0 ; 1) de moyenne 0
et d’écart-type égal à 1.
t On étudie donc la loi normale N (0 ; 1) qui est la loi normale de référence.
t On termine par la définition des autres lois normales et des exemples d’utilisation.
B
Activité 1
Pour débuter
Centrer et réduire
Définition 1
On dit qu’une variable aléatoire est centrée et réduite lorsque son espérance
est nulle et son écart-type égal à 1.
Soit X une variable aléatoire prenant un nombre fini de valeurs, d’espérance
m = E( X ), de variance V( X ) et d’écart-type σ 0 = V( X ) non nul. Démontrer
que :
t la variable aléatoire ( X − m ) a une espérance nulle ;
X −m
est une variable aléatoire centrée et réduite.
t la variable aléatoire Z =
σ0
Activité 2
Approche de la loi normale centrée et réduite
On montre dans cette activité la démarche qui, en partant des lois binomiales,
amène à la loi normale centrée et réduite.
On fait cette approche en trois étapes.
8
© Cned - Académie en ligne
Séquence 9 – MA02
Observation des représentations graphiques des lois binomiales
On donne ci-dessous deux représentations graphiques des probabilités obtenues
par des lois binomiales B(n ; p ).
Il s’agit de diagrammes en bâtons, le logiciel OpenOffice dessinant les bâtons un
peu épais. Il ne faut pas confondre avec des histogrammes.
Loi binominale
n=50 p=0,7
0,140
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
probabilité P(X=K)
0,120
0,100
0,080
0,060
0,040
0,020
0
0
2
4
6
8
10
12
14
16
18
20
22
24
26
48
45
42
39
36
33
30
27
24
21
18
15
9
12
6
3
0
0
Valeurs de k
Valeurs de k
Les lois, donc les représentations graphiques, dépendent des valeurs des paramètres n et p, mais on observe, ici et aussi sur la représentation donnée dans les
prérequis, une grande ressemblance entre ces graphiques. Toutes les représentations graphiques des lois binomiales sont analogues.
Il semble que la probabilité maximum (le bâton de plus grande ordonnée) est
obtenue pour la valeur moyenne, pour l’espérance qui vaut np.
On associe à chacune de ces lois B(n ; p ) une autre loi, centrée et réduite.
On utilise pour cela le résultat de l’activité 1.
Ainsi, à la variable aléatoire X, on associe la variable aléatoire centrée et réduite
X − np
X −m
.
Z=
, soit Z =
np (1− p )
σ
4,01
4,63
3,39
2,78
2,16
1,54
0,93
0
–0,93
–1,54
–2,78
–2,16
–3,39
–4,63
–4,01
–5,86
–5,25
–7,1
–6,48
–7,72
–8,33
–8,95
–9,57
–10,8
Loi de Z
Z=(X–np)/rac(np(1–p)) n=50 p=0,7
0,15
–10,18
probabilité P(X=K)
Loi binominale
n=40 p=0,2
Valeurs de Z
Toutes les variables aléatoires Z centrées réduites définies à partir d’une loi binomiale ont des représentations graphiques qui ont la même allure. Elles sont seulement plus ou moins « étalées », le maximum est plus ou moins grand.
Séquence 9 – MA02
9
© Cned - Académie en ligne
Changement de représentation
Les sommets des bâtons semblent dessiner une courbe, qui est de plus en plus
« visible » quand n grandit.
Pour définir cette courbe, puis utiliser une probabilité à densité, on change de
représentation. On passe des diagrammes en bâtons où les probabilités sont
représentées par la hauteur des bâtons, à des rectangles où les probabilités sont
représentées par les aires des rectangles.
Les deux représentations sont illustrés ci-dessous sur un exemple où n n’est pas
très grand. loi de X : B(n,p)
n = 20 et p = 0,7
Z = (X–14)/ 4,2
loi de probabilité de Z : ordonnées des bâtons
0,2
O
1
Le rectangle correspondant au bâton en couleur est aussi en couleur sur la représentation suivante (analogue à un histogramme). L’axe des ordonnées permet de
repérer les densités, comme on l’a vu dans la séquence 8 (Lois à densité).
densité
loi de probabilité de Z : aires des rectangles
loi de X : B(n,p)
n = 20 et p = 0,7
Z = (X–14)/ 4,2
probabilité : 0,025
O
1
Chaque bâton est remplacé par un rectangle. La mesure de l’aire du rectangle
est égale à la probabilité. Comme toutes les bases des rectangles ont la même
longueur, les aires des rectangles sont proportionnelles aux hauteurs de ces rectangles et donc les hauteurs des rectangles sont proportionnelles aux hauteurs
10
© Cned - Académie en ligne
Séquence 9 – MA02
des bâtons. Les bords supérieurs des rectangles ont donc la même allure que les
extrémités supérieures des bâtons.
Les bords supérieurs des rectangles font apparaître une courbe régulière et symétrique.
Le mathématicien Abraham de Moivre, protestant français émigré en Angleterre
après la révocation de l’édit de Nantes, a montré en 1733, dans un cas particulier,
que cette courbe est la courbe représentative de la fonction définie sur par
f (t ) =
t2
−
1
e 2.
2π
Ce résultat a été généralisé par Pierre-Simon de Laplace (dans Théorie analytique
des probabilités (1812).
x2
Activité 3
1 −2
e
Étude de la fonction définie sur par f ( x ) =
2π
(complément de l’exercice 16 de la séquence 7 ).
Montrer que cette fonction est paire.
Étudier la limite de f en +∞ et en −∞.
Séquence 9 – MA02
11
© Cned - Académie en ligne
Étudier les variations de f et donner la représentation graphique de la fonction f.
Donner une valeur approchée de
10
∫−10f ( x ) dx .
Quelle conjecture peut-on
faire pour la mesure de l’aire (en unités d’aire) sous la courbe représentant f
tout entière ?
Justifier que f semble donc être une densité de probabilité.
C
Cours
1. Théorème de Moivre-Laplace
Le paramètre p est fixé, l’entier n varie, les variables aléatoires X n suivent les
lois binomiales B(n ; p ).
On utilise les variables aléatoires centrées et réduites correspondantes Z n .
t la largeur des rectangles est de plus en plus petite ;
t les aires des rectangles, c’est-à-dire les probabilités, deviennent de plus en
plus proches des aires correspondantes limitées par la courbe représentant la
fonction f et l’axe des abscisses : les probabilités P (a ≤ Z n ≤ b ) sont de plus
en plus proches de
b
∫a
x2
1
e 2 dx .
−
2π
n = 99
0,5
p = 0,34
0,4
0,3
0,2
0,1
0
–4
–3
–2
–1
0
1
2
3
4
Voici donc l’énoncé du théorème de Moivre-Laplace, qui théorise les observations
et qui est fondamental en statistiques.
Ce théorème est admis en Terminale S.
12
© Cned - Académie en ligne
Séquence 9 – MA02
Théorème 1 : Théorème de Moivre-Laplace
Soit p un nombre réel de l’intervalle ]0 ; 1[ .
Soit une suite de variables aléatoires ( X n ) où chaque variable aléatoire X n
suit la loi binomiale B(n ; p ).
X − np
, variable centrée et réduite associée à X n .
On pose Z n = n
np (1− p )
Alors, pour tous réels a et b tels que a < b , on a :
b
lim P (a ≤ Z n ≤ b ) =
a
n →+∞
∫
x2
1 −2
e
dx .
2π
La motivation commune à Bernoulli (qui a énoncé le premier la loi des grands
nombres), Moivre et Laplace était de déterminer le plus finement possible la
fluctuation des valeurs prises par une variable aléatoire suivant une loi binomiale
autour de son espérance. Il s’agissait ensuite d’utiliser ces résultats pour estimer
une probabilité inconnue.
Le théorème permet cela et nous verrons comment dans les chapitres suivants.
Mais auparavant, il convient d’étudier la loi qui apparaît dans le théorème de
Moivre-Laplace. On l’appelle la loi normale centrée réduite que l’on note
N (0 ; 1).
2. Loi normale centrée réduite N (0 ; 1)
a) Définition
Propriété 1
La fonction définie sur
bilité.
par f ( x ) =
x2
1
e 2 est une densité de proba−
2π
La fonction a été étudiée dans l’activité 3. C’est une fonction continue à valeurs
positives, on admet que l’aire sous la courbe est égale à 1u.a.
1/ 2/ 0,4
O
1
Cette courbe est souvent appelée « courbe de Gauss » ou « courbe en cloche ».
Séquence 9 – MA02
13
© Cned - Académie en ligne
Définition 2
Une variable aléatoire X suit la loi normale centrée réduite N (0 ; 1) si sa
x2
1 −2
e
.
fonction de densité est la fonction définie sur par f ( x ) =
2π
On a alors pour tous réels a et b tels que a < b ,
x2
b
b 1 −2
P (a ≤ X ≤ b ) = ∫ f ( x ) dx = ∫
e
dx . a
a 2π
Propriété 2
Soit X une variable aléatoire qui suit la loi normale N (0 ; 1), on a :
t pour tout réel u positif, P ( X ≤ −u ) = P ( X ≥ u ) ;
1
t P ( 0 ≤ X ) = P ( X ≥ 0 ) = .
2
Démonstration
t La fonction de densité de la loi normale N (0 ; 1) est paire, donc, par symétrie,
les mesures des aires égales aux probabilités P ( X ≤ −u ) et P ( X ≥ u ) sont
égales, P ( X ≤ −u ) = P ( X ≥ u ).
P(X
Ꮿf
–u)
O
–u
P(X
u)
u
t Pour u = 0, on a P ( X ≤ 0 ) = P ( X ≥ 0 ) et, comme
1 = P ( X ≥ 0 ) + P ( X < 0 ) = P ( X ≥ 0 ) + P ( X ≤ 0 ),
on obtient 1 = 2P ( X ≥ 0 ).
1
On en déduit P ( 0 ≤ X ) = P ( X ≥ 0 ) = .
2
Remarque
Calculs
La fonction de densité de la loi normale N (0 ; 1) n’a pas de primitive connue,
c’est-à-dire qu’il est impossible de l’exprimer algébriquement (somme, produit…)
à partir des fonctions usuelles (polynômes, exponentielle, logarithme…). Les
calculatrices et les tableurs permettent de calculer des valeurs approchées des
intégrales (voir le cours d’intégration), mais ils permettent aussi d’obtenir direc-
14
© Cned - Académie en ligne
Séquence 9 – MA02
tement des valeurs approchées de certaines probabilités liées à la loi normale.
Les calculs des probabilités de la forme P (a ≤ X ≤ b ), P ( X ≤ c ) et P ( X ≥ c ), a,
b et c étant des nombres réels donnés, seront expliqués dans la partie où sont
étudiées toutes les lois normales.
b) Espérance et écart-type de la loi normale
centrée et réduite
On généralise la définition de l’espérance d’une variable aléatoire à densité qui a
été vue pour les lois uniformes et les lois exponentielles. Ici la variable aléatoire
est définie sur .
Remarque
On emploie souvent le mot « moyenne » pour désigner l’espérance.
Définition 3
Si la variable aléatoire X suit la loi normale N (0 ; 1), l’espérance
E( X ) de la variable aléatoire X est définie par :
x
0
lim ∫ t f (t )dt
∫ t f (t )dt + x →+∞
0
y →−∞ y
E( X ) = lim
où f est la fonction de densité de la loi normale N (0 ; 1).
Propriété 3
L’espérance (ou la moyenne) de la loi normale N (0 ; 1) est égale à 0.
Démonstration
Soit x un nombre réel positif, on a :
x
t
2π
x
∫ 0 t f (t )dt = ∫ 0
=
1
2π
∫
t2
−
e 2 dt
t2
x −2
t e dt =
0
On étudie d’abord la limite
2
x
 t 2 x

x2 
1  −2
1  −2 
+ 1.
−e
−e  =
2π 
2π 



0


∫ t f (t )dt
x →+∞ 0
lim
par composition.
x
x2
La fonction x e 2 est la composée de x −
et de X e X , or
2
x2
lim −
= −∞ et lim e X = 0, on peut donc écrire
x →+∞ 2
X →−∞
−
x2
x2
lim e 2 = lim e X = 0 par composition avec X = − .
2
x →+∞
X →−∞
−
Séquence 9 – MA02
15
© Cned - Académie en ligne
Donc
1
.
2π
x
∫ t f (t )dt =
x →+∞ 0
lim
De même, on trouve
∫
0
t f (t )dt =
y
On conclut finalement : E( X ) = 0.
 y2 
0
1

1  −2
.
− 1 et lim ∫ y t f (t )dt = −
e
y →−∞
2
π
2π 



Propriété 4
La variance V( X ) de la loi normale N (0 ; 1), définie par
(
)
V( X ) = E ( X − E( X )2 , est égale à 1.
Cette propriété est admise.
On en déduit que l’écart-type de la loi normale N (0 ; 1) est aussi égal à 1.
c) Répartition des valeurs de X
Dans le théorème qui suit apparaît un nombre nommé α. Le choix de α dans
]0 ; 1[ correspond au choix d’une probabilité. Dans la pratique il est intéressant
de choisir α proche de 0 (0,05 ou 0,01 ou…). Le nombre 1− α est lui aussi dans
]0 ; 1[ , il est alors proche de 1 (0,95 ou 0,99 ou…).
On cherche un intervalle [ −u ; u ] tel que la probabilité que X soit en dehors
de cet intervalle [ −u ; u ] soit égale à α (0,05 ou 0,01 ou…) et donc que la
probabilité que X appartienne à [ −u ; u ] soit égale à 1− α (0,95 ou 0,99 ou…).
Le choix de α aura pour conséquence que la probabilité que X appartienne à
[ −u ; u ] sera proche de 1 (voire très proche) et la probabilité que X n’appartienne pas à [ −u ; u ] sera faible (voire très faible).
P(–u
P(X
X
u) = 1 – _
Ꮿf
–u)
–u
P(X
O
u)
u
Théorème 2
Lorsque la variable aléatoire X suit la loi normale N (0 ; 1), pour tout nombre
α de l’intervalle ]0 ; 1[ , il existe un unique nombre réel positif u α tel que
P (−u α ≤ X ≤ u α ) = 1− α.
16
© Cned - Académie en ligne
Séquence 9 – MA02
Démonstration
D’après la symétrie de la courbe de la densité de la loi normale, pour tout réel u
positif on a :
u
P ( −u ≤ X ≤ u ) = 2P ( 0 ≤ X ≤ u ) = 2∫ f ( x ) d x = 2H (u ),
0
où H est la primitive de la fonction f sur
qui s’annule en 0.
La fonction H est donc continue et strictement croissante sur
On a 2H (0 ) = 0 et
.
1
lim 2H (u ) = lim 2P ( 0 ≤ X ≤ u ) = 2P ( 0 ≤ X ) = 2 × = 1.
2
u →+∞
u →+∞
On obtient le tableau de variation de la fonction 2H :
u
0
+∞
uα
1
1− α
2H (u )
0
Pour tout nombre α de l’intervalle ]0 ; 1[ , le nombre 1− α appartient aussi à
]0 ; 1[ et donc, d’après le corollaire du théorème des valeurs intermédiaires, il
existe un unique réel uα tel que 2H (uα ) = 1− α c’est-à-dire tel que
P ( −uα ≤ X ≤ uα ) = 1− α .
À savoir
Valeurs particulières
t On a u 0,05 ≈ 1, 96 d’où : P ( −1, 96 ≤ X ≤ 1, 96 ) ≈ 0, 95.
t On a u 0,01 ≈ 2, 58 et P ( −2, 58 ≤ X ≤ 2, 58 ) ≈ 0, 99.
Comme les valeurs de u 0,05 et u 0,01 ne sont pas des valeurs exactes, il en est
de même pour les probabilités. On obtient une bonne idée de la répartition des
valeurs de X. Environ 95% des réalisations de X se trouvent entre −1, 96 et 1,96
et 99% des réalisations de X se trouvent entre −2, 58 et 2, 58.
Remarque
On appelle « réalisation d’une variable aléatoire X » la valeur observée quand on
réalise concrètement l’expérience aléatoire.
3. Loi normale N (µ ; σ 2)
a) Définition, espérance, écart-type
Définition 4
Une variable aléatoire X suit une loi normale N (µ ; σ 2 ) si la variable
X −µ
aléatoire Z =
suit la loi normale N (0 ; 1).
σ
Séquence 9 – MA02
17
© Cned - Académie en ligne
Voici un premier exemple de modélisation d’un phénomène concret par une loi
normale.
왘
Exemple
Le poids en kilos des nouveau-nés à la naissance est une variable aléatoire qui
peut être modélisée par une variable aléatoire suivant la loi normale de moyenne
µ = 3, 3 et d’écart-type σ = 0, 5. La probabilité qu’un nouveau-né pèse moins
de 2,5 kg à la naissance est donc : P ( X < 2, 5). Avec une calculatrice (l’explication est donnée un petit peu plus loin), on trouve P ( X < 2, 5) ≈ 0, 054 à 10−3
près par défaut.
Ainsi, le risque qu’un nouveau-né soit d’un poids inférieur à 2,5 kg est un peu
supérieur à 5 %.
왘
Exemples
On a représenté ci-dessous les courbes des fonctions de densité de cinq lois normales.
ᏺ (3;0,25)
ᏺ (1;1)
ᏺ (0;1)
ᏺ (1;4)
ᏺ (0;4)
O
1
On observe que chaque courbe est symétrique par rapport à la droite d’équation
x = µ.
Propriété 5
On admet que, si une variable aléatoire X suit la loi normale N (µ ; σ 2 ),
alors son espérance est égale à µ et son écart-type à σ : E( X ) = µ et
σ (X ) = σ.
b) Utilisation des calculatrices
À savoir
18
© Cned - Académie en ligne
La variable aléatoire X suivant la loi normale N (µ ; σ 2 ), il faut savoir calculer
des probabilités de la forme : P (a ≤ X ≤ b ), P ( X ≤ c ) et P ( X ≥ c ), a, b et c étant
des nombres réels donnés.
Séquence 9 – MA02
Il faut aussi savoir déterminer le nombre x tel que P ( X ≤ x ) = p , p étant une
probabilité donnée.
On donne d’abord les explications pour toutes les calculatrices TI et les calculatrices Casio pour les modèles Graph 35 et plus. On donne ensuite les explications
pour la calculatrice Casio 25+Pro.
t P (a ≤ X ≤ b )
Sauf la calculatrice Casio 25+Pro, les calculatrices étudiées ici font le calcul directement.
Par exemple P ( −1 ≤ X ≤ 1, 5) ≈ 0, 203877 où X suit la loi N (3 ; 4).
Texas
Casio Graph 35…
On choisit Distr (par 2nd Var)
puis normalcdf (ou, en français,
normalFRep).
Dans le menu Stat, on choisit Distr, puis NormCD. On indique
les données dans l’ordre a, b, σ et µ (attention à ne pas
confondre σ et σ 2 ).
On indique les données dans
l’ordre a, b, µ et σ (attention à
ne pas confondre σ et σ 2 ).
Voici un exemple avec a = −1 b = 1, 5 µ = 3 et σ = 2 :
Voici un exemple avec a = −1
b = 1, 5 µ = 3 et σ = 2 :
t P ( X ≤ c )
Les calculatrices étudiées ne font pas le calcul directement. On dispose de deux
méthodes.
On utilise l’approximation P ( X ≤ c ) ≈ P ( −1099 ≤ X ≤ c ) où on néglige
P ( X < −1099 ).
{
Ou bien on utilise des égalités, mais elles dépendent de la position de c par
rapport à µ. Les égalités sont obtenues en écrivant la probabilité d’une
réunion d’événements incompatibles. On mémorise visuellement ces égalités qui s’interprètent avec des aires.
{
P(X
Ꮿf
+)
+
Si c ≥ µ :
P(+
X
c)
c
1
P ( X ≤ c ) = P ( X < µ ) + P (µ ≤ X ≤ c ) = + P (µ ≤ X ≤ c )
2
Séquence 9 – MA02
19
© Cned - Académie en ligne
P(c
P(X
X
+)
Ꮿf
c)
c
Si c ≤ µ :
Remarque
왘
Exemple
+
1
P ( X ≤ c ) = P ( X ≤ µ ) − P (c < X ≤ µ ) = − P (c ≤ X ≤ µ ).
2
On a P ( X ≥ c ) = 1− P ( X < c ) (événements contraires) et aussi
P ( X ≥ c ) = P ( X ≤ −c ) à cause de la symétrie de la courbe de la fonction de
densité.
On a : P ( X ≤ 8 ) ≈ 0, 9937903 où X suit la loi N (3 ; 4).
t Déterminer x tel que P ( X ≤ x ) = p , p étant une probabilité donnée.
La plupart des calculatrices permettent de trouver directement le résultat.
Texas
Casio graph 35 et plus
On choisit Distr (par 2nd Distr) puis
invNorm (ou, en français, FracNorm), puis
on donne p, µ et σ .
Dans le menu Stat, on choisit Distr, puis Inverse Normal. On indique les données dans l’ordre p, σ et µ .
Voici un exemple avec p = 0,1 µ = 3 et σ = 2 :
Voici un exemple avec p = 0,1 µ = 3 et
σ = 2 :
Cas particulier de la calculatrice Casio 25+Pro
Cette calculatrice donne seulement les probabilités de la forme P (Z ≤ c ) où Z
suit la loi normale centrée réduite N (0 ; 1).
t Pour accéder à cette fonctionnalité, on utilise :
OPTN PROB
Z
Ainsi OPTN PROB
P( Z
P(2) donne P (Z ≤ 2) ≈ 0, 97725.
t Pour calculer P ( X ≤ c ) où X suit la loi normale N (µ ; σ 2 ), on se ramène à
X −µ
la loi N (0 ; 1) en utilisant Z =
.
σ
La probabilité P ( X ≤ 8 ) où X suit la loi N (3 ; 4) s’obtient par OPTN PROB Z
P((8 − 3) / 2) et on trouve P ( X ≤ 8 ) ≈ 0, 9937903.
t On a P (a ≤ X ≤ b ) = P ( X ≤ b ) − P ( X ≤ a ) car
P ( X < a ) + P (a ≤ X ≤ b ) = P ( X ≤ b ) (probabilité de l’union de deux événements incompatibles ou aire de l’union de deux ensembles disjoints).
20
© Cned - Académie en ligne
Séquence 9 – MA02
t Pour déterminer x tel que P ( X ≤ x ) = p , p étant une probabilité donnée, la
seule possibilité est de commencer par tâtonner. On cherche d’abord z tel que
P (Z ≤ z ) = p , Z suivant la loi normale N (0 ; 1) puis utiliser l’équivalence
X −µ
Z ≤z ⇔
≤ z ⇔ X ≤ σ z + µ.
σ
On en déduit x = σ z + µ.
Par exemple, pour déterminer x tel que P ( X ≤ x ) = 0,1 où X suit la loi
N (3 ; 4), on trouve d’abord en tâtonnant z ≈ −1, 281,
puis
x ≈ 2 × ( −1, 281) + 3 d’où x ≈ 0, 438.
왘
Exemple 1
Pour s’entraîner
La variable aléatoire suit la loi normale N (21 ; 9). Calculer :
a) P (8 ≤ X ≤ 18 )
왘
Solution
b) P ( X ≥ 23)
a) P (8 ≤ X ≤ 18 ) ≈ 0,159
c) x tel que P ( X ≤ x ) = 0, 7.
b) P ( X ≥ 23) ≈ 0, 252
c) x ≈ 22, 573.
c) Intervalles « un, deux, trois sigmas »
On a représenté ci-dessous les fonctions de densité de trois lois normales
N (µ ; σ 2 ) de même espérance µ et d’écarts-types différents : σ = 2, σ = 1
et σ = 0, 5.
ᏺ(+;0,25)
ᏺ(+;1)
ᏺ(+;4)
O
+
On sait que l’écart-type σ mesure la dispersion des valeurs prises par la variable
aléatoire autour de son espérance µ. L’influence de l’écart-type sur la courbe est
très visible : plus il est important, plus la courbe est « étalée ».
Les résultats suivants doivent être connus, ils donnent une idée de la répartition,
autour de son espérance µ, d’une variable aléatoire X qui suit une loi normale
N (µ ; σ 2 ).
Séquence 9 – MA02
21
© Cned - Académie en ligne
Propriété 6
On a :
P (µ − σ ≤ X ≤ µ + σ ) ≈ 0,68 (à 10−2 près) ;
P (µ − 2σ ≤ X ≤ µ + 2σ ) ≈ 0,95 (à 10−2 près) ;
P (µ − 3σ ≤ X ≤ µ + 3σ ) ≈ 0,997 (à 10−3 près).
0,68
µ
µ–␴
µ+␴
0,95
µ
µ–2␴
µ+2␴
0,997
µ
µ–3␴
22
© Cned - Académie en ligne
Séquence 9 – MA02
µ+3␴
Démonstration
X −µ
≤ 1.
On a µ − σ ≤ X ≤ µ + σ ⇔ −σ ≤ X − µ ≤ σ ⇔ −1 ≤
σ
X −µ 

≤ 1 = P ( −1 ≤ Z ≤ 1) et, comme la
Donc P (µ − σ ≤ X ≤ µ + σ ) = P  −1 ≤


σ
X
−
µ
suit la loi normale N (0 ; 1), la calculatrice permet
variable aléatoire Z =
σ
de faire le calcul et on trouve environ 0,68.
De même :
X −µ 

P (µ − 2σ ≤ X ≤ µ + 2σ ) = P  −2 ≤
≤ 2 = P ( −2 ≤ Z ≤ 2) ≈ 0, 95 et


σ
X −µ 

P (µ − 3σ ≤ X ≤ µ + 3σ ) = P  −3 ≤
≤ 3 = P ( −3 ≤ Z ≤ 3) ≈ 0, 997.


σ
Ainsi, environ 68 % des réalisations d’une variable aléatoire suivant la loi normale N (µ ; σ 2 ) se trouvent dans l’intervalle [ µ − σ ; µ + σ ] , environ 95 % se
trouvent dans l’intervalle [ µ − 2σ ; µ + 2σ ] et environ 99,7 % dans l’intervalle
[µ − 3σ ; µ + 3σ ].
D
Exercices d’apprentissage
Plusieurs exercices de cette séquence sont issus de documents ressources de
l’Éducation nationale.
Dans les exercices 1 et 2, on donnera des valeurs approchées à 10−4 près par
défaut.
Exercice 1
Soit X une variable aléatoire suivant la loi normale centrée réduite.
Calculer :
a) P ( −0, 5 ≤ X ≤ 1, 3) ;
b) P ( X ≤ −1) ;
c) P ( X ≥ 1, 8 ).
Déterminer le réel x tel que P ( X ≤ x ) = 0, 8.
Exercice 2
Soit X une variable aléatoire suivant la loi normale N (12 ; 9).
Calculer :
a) P (10 ≤ X ≤ 14 ) ;
b) P ( X ≤ 13) ;
c) P ( X ≥ 7).
Déterminer le réel x tel que P ( X ≤ x ) = 0, 9.
Exercice 3
On donne ci-dessous les représentations graphiques des fonctions densité
de probabilité des lois normales N (7 ; 1), N (7 ; 22 ), N (5 ; 1) et N (5 ; 0,52 ).
Associer chaque courbe à la loi correspondante.
Proposer une valeur pour la moyenne µ et pour l’écart-type σ de la loi
normale N (µ ; σ 2 ) dont la fonction densité de probabilité est représentée
par la courbe C .
Séquence 9 – MA02
23
© Cned - Académie en ligne
1
2
Ꮿ
1
3
O
Exercice 4
1
4
Soit X une variable aléatoire suivant la loi normale N (µ ; σ 2 ).
Si µ = 15 et P ( X < 12) = 0, 4 , combien vaut σ ?
Si σ = 0, 5 et P ( X < 7) = 0, 3, combien vaut µ ?
Exercice 5
Une entreprise produit en grande quantité des pièces cylindriques. Soit X la
variable aléatoire qui, à chaque pièce prélevée au hasard dans la production,
associe son diamètre, en millimètres. On admet que la variable aléatoire X suit la
loi normale de moyenne 61,5 mm et d’écart-type 0,4 mm.
Déterminer, dans ces conditions, la probabilité qu’une pièce, tirée au hasard,
ait un diamètre compris entre 60,7 mm et 62,3 mm.
Une pièce est déclarée défectueuse si son diamètre est soit inférieur à
60,7 mm, soit supérieur à 62, 3 mm. Calculer la probabilité qu’une pièce tirée
au hasard soit défectueuse.
Sachant qu’une pièce n’est pas défectueuse, quelle est la probabilité que son
diamètre soit inférieur à 61 mm ?
Exercice 6
La production laitière annuelle en litres des vaches laitières de la race « Française
Frisonne Pie Noir » peut être modélisée par une variable aléatoire suivant la loi
normale de moyenne µ = 6000 et d’écart-type σ = 400.
Calculer la probabilité qu’une vache de cette race produise entre 5 800 et
6 200 litres par an.
Calculer la probabilité qu’une vache de cette race produise moins de
5 700 litres par an.
Calculer la probabilité qu’une vache de cette race produise plus de 6 300 litres
par an.
Donner une interprétation concrète du nombre x tel que P ( X < x ) = 0, 30.
Déterminer x.
Calculer la production minimale prévisible des 20 % de vaches les plus pro-
ductives du troupeau.
24
© Cned - Académie en ligne
Séquence 9 – MA02
Exercice 7
Une confiserie produit des plaques de chocolat. On admet que la variable aléatoire égale au poids d’une plaquette de 125 g suit une loi normale d’espérance
µ = 125 et d’écart-type σ = 0, 5.
La plaquette est jugée conforme lorsque son poids est compris entre µ − 3σ et
µ + 3σ .
Calculer la probabilité qu’une plaquette prélevée aléatoirement au hasard en
fin de chaîne soit non conforme.
Pour contrôler le réglage de la machine, on détermine des poids d’alerte µ − h
et µ + h tels que
P (µ − h ≤ X ≤ µ + h ) = 0, 99.
Ces poids d’alerte sont inscrits sur une carte de contrôle et correspondent à une
marge de sécurité en lien avec des normes de conformité. Calculer ces poids
d’alerte.
Séquence 9 – MA02
25
© Cned - Académie en ligne
3
A
Intervalles
de fluctuation
Objectifs du chapitre
Quand on réalise une expérience aléatoire, on observe bien sûr que les résultats
obtenus ne sont pas toujours les mêmes, c’est la fluctuation d’échantillonnage.
Mais on observe aussi que, quand on répète une expérience un grand nombre de
fois, il y a une régularité des résultats.
Le théorème de Moivre-Laplace permet de mathématiser ces observations.
On définit des intervalles de fluctuation.
On pourra alors décider si on considère que des résultats obtenus lors d’une
expérience sont dus au hasard (c’est-à-dire à la fluctuation d’échantillonnage),
ou si on considère qu’ils sont statistiquement significatifs d’une différence avec
le modèle choisi.
B
Activité 4
Pour débuter
Rappel
En statistiques, un échantillon de taille n est la liste des n résultats obtenus par
n répétitions indépendantes de la même expérience aléatoire. Ici l’expérience
répétée est une épreuve de Bernoulli, c’est-à-dire qu’elle ne prend que deux
valeurs : échec / réussite, oui / non, homme / femme, 0 / 1… Par exemple, un échantillon de taille 100 du lancer d’une pièce où on compte le
nombre de fois où on obtient « pile » est la liste des résultats obtenus en lançant
effectivement 100 fois la pièce.
Le nombre de réussites dans un échantillon de taille n suit la loi binomiale
B(n ; p ).
Définition 5
Un intervalle de fluctuation au seuil de 95 %, relatif aux échantillons de
taille n, est un intervalle où se situe la fréquence d’un échantillon de taille n
avec une probabilité supérieure à 0,95.
26
© Cned - Académie en ligne
Séquence 9 – MA02
Remarque
Tout intervalle qui contient un intervalle de fluctuation au seuil de 95 % est lui
aussi un intervalle de fluctuation à ce même seuil.
L’intervalle [ 0 ; 1] contient toutes les fréquences, il vérifie la condition de la définition 5, mais il est sans intérêt. On cherchera des intervalles de fluctuation correspondant à des probabilités supérieures à 0,95 et aussi très proches de 0,95 en
particulier dans les prises de décision.
Remarque
Il y a plusieurs sortes d’intervalle de fluctuation. On peut choisir des intervalles
de fluctuation centrés en p comme ceux vus en Seconde, ou pour lesquels la
probabilité que la fréquence soit à l’extérieur de l’intervalle à gauche soit égale
à la probabilité que la fréquence soit à l’extérieur de l’intervalle à droite comme
ceux vus en Première, ou…
Par exemple, pour p = 0, 2 et n = 100, l’intervalle de fluctuation vu en Seconde
est [ 0,1; 0, 3] et celui obtenu en Première est [ 0,12 ; 0, 28 ].
Propriété admise en Seconde
1
1 
est un intervalle de fluctuation approché au seuil
L’intervalle  p −
;p+
n
n 

de 95%, relatif aux échantillons de taille n.
1
1 
pour des probabiDans la pratique, on utilise l’intervalle  p −
;p+
n
n 

lités p comprises entre 0,2 et 0,8 et des échantillons de taille n supérieure à 25.
On dispose d’un dé bien équilibré, on gagne quand on obtient 1 ou 6. Détermi-
ner un intervalle de fluctuation au seuil de 95 % de la fréquence des lancers
gagnants dans les échantillons de taille 100.
On sait qu’en moyenne 51 % des nouveau-nés sont des garçons. Déterminer
un intervalle de fluctuation au seuil de 95 % de la fréquence des garçons
nouveau-nés dans des échantillons de taille 25. Que peut-on en déduire pour
le nombre de garçons parmi 25 nouveau-nés ?
Utilisation
Prise de décision
On a découvert une pièce ancienne et on se demande si elle est bien équilibrée.
Comment faire ?
On lance n fois la pièce et on note la fréquence f d’apparition de « pile ».
On détermine un intervalle de fluctuation In au seuil de 95 % de la fréquence
d’apparition de « pile » dans des échantillons de taille n.
Règle de décision : si f appartient à l’intervalle In , on décide que la pièce est
équilibrée ; si f n’appartient pas à l’intervalle In , on décide que la pièce n’est pas
équilibrée.
Dans chacun des deux cas suivants, quelle est la décision prise ?
n = 100 et f = 0, 56
n = 1000 et f = 0, 560.
Séquence 9 – MA02
27
© Cned - Académie en ligne
Activité 5
Sur le tableur Open Office, on a simulé 100 échantillons de n lancers d’un dé
tétraédrique bien équilibré.
On a déterminé les fréquences où la face marquée 1 est la face cachée ( p = 0, 25),
elles sont indiquées en ordonnées sur le graphique.
Dans chacun des trois cas, déterminer :

le pourcentage des fréquences appartenant à l’intervalle p −

le pourcentage des fréquences appartenant à
1
1 
;p+
;
n
n

p (1− p ) 
p (1− p )
; p + 1, 96
 p − 1, 96
.
n
n


Premier cas
Fluctation 100 échantillons
n = 50
p = 0,25
40
60
0,4
0,35
fréquence
0,3
0,25
0,2
0,15
0,1
0,05
0
0
28
© Cned - Académie en ligne
Séquence 9 – MA02
20
80
100
Deuxième cas
Fluctation 100 échantillons
n = 100
fréquence
p = 0,25
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0
20
40
60
80
100
Troisième cas
Fluctation 100 échantillons
n = 200
fréquence
0,35
p = 0,25
0,3
0,25
0,2
0,15
0,1
0,05
0
0
20
40
60
80
100
Séquence 9 – MA02
29
© Cned - Académie en ligne
C
Cours
1. Intervalles de fluctuation asymptotique
Dans ce qui suit, on considère des variables aléatoires X n suivant chacune une
loi binomiale B(n ; p ) (exemple : on lance n fois une pièce équilibrée, X n est le
nombre de « pile » obtenus, X n suit la loi B(n ; 0,5)).
X
La variable aléatoire Fn = n donne donc la fréquence du nombre de « sucn
cès ».
Propriété 7
X
La variable aléatoire Fn = n :
n
1 2
n
t prend n + 1 valeurs : 0, , ,..., ;
n n
n
p (1− p )
X 
X 
.
t vérifie E  n  = p et σ  n  =
 n 
 n 
n
Démonstration
La variable aléatoire X n prenant les n + 1 valeurs : 0, 1, 2, …, n, on en déduit
celles de Fn .
On sait que E ( X n ) = np et σ ( X n ) = np (1− p ), on sait aussi que
E(aX + b ) = aE( X ) + b et σ (aX + b ) = a σ ( X ), donc on divise l’espérance et
l’écart-type par n et on obtient les valeurs annoncées.
Les fréquences Fn ont pour espérance p qui ne dépend pas de n.
p (1− p )
qui diminue quand n augmente.
n
Les résultats observés ont tendance à se resserrer autour de l’espérance p quand
n augmente. C’est cette concentration des valeurs les plus probables autour de p
qui permet d’améliorer la prise de décision à partir des observations.
Les fréquences Fn ont pour écart-type
Définition 6
X
Un intervalle de fluctuation asymptotique de la variable aléatoire Fn = n
n
au seuil 1− α est un intervalle déterminé à partir de p et de n et qui contient
Fn avec une probabilité d’autant plus proche de 1− α que n est grand.
30
© Cned - Académie en ligne
Séquence 9 – MA02
왘
Exemple
On montrera plus loin que l’intervalle  p − 1 ; p + 1  est un intervalle de

n
n 

fluctuation asymptotique au seuil de 95 % (α = 0,05). En classe de Seconde,
cela a été énoncé sous forme simplifiée, le caractère asymptotique ne pouvant
pas être introduit. Des exemples ont été donnés dans l’activité 4.
Dans le théorème qui suit, le nombre u α est celui qui est défini dans le chapitre 2 : l’unique réel tel que P (−u α ≤ Z ≤ u α ) = 1− α , la variable aléatoire Z
suivant la loi normale N (0 ;1).
Théorème 3
Soit p un nombre réel fixé de l’intervalle ]0 ; 1[ .
Soit une suite de variables aléatoires ( X n ) chaque variable aléatoire X n
suivant la loi binomiale B(n ; p ), alors, pour tout réel α dans ]0 ; 1[ , on a
X

lim P  n ∈ In  = 1− α , où In est l’intervalle

n →+∞  n

p (1− p )
p (1− p ) 
; p + uα
p − u α
.
n
n 

Démonstration
La variable aléatoire X n suit la loi binomiale B(n ; p ), donc E ( X n ) = np et
σ ( X n ) = np (1− p ).
X − np
est la variable centrée et
La variable aléatoire Z n définie par Z n = n
np
(
1
−
p
)
réduite associée à X .
n
D’après le théorème de Moivre-Laplace, pour tous réels a et b tels que a < b ,
on a :
x2
−
b 1
lim P (a ≤ Z n ≤ b ) = ∫
e 2 dx .
a
n →+∞
2π
Or :


X − np
P (a ≤ Z n ≤ b ) = P a ≤ n
≤ b 
np (1− p )


(
= P (np + a
= P a np (1− p ) ≤ X n − np ≤ b np (1− p )
)
np (1− p ) ≤ X n ≤ np + b np (1− p )
)
 a p (1− p ) X
b p (1− p ) 
.
= P  p +
≤ n ≤p+
n
n
n

 x2
 a p (1− p ) X

−
b
p
(1
−
p
)
b
1
Donc lim P  p +
 = ∫
≤ n ≤p+
e 2 dx .
n
n →+∞ 
n
n
 a 2π
En remplaçant a et b par −u α et u α on obtient :
2
x
 u p (1− p ) X
u α p (1− p ) 
uα 1 − 2
α
n
 = ∫
lim P  p −
≤
≤p+
e
dx = 1− α ,
−u α 2π
n
n →+∞ 
n
n

c’est-à-dire :
X

lim P  n ∈ In  = 1− α.

n →+∞  n
Séquence 9 – MA02
31
© Cned - Académie en ligne
Propriété 8

p (1− p )
p (1− p ) 
L’intervalle In = p − u α
; p + uα
 est un intervalle de
n
n 

X
fluctuation asymptotique au seuil 1− α de la variable aléatoire Fn = n .
n
Démonstration
À savoir
C’est une conséquence immédiate du théorème précédent car la suite
X

X
P  n ∈ In  converge vers 1− α. L’intervalle In contient bien Fn = n avec
n
 n

une probabilité d’autant plus proche de 1− α que n est grand.

p (1− p )
p (1− p ) 
; p + 1,96
L’intervalle Jn = p − 1,96
 est un intervalle de
n
n 

fluctuation asymptotique au seuil de 95 % (p désigne la proportion dans la
population).
En effet, pour α = 0,05 , on sait que u 0,05 ≈ 1, 96.
Remarque
Les intervalles In et Jn sont des intervalles de fluctuation asymptotiques car il y
a la condition « d’autant plus proche de … que n est grand ». On peut considérer
que In et Jn sont des intervalles de fluctuation « approchés », la probabilité
que Fn appartienne à In ou à Jn n’est pas forcément supérieure à 0,95 mais si
elle n’est pas supérieure à cette valeur, elle en est proche. En pratique dans les exercices, la taille n de l’échantillon est fixée, l’intervalle de
fluctuation asymptotique Jn correspondant sera l’intervalle de fluctuation utilisé. Remarque
Conditions d’utilisation
Les exigences habituelles de précision pour utiliser cette approximation sont :
n ≥ 30, np ≥ 5 et n (1− p ) ≥ 5.
Remarque
Dans l’activité 5, on a pu faire des observations cohérentes avec ces résultats.
Mais la définition d’un intervalle de fluctuation est exprimée avec une probabilité. Si vous faites d’autres simulations avec le fichier qui est sur le site, il se peut
que quelques observations donnent des pourcentages éventuellement un peu
éloignés de 95 %.
Exemple 2
Déterminer un intervalle de fluctuation asymptotique au seuil de 95 % lorsque
n = 100 et p = 0, 5.
Solution
On a np = 50 et n (1− p ) = 50 donc les trois conditions sont réalisées et on peut
왘
왘
utiliser l’intervalle Jn . On obtient :

0,5 × 0,5
0,5 × 0,5 
J100 = 0,5 − 1,96
; 0,5 + 1,96
 soit [ 0, 402 ; 0, 598 ].
100
100 

Cet exemple modélise 100 lancers d’une pièce équilibrée. On peut donc dire que,
pour environ 95 % des séries de 100 lancers, la fréquence du nombre de « pile »
obtenus se situe dans l’intervalle [ 0, 402 ; 0, 598 ].
32
© Cned - Académie en ligne
Séquence 9 – MA02
Remarque
Ces intervalles de fluctuation asymptotique sont plus faciles à déterminer que
ceux du cours de Première qui nécessitaient l’utilisation de tableurs ou d’algorithmes.
2. Exemple d’utilisation : prise de décision
On utilise un intervalle de fluctuation lorsque l’on veut déterminer si la proportion f observée dans un échantillon est compatible ou non avec un modèle de
Bernoulli, c’est-à-dire si elle peut être un résultat obtenu par une variable aléatoire
X
Fn = n , où X n suit une loi binomiale de paramètres n et p, la valeur p étant
n
connue ou supposée dans la population.
Quand X n suit une loi binomiale de paramètres n et p, un intervalle de fluctuation asymptotique In au seuil de 95 % est un intervalle où se situe la fréquence
X
Fn = n avec une probabilité d’autant plus proche de 0,95 que n est grand.
n
L’intervalle In contient donc environ 95 % des fréquences observées dans les
échantillons de taille n suffisamment grande. Des fréquences (environ 5 %) de
certains échantillons ne sont pas dans In , c’est la fluctuation d’échantillonnage.
En fonction de l’appartenance ou non de la fréquence observée f à l’intervalle
In , on décide si l’échantillon est conforme ou non au modèle.
La règle de décision adoptée est la suivante :
t si la fréquence observée f dans un échantillon appartient à un intervalle
de fluctuation asymptotique au seuil de 95 %, on considère que l’échantillon est compatible avec le modèle ;
t sinon, on considère que l’échantillon n’est pas compatible avec le modèle.
Remarque
Avec cette règle, la fluctuation d’échantillonnage amène à rejeter, à tort, les 5 %
(environ) d’échantillons qui suivent le modèle de Bernoulli et qui ne sont pas
dans In .
Dans les exemples, les tirages sont effectués sans remise. La taille des échantillons considérés étant faible par rapport à la taille de la population totale, on
assimile les tirages réalisés à des tirages avec remise et on peut alors appliquer
les résultats précédents.
왘
Exemple 3
(D’après document ressources de l’Éducation nationale)
Le responsable de la maintenance des machines à sous d’un casino doit vérifier
qu’un certain type de machine est bien réglé sur une fréquence de succès de 0,06.
Il décide de régler chaque machine pour laquelle il aura observé, dans l’historique
des jeux, une fréquence de succès se situant en dehors d’un intervalle de fluctuation au seuil de 95 %.
Lors du contrôle d’une machine, le technicien constate qu’elle a fourni 9 succès
sur 85 jeux.
Séquence 9 – MA02
33
© Cned - Académie en ligne
Déterminer la fréquence observée f de succès de cette machine.
Déterminer un intervalle de fluctuation asymptotique du cours au seuil de
95 %.
Le technicien va-t-il modifier le réglage de la machine ?
Quelle aurait été sa décision s’il y avait eu 21 succès sur 200 jeux ?
왘
Solution
On a f = 9 ≈ 0,106.
85
On a n = 85, p = 0, 06, np = 5,1 et n (1− p ) = 79, 9, donc les conditions sont
remplies pour utiliser l’intervalle de fluctuation asymptotique du cours

0, 06 × 0, 94
0, 06 × 0, 94 
; p + 1, 96
0, 06 − 1, 96
.
85
85


0,009 est une valeur approchée par défaut
Comme
0, 06 − 1, 96
0, 06 × 0, 94
85
de
et 0,111 est une valeur approchée par
0, 06 × 0, 94
, alors [ 0, 009 ; 0,111] contient
85

0, 06 × 0, 94
0, 06 × 0, 94 
; p + 1, 96
0, 06 − 1, 96
 et [ 0, 009 ; 0,111] est
85
85


excès
de
0, 06 + 1, 96
donc un intervalle de fluctuation légèrement plus large que celui du cours.
La fréquence observée f se situe dans l’intervalle de fluctuation, donc le
réglage de la machine n’est pas modifié.
21
= 0,105 et l’in200
tervalle de fluctuation est environ égal à [ 0, 027 ; 0, 093]. La fréquence f du
nombre de succès observée n’est pas dans l’intervalle car elle est trop grande,
donc le technicien va modifier le réglage de la machine. On remarque que,
dans les deux cas, les fréquences f sont presque les mêmes mais les décisions
prises sont différentes car les intervalles de fluctuation sont différents.
Dans ce deuxième cas, la fréquence observée est f =
Remarque
L’amplitude de l’intervalle de fluctuation asymptotique au seuil de 95 % du cours
p (1− p )
est égale à 2 × 1, 96
. Pour une valeur de p donnée, cette amplitude
n
diminue quand la taille n de l’échantillon augmente.

3. Complément sur les intervalles p −

1
1 
;p+

n
n
a) On peut retrouver l’intervalle de fluctuation qui a été
donné en classe de Seconde.
1
est vérifiée (la fonction polynôme
4
2
du second degré p p (1− p ) = − p + p admet un maximum car le coefficient de
1
1  1 1
p 2 est négatif, ce maximum est atteint pour p = et il vaut donc  1−  = ).
2
2  2 4
Pour tout p dans ]0 ; 1[ , l’inégalité p (1− p ) ≤
34
© Cned - Académie en ligne
Séquence 9 – MA02
1
≤ 1.
4
Remarquons que cette inégalité a déjà été démontrée (exemple 12 de la
séquence 2, Généralités sur les fonctions).
On en déduit que 1, 96 p (1− p ) ≤ 1, 96 ×
On peut alors élargir l’intervalle de fluctuation Jn donné dans le cas particulier :
p (1− p )
p (1− p )
1
1
≤ p − 1, 96
≤ p + 1, 96
≤p+
.
n
n
n
n
1
1 
Donc l’intervalle J n est inclus dans l’intervalle  p −
;p+
 , ce qui prouve
n
n


que
X
 
1 Xn
1 
P  n ∈ Jn  ≤ P  p −
≤
≤p+
.
 n
 
n n
n
p−
Conclusion
1
1 
L’intervalle  p −
est bien un intervalle de fluctuation asympto;p+
n
n 

X
tique de n à un seuil au moins égal à celui de Jn , c’est-à-dire 95 %.
n
b) Théorème
Le théorème suivant fournit une inégalité à la place des mots « environ »,
« proche de ».
Il sera utilisé dans le chapitre suivant.
Théorème 4
Soit un réel p de l’intervalle ]0 ; 1[ et une suite de variables aléatoires ( X n )
où chaque variable aléatoire X n suit la loi binomiale B(n ; p ). Il existe un
X
1
1 
entier n0 tel que : si n ≥ n0 alors P  n ∈  p −
;p+
≥ 0, 95.
 n 
n
n 
Démonstration
La démonstration est proposée ci-dessous en exercice résolu. Elle fait intervenir
le théorème de Moivre-Laplace, la définition d’une suite convergente, la majoration de p (1− p ) vue ci-dessus.
Exercice résolu
Démontrer que

p (1− p ) X n
p (1− p ) 
1 Xn
1 

Pp −2
≤
≤ p +2
≤P p −
≤
≤p+
.


n
n
n
n 
n
n


p (1− p ) X n
p (1− p ) 
On pose an = P p − 2
≤
≤ p +2

 . Démontrer que
n
n
n 



X − np
an = P  −2 ≤ n
≤ 2 et en déduire que la suite (an ) est convergente
np (1− p ) 

vers une limite L telle que 0, 95 < L < 0, 96.
Séquence 9 – MA02
35
© Cned - Académie en ligne
En déduire qu’il existe un entier n0 tel que : si n ≥ n0 alors
X
1
1 

P  n ∈ p −
;p+
≥ 0, 95.
 n 
n
n 
왘
Solution
On fait avec 2 ce que l’on a fait pour 1,96.
1
≤ 1.
4
p (1− p )
p (1− p )
1
1
≤ p −2
≤ p +2
≤p+
.
On obtient : p −
n
n
n
n

p (1− p ) 
p (1− p ) X n
1 Xn
1 

Donc P  p − 2
≤
≤ p +2
≤P p −
≤
≤p+
.


n
n
n
n 
n
n

Pour tout réel p de l’intervalle ]0 ; 1[ , on a 2 p (1− p ) ≤ 2 ×
On a :
p −2
p (1− p )
p (1− p ) X n
≤
≤ p +2
⇔ np − 2 np (1− p ) ≤ X n ≤ np + 2 np (1− p )
n
n
n
X − np
⇔ −2 ≤ n
≤ 2.
np (1− p )
Donc



p (1− p ) X n
p (1− p ) 
X − np
Pp −2
≤
≤ p +2
= P  −2 ≤ n
≤ 2 = an .

n
n
n 
np (1− p ) 


D’après le théorème de Moivre-Laplace
x2


2 1 −
X n − np
lim an = lim P  −2 ≤
≤ 2 =
e 2 d x = L.
np (1− p )  ∫−2 2π
n →+∞
n →+∞ 
Le calcul de L donne L ≈ 0, 9544997, donc 0, 95 < L < 0, 96.
La suite (an ) converge vers L, donc il existe un rang n0 à partir duquel tous
les termes de la suite (an ) sont dans l’intervalle 0, 95 ; 0, 96 . (Remarque :
n0 dépend de p.)
On en déduit que si n ≥ n0 alors 0, 95 < an .

À la question , on a montré que an ≤ P  p −


déduit que si n ≥ n0 alors 0, 95 < an ≤ P  p −

 Xn 
1
1 
d’où P 
∈ p−
;p+
≥ 0, 95.
 n 
n
n 
Remarque
© Cned - Académie en ligne
1 Xn
≤
≤p+
n
n
1 Xn
≤
≤p+
n
n
[
1 
 . On en
n
1 

n
Le nombre n0 dépend de p. Un algorithme de calcul montre que sa plus grande
1
valeur est obtenue pour p = (la variance est alors maximale) et on obtient
2
alors n = 529.
0
36
]
Séquence 9 – MA02
D
Exercice 8
Exercices d’apprentissage
(D’après document ressources de l’Éducation nationale)
Les enfants sont dits prématurés lorsque la durée gestationnelle est inférieure
ou égale à 259 jours. La proportion de ces naissances est de 6 %. Des chercheurs
suggèrent que les femmes ayant eu un travail pénible pendant leur grossesse
sont plus susceptibles d’avoir un enfant prématuré que les autres. Il est décidé
de réaliser une enquête auprès d’un échantillon aléatoire de 400 naissances correspondant à des femmes ayant eu pendant leur grossesse un travail pénible. Les
chercheurs décident a priori que si la proportion d’enfants nés prématurés dans
cet échantillon est supérieure à la borne supérieure d’un intervalle de fluctuation
asymptotique au seuil de 0,95, alors leur hypothèse sera acceptée. Finalement, le
nombre d’enfants prématurés est de 50. Quelle est donc la conclusion ?
Exercice 9
Dans le monde, la proportion de gauchers est 12 %.
Dans un club de tennis, il y a 21 gauchers parmi les 103 licenciés.
Déterminer la fréquence de gauchers dans ce club.
Déterminer un intervalle de fluctuation asymptotique au seuil de 95 %.
Peut-on dire que ce club est « représentatif » de la proportion de gauchers
dans le monde ?
Exercice 10
On souhaite utiliser l’intervalle de fluctuation asymptotique

p (1− p )
p (1− p ) 
J n =  p − 1, 96
; p + 1, 96
.
n
n 

Pour p = 0, 02, déterminer la plus petite valeur de n vérifiant les conditions
d’utilisation :
n ≥ 30, np ≥ 5 et n (1− p ) ≥ 5.
Déterminer ensuite la plus petite valeur de n pour laquelle l’amplitude de
l’intervalle de fluctuation est inférieure à 0,1.
Séquence 9 – MA02
37
© Cned - Académie en ligne
1
4 Estimation
A
Objectifs du chapitre
On souhaite connaître, dans une population, la valeur d’une proportion p (proportion des pièces défectueuses parmi les pièces fabriquées par une usine, proportion des gauchers en France, intentions de vote pour un référendum…).
Pour des raisons matérielles, financières ou autres (par exemple, on ne peut pas
tester le bon fonctionnement de toutes les allumettes d’une production car dans
ce cas tester une allumette amène à la détruire !), on ne peut pas toujours réunir
les données concernant la population tout entière.
On va donc estimer la proportion p que l’on cherche à partir de la fréquence f
observée dans un échantillon.
Mais on sait que cette fréquence observée va varier d’un échantillon à l’autre,
c’est la fluctuation d’échantillonnage autour de p.
Il est donc nécessaire de tenir compte de cette fluctuation en donnant un résultat
sous forme d’un intervalle, appelé « intervalle de confiance » en précisant aussi
le niveau de confiance que l’on accorde à cette réponse.
Dans ce chapitre, on montre comment on peut déterminer un intervalle de
confiance avec un niveau de confiance de 95 %.
Cet intervalle dépendant de la taille de l’échantillon, on détermine la taille de
l’échantillon qui est suffisante pour obtenir une précision donnée (qui dépend
de l’amplitude de l’intervalle de confiance), le niveau de confiance étant toujours
95 %.
B
Pour débuter
Dans ce chapitre, vous apprendrez à répondre à des questions analogues à la
suivante.
On considère une urne contenant un très grand nombre de petites billes de couleur blanche ou noire, la proportion p de billes noires est inconnue. On cherche à
estimer p à partir d’un échantillon de taille n.
On effectue 100 tirages indépendants et on obtient 71 billes noires et 29 billes
blanches, à combien peut-on estimer p ?
Même question sachant qu’on a effectué 1000 tirages et obtenu 693 billes
noires et 307 billes blanches.
38
© Cned - Académie en ligne
Séquence 9 – MA02
C
Cours
1. Résultat préliminaire
Démontrer que, pour tous réels x et y et pour tout réel r positif, on a :
왘
Solution
Remarque
x − r ≤ y ≤ x + r ⇔ y − r ≤ x ≤ y + r.
x ≤ y + r
x − r ≤ y
⇔ y − r ≤ x ≤ y + r.
⇔
x −r ≤ y ≤ x +r ⇔ 
y − r ≤ x
y ≤ x + r
La double inégalité x − r ≤ y ≤ x + r équivaut à −r ≤ y − x ≤ r qui peut s’interprétér avec une valeur absolue : y − x ≤ r . La distance entre les deux nombres x
et y est inférieure à r, les deux nombres x et y jouant le même rôle.
2. Exemple de référence
Avant d’aborder les définitions et les propriétés bien mises en forme mais un peu
difficiles au premier abord, nous allons étudier un exemple.
On considère une urne contenant un très grand nombre de petites billes de couleur blanche ou noire, la proportion p de billes noires est inconnue. On cherche à
estimer p à partir d’un échantillon de taille n.
La probabilité d’obtenir une bille noire quand on fait un tirage au hasard est
égale à la proportion p.
On sait donc que, parmi tous les échantillons de taille n qu’on peut obtenir, environ 95 % d’entre eux ont une fréquence f qui appartient à l’intervalle de fluctua1
1 
tion  p −
;p+
. Le résultat préliminaire du prouve que :
n
n 

1
1
1
1
p−
≤f ≤ p +
⇔f −
≤ p ≤f +
,
n
n
n
n
1
1 ′′

ce qui permet de déduire que : f ∈  p −
;p+
 est équivalent à
n
n
′′


1
1 

p ∈ f −
;f +
.
n
n 

Donc, parmi tous les échantillons de taille n qu’on peut obtenir, environ 95 %
1
1 
sont tels que l’intervalle associé f −
contient le nombre p que
;f +
n
n 

l’on cherche à estimer.
On réalise donc un échantillon de taille n en effectuant n tirages indépendants
(tirages au hasard avec remise). On calcule la fréquence f de billes noires dans
1
1 

;f +
.
l’échantillon obtenu et on détermine l’intervalle f −
n
n 

1
1 
On dit alors que p appartient à f −
avec un niveau de confiance
;f +
n
n 

1
1 
de 95 % et que l’intervalle f −
;f +
 est un intervalle de confiance au
n
n


niveau 95 %.
Séquence 9 – MA02
39
© Cned - Académie en ligne
왘
Exemple 4
On effectue 100 tirages indépendants et on obtient 71 billes noires et 29
billes blanches. Donner un intervalle de confiance au niveau de 95 % pour la
proportion p de billes noires.
Même question sachant qu’on a effectué 1000 tirages et obtenu 693 billes
noires.
왘
Solution
On trouve f = 0, 71. Comme n = 100, l’intervalle f − 1 ; f + 1  est


n
n

1
1 

l’intervalle 0, 71−
; 0, 71+
, soit [ 0, 61; 0, 81].
100 
100

La proportion p de billes noires appartient à [ 0, 61; 0, 81] avec un niveau de
confiance de 95 %.
On dit aussi que la proportion de billes noires est estimée à 0,71 avec l’intervalle de confiance de [ 0, 61; 0, 81] au niveau 95 %.
On a ici f = 0, 693.
Un intervalle de confiance au niveau 95 % est donc
1
1 

0, 693 − 1000 ; 0, 693 + 1000  .


Pour donner un intervalle dont les bornes sont des nombres décimaux ayant trois
chiffres après la virgule, on détermine une valeur approchée par excès de la borne
de droite et une valeur approchée par défaut de la borne de gauche : on obtient
[0,661; 0,725].
La proportion de billes noires est estimée à 0,693 avec l’intervalle de confiance
de [ 0, 661; 0, 725] au niveau de 95 %.
1
1 
est
Il est clair qu’une fois l’échantillon réalisé, l’intervalle f −
;f +
n
n 

déterminé et il n’y a alors que deux possibilités : p appartient ou n’appartient pas
à cet intervalle (de même quand on a lancé une pièce, on a obtenu « pile » ou on
a obtenu « face »). C’est pourquoi on ne s’exprime plus en termes de probabilité.
Pour exprimer l’idée qu’on a obtenu un intervalle et qu’environ 95 % des intervalles qu’on peut obtenir ainsi contiennent la proportion cherchée, on a choisi le
mot « confiance ».
3. Définition
Comme dans le chapitre précédent, on considère une suite de variables aléatoires
( X n ) où chaque variable aléatoire X n suit la loi binomiale B(n ; p ) (exemple :
on lance n fois une pièce et X n est le nombre de « pile » obtenus). La variable
X
aléatoire Fn = n donne donc la fréquence du nombre de « succès ».
n
On dit qu’un intervalle est aléatoire lorsque ses bornes sont définies par des
variables aléatoires.
La réalisation d’un intervalle aléatoire est l’intervalle obtenu après avoir réalisé
l’expérience aléatoire (après avoir lancé 500 fois une pièce, interrogé 1000 personnes…).
40
© Cned - Académie en ligne
Séquence 9 – MA02
Définition 7
Un intervalle de confiance pour une proportion p à un niveau de confiance
de 95 % est la réalisation, à partir d’un échantillon, d’un intervalle aléatoire
contenant la proportion p avec une probabilité supérieure ou égale à 95 %.
Propriété 9
1
1 
Pour une valeur de p fixée, l’intervalle aléatoire Fn −
; Fn +
n
n 

contient, pour n assez grand, la proportion p avec une probabilité au moins
égale à 0,95.
Démonstration
Dans le chapitre précédent, on a démontré le théorème 4. On sait donc que, pour
une valeur de p fixée, il existe un entier n0 tel que : si n ≥ n0 alors
1 Xn
1 

Pp −
≤
≤p+
 ≥ 0, 95.

n
n
n
1 Xn
1 
1
1 


Comme P  p −
≤
≤p+
= P  Fn −
≤ p ≤ Fn +

 , l’intervalle


n
n
n
n
n
1
1 
contient bien pour n ≥ n0 la proportion p avec
aléatoire Fn −
; Fn +
n
n 

une probabilité au moins égale à 0,95.
À savoir
On se place dans le cas où l’échantillon contient au moins 30 éléments. Si
la fréquence f observée est telle que nf ≥ 5 et n (1− f ) ≥ 5, on convient
1
1 
est
que f est une estimation de p et que l’intervalle f −
;f +
n
n 

un intervalle de confiance au niveau de 95 % pour la proportion p.
Cet intervalle est parfois appelé fourchette de sondage.
4. Taille de l’échantillon pour obtenir une
précision donnée au niveau de confiance
de 95%
La précision de l’estimation est donnée par l’amplitude de l’intervalle
2
1
1 

f − n ; f + n  qui est égale à n et dépend donc de la taille n de l’échan

tillon.
Séquence 9 – MA02
41
© Cned - Académie en ligne
On observe que cette amplitude ne dépend pas de la taille de la population
totale, ce qui peut étonner. Mais pour goûter un plat, il suffit d’en goûter une
petite quantité, cette quantité ne dépend pas de la taille du récipient (mais il faut
néanmoins avoir bien mélangé) ! (Explication donnée d’après une idée de JeanLouis Boursin dans son livre Les structures du hasard.)
On peut donc choisir la taille n de l’échantillon pour obtenir la précision sou2
≤ a,
haitée. En notant a la précision souhaitée, on cherche un entier n tel que
n
4
soit n ≥ .
a2
Précision a
0,06
0,04
0,02
0,01
Taille minimale de l’échantillon n
1112
2500
10000
40000
Les sondages sont souvent faits avec des échantillons d’environ 1000 personnes,
la précision obtenue est donc d’environ 0,06.
Ainsi, questionner 1 112 personnes suffit pour avoir une fourchette de sondage
d’amplitude 0,06, qu’il s’agisse d’un sondage pour un référendum local concernant 100 000 électeurs ou pour le deuxième tour d’une élection présidentielle
concernant 35 millions d’électeurs.
Il faut bien sûr savoir cela quand on reçoit des informations où les sondages sont
un élément important.
5. Exemple : sondages et élections
왘
Exemple 5
Dans cet exercice, la population est suffisamment grande pour que les sondages
soient assimilés à des tirages avec remise. On ne tient compte que des réponses
exprimées, c’est-à-dire qu’on ne tient pas compte des prévisions d’abstentions ou
des intentions de vote nul. Les sondages sont faits auprès de 1 112 personnes.
Au deuxième tour de l’élection présidentielle, le dernier sondage de l’institut A
indique 52,5 % d’intentions de vote pour le candidat X et 47,5 % pour le candidat Y (les abstentions ou les votes nuls ne sont pas pris en compte).
L’institut B indique 50, 5 % d’intentions de vote pour le candidat X et 49, 5 %
pour le candidat Y.
Y a-t-il une contradiction entre les résultats de ces deux instituts de sondage ?
Le candidat X peut-il être totalement rassuré ?
왘
42
© Cned - Académie en ligne
Solution
L’intervalle de confiance f − 1 ; f + 1  obtenu à partir des résultats


n
n

de l’institut A qui donne f = 0, 525 pour le candidat X est environ égal à
[0, 495 ; 0,555]. En utilisant les résultats de l’institut B qui donne f = 0,505,
on obtient environ [ 0, 475 ; 0, 535]. Les deux intervalles de confiance ont une
partie commune, donc les résultats de ces deux instituts de sondage ne sont
pas en contradiction.
Séquence 9 – MA02
Le candidat X ne peut pas être totalement rassuré car les deux intervalles de
confiance contiennent des nombres inférieurs à 0,5, correspondant à un échec
de sa candidature.
6. Simulation
Pour mieux voir ce qu’est un intervalle de confiance, une fourchette de sondage,
on a réalisé 20 séries de 200 tirages de 0 et de 1 au hasard.
Pour chaque série, on obtient un intervalle de confiance.
Dans la colonne GS, on a déterminé la fréquence avec laquelle on a obtenu 1.
Dans les colonnes GT et GU sont calculées les bornes de l’intervalle de confiance
du cours au niveau de 95 %. La sélection des colonnes GT et GU et le choix
de « XY dispersion » dans type de diagramme dans Open Office donne le diagramme ci-dessous.
Les 20 intervalles de confiance sont limités verticalement par les deux séries de
points.
On constate ici que 19 d’entre eux contiennent p = 0, 5 qui est la proportion
réelle dans cet exemple de tirage au hasard. Un seul intervalle ne contient pas
p = 0, 5.
Dans d’autres simulations, on peut bien sûr trouver plusieurs intervalles de
confiance, plusieurs fourchettes de sondage, qui ne contiennent pas p ; on peut
aussi n’en trouver aucun.
Quand on veut estimer une proportion, on utilise un seul intervalle de confiance.
La simulation permet de voir qu’environ 95 % des intervalles de confiance
contiennent p ce qui illustre la propriété 8.
Séquence 9 – MA02
43
© Cned - Académie en ligne
7. Autre intervalle de confiance
Comme il existe différents intervalles de fluctuation, il existe différents intervalles
de confiance.

f (1− f )
f (1− f ) 
Par exemple, l’intervalle f − 1, 96
; f + 1, 96
 est aussi un intern
n 

valle de confiance qui est utilisé dans certains cas. On ne le justifiera pas ici.
D
Exercice 11
Exercices d’apprentissage
Une usine vient d’installer une chaîne de fabrication pour fabriquer une nou-
velle pièce. Après un bref temps de fonctionnement, on prélève 100 pièces.
La fabrication est assez importante pour que ce prélèvement soit assimilé
à un tirage avec remise. On trouve 23 pièces défectueuses. Déterminer un
intervalle de confiance de la proportion de pièces sans défaut avec un niveau
de confiance de 95 %.
Des modifications ont été apportées. On prélève de nouveau 100 pièces et on
en trouve 9 défectueuses.
Déterminer l’intervalle de confiance correspondant.
Conclure.
Exercice 12
Dans une grande ville, un nouveau cinéma va être construit. La municipalité propose un terrain à proximité du centre ancien.
Un premier sondage est effectué auprès de 100 personnes choisies de façon
aléatoire et indique 53 avis favorables. Peut-on dire que la majorité de la
population est favorable à cet emplacement ?
Un deuxième sondage effectué auprès de 500 personnes indique la même
proportion d’avis favorables. La conclusion est-elle différente ?
Si un sondage effectué auprès de n personnes indique la même proportion
d’avis favorables, à partir de quelle valeur de n peut-on estimer, au niveau
de confiance de 95 %, que la majorité de la population est favorable à cet
emplacement ?
44
© Cned - Académie en ligne
Séquence 9 – MA02
5 Synthèse
A
Synthèse de la séquence
Dans cette séquence, trois types de variables aléatoires discrètes (prenant un
nombre fini de valeurs) sont utilisées.
Les variables dépendent des deux paramètres n et p.
Par exemple, on lance n fois une pièce déséquilibrée pour laquelle la probabilité
d’obtenir « pile » est égale à p = 0, 6. La variable aléatoire X n est égale au
nombre de fois où on obtient « pile ».
t Les variables aléatoires X n suivent des lois binomiales de paramètres n et p.
La variable aléatoire X n prend les valeurs entières de 0 à n, E ( X n ) = np et
σ ( X n ) = np (1− p ).
t La variable aléatoire Z n est la variable aléatoire centrée-réduite associée
à X n . La variable aléatoire Z n prend des valeurs discrètes, souvent non
entières, E ( Z n ) = 0 et σ ( Z n ) = 1. Toutes les variables Z n ont la même espérance et le même écart-type mais elles sont différentes (les valeurs prises par
Z n dépendent de n et de p).
X
t La variable aléatoire Fn = n est la variable aléatoire qui est la fréquence
n
associée à X n . La variable Fn prend des valeurs discrètes dans [ 0 ; 1] ,
E (Fn ) = p (indépendante de n) et σ (Fn ) diminue quand n augmente.
Centrer et réduire
Définition
On dit qu’une variable aléatoire est centrée et réduite lorsque son espérance
est nulle et son écart-type égal à 1.
Propriété
Soit X une variable aléatoire d’espérance m et d’écart-type σ , la variable
X −m
est une variable aléatoire centrée et réduite.
aléatoire Z =
σ
Séquence 9 – MA02
45
© Cned - Académie en ligne
Théorème de Moivre-Laplace
Soit p un nombre réel de l’intervalle ]0 ; 1[ .
Soit une suite de variables aléatoires ( X n ) où chaque variable aléatoire X n
suit la loi binomiale B(n ; p ).
X − np
, variable centrée et réduite associée à X n .
On pose Z n = n
np (1− p )
Alors, pour tous réels a et b tels que a < b , on a :
lim P (a ≤ Z n ≤ b ) =
n →+∞
x2
1
e 2 dx .
−
b
∫a
2π
n = 99
0,5
p = 0,34
0,4
0,3
0,2
0,1
0
–4
–3
–2
–1
0
1
2
3
4
Loi normale centrée réduite
Définition
Une variable aléatoire X suit la loi normale centrée réduite N (0 ;1) si, pour
tous réels a et b tels que a < b , on a :
P (a ≤ X ≤ b ) =
b
x2
1
e 2 dx .
−
b
∫a f ( x ) dx = ∫a
2π
1/ 2/ 0,4
O
46
© Cned - Académie en ligne
Séquence 9 – MA02
1
t Si X suit la loi normale N (0 ; 1) alors E( X ) = 0 et σ ( X ) = 1.
t Lorsque la variable aléatoire X suit la loi normale N (0 ; 1), pour tout nombre
α de l’intervalle ]0 ; 1[ , il existe un unique nombre réel positif u α tel que
P (−u α ≤ X ≤ u α ) = 1− α.
t Valeurs particulières à connaître :
{
{
u0,05 ≈ 1, 96 d’où : P ( −1, 96 ≤ X ≤ 1, 96 ) ≈ 0, 95.
u0,01 ≈ 2, 58 et P ( −2, 58 ≤ X ≤ 2, 58 ) ≈ 0, 99.
Autres lois normales
Définition
Une variable aléatoire X suit une loi normale N (µ ; σ 2 ) si la variable aléaX −µ
suit la loi normale centrée réduite N (0 ; 1).
toire Z =
σ
ᏺ (3;0,25)
ᏺ (1;1)
ᏺ (0;1)
ᏺ (1;4)
ᏺ (0;4)
O
1
t Espérance et écart-type
Si une variable aléatoire X suit la loi normale N (µ ; σ 2 ) alors E( X ) = µ et σ ( X ) = σ .
t Calculs
La variable aléatoire X suivant la loi normale N (µ ; σ 2 ), il faut savoir calculer des probabilités de
la forme : P (a ≤ X ≤ b ), P ( X ≤ c ) et P ( X ≥ c ), a, b et c étant des nombres réels donnés.
Il faut aussi savoir déterminer le nombre x tel que P ( X ≤ x ) = p , p étant une probabilité donnée.
Séquence 9 – MA02
47
© Cned - Académie en ligne
t À connaître
P (µ − σ ≤ X ≤ µ + σ ) ≈ 0, 68 (à 10−2 près) ;
P (µ − 2σ ≤ X ≤ µ + 2σ ) ≈ 0, 95 (à 10−2 près) ;
P (µ − 3σ ≤ X ≤ µ + 3σ ) ≈ 0, 997 (à 10−3 près).
0,68
µ
µ–␴
µ+␴
µ–2␴
µ–3␴
µ+2␴
µ+3␴
Intervalles de fluctuation
Définition
X
Un intervalle de fluctuation asymptotique de la variable aléatoire Fn = n
n
au seuil 1− α est un intervalle déterminé à partir de p et de n et qui contient
Fn avec une probabilité d’autant plus proche de 1− α que n est grand.
Théorème
Soit p un nombre réel fixé de l’intervalle ]0 ; 1[ .
Soit une suite de variables aléatoires ( X n ) , chaque variable aléatoire X n
sui-vant la loi binomiale B(n ; p ), alors, pour tout réel α dans ]0 ; 1[ , on a
X

lim P  n ∈ In  = 1− α , où In est l’intervalle

n →+∞  n

p (1− p )
p (1− p ) 
; p + uα
p − u α
 et u α désigne l’unique réel tel
n
n 

que P (−u α ≤ Z ≤ u α ) = 1− α , la variable aléatoire Z suivant la loi normale
N (0 ; 1).
48
© Cned - Académie en ligne
Séquence 9 – MA02
Propriété

p (1− p )
p (1− p ) 
L’intervalle In = p − u α
; p + uα
 est un intervalle de
n
n 

X
fluctuation asymptotique au seuil 1− α de la variable aléatoire Fn = n .
n

p (1− p )
p (1− p ) 
En particulier, l’intervalle Jn = p − 1,96
; p + 1,96
 est un
n
n 

intervalle de fluctuation asymptotique au seuil de 95 %.
Conditions d’utilisation
Les exigences habituelles de précision pour utiliser cette approximation sont :
n ≥ 30, np ≥ 5 et n (1− p ) ≥ 5.
t Il faut savoir utiliser un intervalle de fluctuation pour prendre une décision.
La règle de décision adoptée étant la suivante :
si la fréquence observée f dans un échantillon appartient à un intervalle
de fluctuation asymptotique au seuil de 95 %, on considère que l’échantillon est compatible avec le modèle ;
{ sinon, on considère que l’échantillon n’est pas compatible avec le modèle.
{ Intervalle de confiance
Définitions
Un intervalle de confiance (on dit aussi une « fourchette de sondage »)
pour une proportion p à un niveau de confiance de 95 % est la réalisation,
à partir d’un échantillon, d’un intervalle aléatoire contenant la proportion p
avec une probabilité supérieure ou égale à 95 %.
t Il faut savoir estimer une proportion inconnue p grâce à un échantillon :
1
1 
la proportion p est estimée par la fréquence f, l’intervalle f −
;f +
n
n 

étant un intervalle de confiance au niveau de 95 %.
Conditions d’utilisation
On se place dans le cas où l’échantillon contient au moins 30 éléments et où
la fréquence f observée est telle que nf ≥ 5 et n (1− f ) ≥ 5.
t La précision de l’estimation est donnée par l’amplitude de l’intervalle
2
1
1 

qui
est
égale
à
et dépend donc de la taille n de
f
−
;
f
+

n
n
n 

l’échantillon.
Séquence 9 – MA02
49
© Cned - Académie en ligne
B
Exercices de synthèse
Plusieurs exercices de cette séquence sont issus de documents ressources de
l’Éducation nationale.
Exercice I
Lois normales
Sur une chaîne d’embouteillage, la quantité X (en cl) de liquide fournie par une
machine pour remplir chaque bouteille, étiquetée 75 cl, de contenance totale
83 cl (liquide + air + bouchon), peut être modélisée par une variable aléatoire X
suivant une loi normale de moyenne µ et d’écart-type σ = 2.
Le directeur de la coopérative demande de régler la machine pour qu’il y ait
moins de 1% de bouteilles qui débordent.
a) Quelle est alors la valeur de µ ?
b) Quelle est, dans les conditions du a), la probabilité que la bouteille contienne
moins de 75 cl ? La législation imposant qu’il y ait moins de 0,1 % de bouteilles contenant moins de 75 cl, la législation est-elle respectée ?
a) Sans changer l’écart-type, à quelle valeur de la moyenne µ doit-on régler
la machine pour respecter la législation ?
b) Quelle est alors la probabilité qu’une bouteille déborde au remplissage ?
Déterminer µ et σ pour qu’il y ait moins de 0,1 % de bouteilles de moins de
75 cl et moins de 1% de bouteilles qui débordent.
Exercice II
Intervalle de fluctuation
Les personnes qui achètent un billet pour un voyage en avion ne se présentent
pas toutes à l’embarquement. Les compagnies aériennes cherchent donc à optimiser le remplissage d’un avion en vendant éventuellement un nombre de billets
supérieur à la capacité de l’avion (on dit que les places sont vendues en surréservation ou en surbooking). Les compagnies aériennes veulent bien sûr maîtriser le
risque dû à cette pratique.
On considère un avion de 300 places, soit n le nombre de billets vendus, soit p la
probabilité qu’un client ayant acheté un billet se présente à l’embarquement
et soit X n la variable aléatoire désignant le nombre d’acheteurs d’un billet se
présentant à l’embarquement.
On cherche à évaluer n, n > 300, tel que P ( X n > 300 ) ≈ 0, 05, c’est-à-dire tel
que la probabilité que le nombre de passagers se présentant à l’embarquement
soit supérieur à 300 soit égale à peu près à 0,05.
Pour modéliser cette situation, on suppose que les comportements des clients
sont indépendants les uns des autres.
Déterminer la loi de X n .
On suppose que p = 0, 85. Écrire l’intervalle de fluctuation asymptotique J n
X
du cours pour n au seuil de 95 %.
n
50
© Cned - Académie en ligne
Séquence 9 – MA02
300 
Montrer que si J n ⊂  0 ;
, alors la probabilité que le nombre de pas
n 
sagers se présentant à l’embarquement excède 300 est inférieure à une valeur
proche de 0,05.
On cherche à déterminer la valeur de n maximale permettant de satisfaire la
 300 
.
condition J n ⊂ 0 ;
n 

 300 
, alors 0, 85n + 1, 96 0,1275 n − 300 ≤ 0.
a) Montrer que si J n ⊂ 0 ;
n 

b) On définit sur [1; + ∞[ la fonction f par f ( x ) = 0, 85x + 1, 96 0,1275 x − 300.
Montrer que la fonction f est strictement croissante sur [1; + ∞[ et déterminer le plus grand entier n0 pour lequel la fonction f prend une valeur
négative.
 300 
c) Vérifier que, pour cette valeur n0 , on a bien J n0 ⊂ 0 ;
 . Conclure.
 n0 
Appliquer la même démarche lorsque p = 0, 9 puis lorsque p = 0, 95. Commenter.
Exercice III
Intervalle de fluctuation au seuil de 98 %
Expliquer comment on peut retrouver, avec une calculatrice, les valeurs don-
nées dans le cours pour u 0,05 et u 0,01.
Déterminer u 0,02. En déduire un intervalle de fluctuation asymptotique au
X
seuil de 98 % de la variable aléatoire Fn = n , où chaque variable aléatoire
X n suit la loi binomiale B(n ; p ).
n
Une confiserie fabrique des pâtes de fruits. Les machines ont été réglées pour
que la proportion des pâtes de fruits de premier choix dans la production soit
de 80 %.
Dans un prélèvement d’un échantillon de 150 pâtes de fruits, on en a trouvé
122 de premier choix et 28 de deuxième choix.
La production est-elle conforme à la proportion attendue au seuil de 98 % ?
Exercice IV
Intervalle de confiance
Pour estimer dans une population la proportion p des individus possédant le
caractère A, on interroge au hasard 80 individus de cette population. On observe
que 18 individus possèdent le caractère A.
Donner pour p un intervalle de confiance au niveau de 95 %.
Donner une condition sur le nombre n d’individus interrogés pour que la précision obtenue par l’intervalle de confiance au niveau de 95 % soit inférieure
à 0,05.
Donner une condition sur le nombre n d’individus interrogés pour qu’avec la
même fréquence observée l’intervalle de confiance au niveau de 95 % soit
inclus dans [ 0 ; 0, 25].
Déterminer un entier n vérifiant les deux conditions. Quel serait alors l’intervalle de confiance au niveau de 95 % ? Séquence 9 – MA02
51
© Cned - Académie en ligne
Téléchargement