Lois usuelles de probabilités

publicité
4
Lois usuelles de probabilités
4.1
Approche
4.1.1 La planche de Galton
La planche de Galton est un jeu d’obstacles formé de petits cylindres répartis géométriquement. On lâche une bille en haut de
la planche : à chaque obstacle, elle peut passer indifféremment
et avec autant de chance, à gauche ou bien à droite de l’obstacle.
On veut connaître la loi de probabilité associée à cette expérience aléatoire. On note X le numéro de la case où tombe la bille.
Vous pouvez revoir le TD sur la planche de Galton.
4.2
Loi binomiale
4.2.1 Définition et propriétés
Définition
Une variable aléatoire X suit la loi binomiale B(n, p) de paramètres n et p, où n est un nombre entier
naturel et p un nombre réel compris entre 0 et 1, lorsque sa loi de probabilité est définie de la manière
suivante :
n
Pour tout nombre entier naturel k, tel que 0 ¶ k ¶ n, P(X = k) = k p k (1 − p)n−k
Propriété
Soit X une variable aléatoire suivant la loi binomiale B(n, p).
E(X) = np, V(X) = np(1 − p), σ(X) =
p
np(1 − p)
4.2.2 Champ d’intervention de la loi binomiale
II s’agit de décrire une situation type dans laquelle apparaît une variable aléatoire suivant la loi binomiale.
Cours
32
BTSA
On considère une « épreuve aléatoire » élémentaire pouvant déboucher sur deux résultats et deux seulement, appelés par exemple « succès » et « échec », de probabilités respectives p et q = 1 − p. On réalise n fois
cette épreuve aléatoire et on note X la variable aléatoire mesurant le nombre de « succès » obtenus au cours
de ces n épreuves aléatoires élémentaires.
Si ces n épreuves aléatoires élémentaires sont indépendantes, alors X suit la loi binomiale B(n, p).
Remarques
Dans le cas de tirages avec remise, il y a indépendance entre les tirages.
En revanche, lorsque les tirages sont sans remise, ou exhaustifs, il n’y a plus indépendance entre les
tirages, car la composition de l’univers des possibles change d’un tirage à l’autre.
Dans ce cas, X suit une loi dépendant de trois paramètres : n, p et N l’effectif total de l’univers.
Cependant, lorsque n est « petit » devant N, on peut considérer que X suit approximativement la loi
binomiale B(n, p).
✍ MÉTHODE 35
Un étudiant répond au hasard à 4 questions d’un QCM contenant chacune 5 réponses possibles dont une
seule est bonne. On appelle X la variable aléatoire représentant le nombre de bonnes réponses données
par l’étudiant. Quelle est la loi suivie par X ?
Une bonne réponse vaut 5 points. Si tous les étudiants d’une classe font ainsi, quelle moyenne peut-on
espérer ?
4.3
Loi normale
4.3.1 Définition et propriétés
Approche
1. Voici ci-dessous les graphiques des deux fonctions f1 et f2 définies sur R par :
1
1 −1
1 u−1 2
f1 (u) = p e− 2 ( 2 ) et f2 (u) = p e 2
2 2π
2π

u2
2
‹
Compléter le graphique de f2 .
2. Déterminer graphiquement une valeur approchée de l’aire de la partie de plan comprise entre chaque
courbe et l’axe des abscisses.
1
-7
-6
-5
-4
-3
-2
-1
C f1
0
1
1
-4
-3
-2
-1
2
3
4
5
6
7
8
9
C f2
0
1
2
3
4
Définition
Une variable aléatoire X suit la loi normale N (µ, σ) de paramètres µ et σ lorsque sa densité de probabilité
est la fonction f définie sur R par
1
1 u−µ 2
f (u) = p e− 2 ( 2 )
σ 2π
BTSA
33
Cours
Exemples
Dans l’approche,
La fonction f1 est la densité de probabilité de la loi normale N (1, 2).
La fonction f2 est la densité de probabilité de la loi N (0, 1).
Propriété
Soit X une variable aléatoire suivant la loi normale N (µ, σ).
E(X) = µ, V(X) = σ2 , σ(X) = σ
Remarque
Ainsi, une variable aléatoire X qui suit la loi normale N (0, 1) a pour espérance mathématique 0 et pour
écart type 1.
La loi normale N (0, 1) est dite loi normale centrée réduite.
4.3.2 Loi normale centrée réduite N (0, 1)
Théorème
Si une variable aléatoire X suit la loi normale N (µ, σ) alors la variable aléatoire U =
X−µ
suit la loi
σ
normale centrée réduite N (0, 1).
Remarque
Ce résultat est très important, car il permet de limiter l’étude des lois normales à celle de la seule loi
normale centrée réduite N (0, 1), dont la densité de probabilité a pour représentation graphique la courbe
de la figure suivante.
1 −1
y = f (u) = p e 2
2π

u2
2
‹
Φ(u)
|
-4
|
-3
|
-2
|
-1
|
0
|
u1
|
2
|
3
|
4
Pour calculer la probabilité d’un événement concernant une variable aléatoire U suivant la loi normale
N (0, 1), on utilise en général la table du formulaire qui nous donne des valeurs prises par la fonction de
répartition Φ de U, c’est à dire la fonction qui à tout u de R associe Φ(u) = P(U ¶ u).
On utilise aussi les deux propriétés suivantes de cette courbe :
– Cette courbe est symétrique par rapport à l’axe des ordonnées.
– L’aire totale comprise entre la courbe et l’axe des abscisses est égale à l.
Exemples
Cours
34
BTSA
1. Calcul de P(U ¶ 1, 67) = Φ(1, 67).
La table donne directement le résultat. Il suffit de trouver les deux premiers chiffres de u dans la première
colonne, soit 1, 6 : le troisième chiffre de u est indiqué
dans la première ligne, soit 7. La réponse est donnée à
l’intersection de la ligne correspondant à 1, 6 et de la
colonne correspondant à 7, soit P(U ¶ 1, 67) = ....
0
0, 5000
0, 5398
...
0, 9452
...
u
0, 0
0, 1
...
1, 6
...
1
0, 5040
0, 5438
...
0, 9463
...
...
...
...
...
...
...
7
0, 5279
0, 5675
...
0, 9525
...
...
...
...
...
...
...
(a) Calculer P(U ¶ 1, 96).
(b) Déterminer a tel que P(U ¶ a) = 0, 9463.
(c) Déterminer b tel que P(U ¶ b) = 0, 9803.
2. Calcul de P(U ¾ 1, 25).
1 − Φ(1, 25)
Φ(1, 25)
|
-4
|
-3
|
-2
|
-1
|
0
|
1
|
2
|
3
|
4
1, 25
P(U ¾ 1, 25) = 1 − P(U < 1, 25), car P(A) = 1 − P(A).
Or Φ(1, 25) = P(U ¶ 1, 25) et P(U = 1, 25) = 0 puisque U est une variable aléatoire continue, d’où :
P(U ¾ 1, 25) = 1 − Φ(1, 25) = ...
De même, calculer P(U ¾ 2, 33).
3. Calcul de P(U ¶ −1, 67).
P(U ¶ −1, 67) = Φ(−1, 67) mais qui n’est pas dans la table
= P(U ¾ 1, 67) par symétrie de la courbe
Φ(−1, 67)
= 1 − P(U < 1, 67)
1 − Φ(1, 67)
= 1 − P(U ¶ 1, 67) car U est continue
= 1 − 0, 9525 d’après le calcul précédent
|
-4
|
-3
|
-2
= 0, 0475.
|
-1
|
0
|
1
|
2
−1, 67
|
3
|
4
1, 67
(a) Calculer P(U ¶ −1)
(b) Calculer P(U ¶ −1, 4)
(c) Calculer P(U ¾ −2, 33)
4. Calcul de P(u1 ¶ U ¶ u2 )
Φ(u) −
|
-4
|
-3
|
-2
|
-1
|
0
|
1
u1
|
2
|
3
|
4
|
-4
|
-3
1
Φ(u) +
2
|
-2
u2
|
-1
−u
Propriété
P(u1 ¶ U ¶ u2 ) = Φ(u2 ) − Φ(u1 )
P(−u ¶ U ¶ u) = 2Φ(u) − 1
|
0
|
1
|
2
u
|
3
1
2
|
4
BTSA
35
Cours
✍ MÉTHODE 36
1. Démontrer la seconde propriété
2. calculer :
(a) P(−1 ¶ U ¶ 1)
(b) P(−2 ¶ U ¶ 2)
(c) P(−3 ¶ U ¶ 3)
(d) P(− 32 ¶ U ¶ 23 )
3. Soit X une variable aléatoire suivant la loi normale N (µ, σ) et U la variable aléatoire suivant la
loi normale N (0, 1).
(a) Exprimer U en fonction de X.
(b) Exprimer X en fonction de U.
Conséquences
Soit X une variable aléatoire suivant la loi normale N (µ, σ) ; on sait que U =
X−µ
N (0, 1).
suit la loi normale
σ
Pour u > 0, P(−u ¶ U ¶ u) = P(−uσ ¶ σU ¶ uσ)
= P(µ − uσ ¶ µ + σU ¶ µ + uσ)
= P(µ − uσ ¶ X ¶ µ + uσ)
Ainsi, en particulier, P(µ − 2σ ¶ X ¶ µ + 2σ) ≃ 0, 95.
1
p
σ 2π
µ − 3σ
µ − 2σ
µ − 23 σ
µ−σ
µ
µ + 32 σ
µ+σ
µ + 2σ
µ + 3σ
0, 5
0, 68
0, 95
0, 997
4.3.3 Approximation d’une loi binomiale par une loi normale
Approche
Lançons cinquante fois une pièce de monnaie équilibrée. Soit X la variable aléatoire mesurant le nombre
de « face » ainsi obtenu.
1. Quelle est la loi de X ? Calculer E(X) et σ(X).
Cours
36
BTSA
2. Compléter le tableau suivant.
k
17
18
19
20
21
22
23
24
25
P(X = k)
k
26
27
28
29
30
31
32
33
34
P(X = k)
0.15
0.10
0.05
0
15
20
25
30
35
3. Représenter graphiquement la loi de probabilité de X sur le graphique ci-dessus.
4. La courbe représentée ci-dessus est la courbe de la fonction densité de la loi N (25, p52 ). Quelle conjecture peut-on émettre ?
Propriété
On admet que si n est « grand » et p ni « trop voisin
p » de 0 ni « trop voisin » de 1, alors la loi B(n, p) est
très proche de la loi N (µ, σ) où µ = np et σ = np(1 − p).
Remarque
L’intérêt de cette approximation est de simplifier les calculs numériques. On convient en général d’utiliser
cette approximation lorsque np et n(1 − p) sont supérieurs à 15, ou lorsque np et n(1 − p) sont supérieurs à
20.
Mise en œuvre de cette approximation
On se propose de calculer, par exemple, P(24 ¶ X ¶ 26) en prenant pour approximation de la loi binomiale B(50, 21 ) suivie par X, la loi normale N (25, p52 ).
1. Quelle est la loi de U =
X − 25
5
p
2
?
2. Calculer P(24 ¶ X ¶ 26).
3. Mais ce résultat n’est pas satisfaisant, car on lit sur le diagramme en bâtons de la loi binomiale que les
nombres P(X = 24), P(X = 25), P(X = 26) sont tous trois supérieurs à 0, 1. Donc P(24 ¶ X ¶ 26) =
P(X = 24) + P(X = 25) + P(X = 26) > 0, 3. Et le calcul précédent donne P(24 ¶ X ¶ 26) = 0, 223 .
Il faut donc améliorer la façon dont on passe d’une variable aléatoire discrète (ici binomiale) à une
variable aléatoire continue (ici normale), en se souvenant qu’en statistique on a effectué la démarche
inverse. Ici, on va adopter le même point de vue, mais dans l’autre sens : on remplace, par exemple, 25
par l’intervalle [24, 5; 25, 5], 24 par [23, 5; 24, 5] et 26 par [25, 5; 26, 5]. Ainsi, on remplace l’ensemble
{24,25,26} des trois valeurs considérées pour la variable aléatoire discrète par l’intervalle [23, 5; 26, 5].
Définition
C’est la correction de continuité qui consiste à remplacer tout nombre entier k par un intervalle
d’extrémités k − 12 et k + 21 .
Calculer P(23, 5 ¶ X ¶ 26, 5).
Ce nouveau résultat est-il en accord avec les observations graphiques ?
Remarque
On peut de même être amené à approcher une loi de Poisson par une loi normale (hors programme).
BTSA
37
Cours
✍ MÉTHODE 37
Dans le cadre de la fabrication de soja génétiquement modifié, le laboratoire d’une firme agronomique
tente chaque jour l’implantation d’un gène étranger dans des cellules de soja afin de le rendre résistant
à certains insectes. Le taux de réussite d’une implantation est égal à 0,2.
Les cellules utilisées sont toutes issues de souches différentes. On considèrera donc que les essais sont
indépendants.
Partie A
Initialement, le laboratoire a prévu, pour des raisons de coût, de répéter cette opération 20 fois par jour.
On note X la variable aléatoire prenant pour valeurs le nombre d’implantations réussies lors de ces 20
essais.
1. Déterminer la loi de X (justifier la réponse).
2. Quelle est la probabilité que pendant une journée donnée le laboratoire :
(a) ne réussisse aucune implantation ?
(b) réussisse au moins deux implantations ?
Partie B
Afin d’affiner ses recherches, le laboratoire décide maintenant de faire 100 implantations par jour. On
note Y la variable aléatoire prenant pour valeurs le nombre d’implantations réussies lors de 100 essais.
1. Par quelle loi continue peut-on approcher la loi de Y (justifier la réponse) ?
2. Calculer, en utilisant cette approximation, la probabilité P(19 < Y < 31).
4.3.4 Champ d’intervention de la loi normale
Une loi normale intervient dans la modélisation de phénomènes aléatoires possédant de nombreuses
causes indépendantes dont les effets s’ajoutent, sans que l’un d’eux soit dominant.
Compte tenu de la complexité des phénomènes économiques et sociaux, agronomiques, biologiques, etc.,
la loi normale intervient dans tous les secteurs.
Comme une loi normale est définie par la donnée de deux paramètres µ et σ, on peut la prendre pour
modèle dans des phénomènes où des études statistiques préliminaires conduisent à des histogrammes très
différents. En effet, pour une même valeur quelconque de µ, on peut avoir des courbes variées.
µ
µ
µ
On peut même utiliser une loi normale pour une variable aléatoire mesurant une quantité ne variant pas
aléatoirement dans R mais dans une partie de R seulement, par exemple [0; +∞[ ou ]0; 30].
C’est le cas en particulier lorsque X mesure un prix, une longueur ou une masse.
Ainsi, en contrôle de qualité, il est a priori étonnant d’envisager le calcul de la probabilité d’événements
tels que X ¶ −4, X > 100, lorsque X mesurant une longueur, suit la loi normale de moyenne µ = 20 cm et
d’écart type a = 2 cm ; il est en effet impossible, dans une même chaîne de fabrication, d’obtenir un produit
de longueur −5 cm ou 120 cm.
Š
€
<
−12
= Φ(−12) = 1 − Φ(12) ≃ 0.
Avec la loi normale, on obtient : P(X ¶ −4) = P X−20
2
De même P(X > 100) = 1 − Φ(40) ≃ 0.
Ces résultats sont compatibles avec la réalité.
En revanche, il peut être imprudent de choisir pour modèle une loi normale lorsqu’une étude statistique
préalable débouche sur un petit nombre de classes de grande amplitude.
Enfin, lorsque les effets de nombreuses causes indépendantes sont multiplicatifs, la loi normale ne constitue pas un bon modèle. Il est préférable de s’orienter vers une autre loi, par exemple la loi « log-normale ».
Cours
38
BTSA
✍ MÉTHODE 38
Une entreprise fabrique industriellement des pots de crème. On désigne par X la variable aléatoire
prenant pour valeurs le poids exprimé en grammes d’un pot prélevé au hasard dans la production.
On suppose que X est distribuée selon une loi normale de moyenne µ et d’écart type 8.
1. Pour cette question µ = 200.
(a) Quelle est la probabilité qu’un élément pris au hasard ait une masse supérieure à 212 g ?
(b) Quelle est la probabilité qu’un élément pris au hasard ait une masse comprise entre 190 g et
216 g ?
2. Pour cette question, µ est inconnu.
(a) Déterminer la valeur du nombre réel positif a tel que le pourcentage de pots ayant une masse
appartenant à l’intervalle [µ − a, µ + a] soit de 95%.
(b) Quelle doit être la valeur de µ pour que 6% des pots fabriqués aient une masse inférieure à
183 g ?
Téléchargement