5 Lois discrètes usuelles

publicité
5 Lois discrètes usuelles
5.1 Loi discrète uniforme
Définition 1 X est une variable aléatoire qui prend les valeurs x1 x2 xn , si pour
1
tout i on a pi , alors la distribution de la variable aéatoire X est dite uniforme.
n
Exemple
On considère le lancé d’un dé, la variable aléatoire représentant le résultat obtenu
suit une loi uniformément distribuée :
1
P X i i 1 6 6
Caractéristiques de la loi uniforme
- Loi de probabilité :
PX
i
pi
1
n
- Moyenne :
mX
n
∑ p i xi
E X
i 1
1 n
xi
n i∑
1
- Variance :
vX
E X
mX E X 2 ∑ pi x2i 2
n
i 1
E X 2
m2X
1 n 2
xi m2X
n i∑
1
Exemple d’application
On considère que dans une espèce animale deux gènes α et β, indépendants, se traduisent
morphologiquement par la présence de rayures sur la coquille de l’animal. Le gène α a deux
allèles A et a et β a deux allèles B et b, tels que A domine a et B domine b.
La traduction morphologique du génotype est la suivante :
Génotypes
Phénotypes
aabb
Aabb ou AAbb
aaBb ou aaBB
AaBb ou AABb ou AaBB ou AABB
aucune rayure
une rayure
deux rayures
trois rayures
Soit X la variable aléatoire “nombre de rayures” et le croisement suivant :
femelle mâle AaBb aabb
Déterminer les caractéristiques de X (Loi, moyenne, variance).
1
Solution
- Les femelles peuvent produire 4 types d’allèles :
B ... AB
A
b ... Ab
B ... aB
a
b ... ab
- Les mâles ne peuvent fournir qu’un seul phénotype : ab.
2
- Les constitutions génétiques des descendants sont donc :
– abab, ou encore aabb, soit X 0,
– abAb, ou encore Aabb, soit X 1,
– abaB, ou encore aaBb, soit X 2,
– abAB, ou encore AaBb, soit X 3.
Chacun des génotypes a la même probabilité d’apparition chez un descendant :
PX
0
PX
1
PX
2
PX
3
1
4
X suit donc une loi uniforme de probabilité 41 d’où :
- Le nombre moyen de rayures par animal descendants est :
mX
1
xi
4∑
E X
0
1
2
3
4
1 5
- La variance est :
1 n 2
xi m2X
n i∑
1
vX
3 2
1
0 1 4 9
4
2
14 9 5 1 25
4
4
1
0 1 2 3
xi 1 5
∑
4
4
vX
5.2 Loi de Bernoulli
Définition 2 Soit une expérience dont le résultat est aléatoire et soit A un évènement
défini sur cette expérience. Soit X la variable aléatoire prenant la valeur 1 quand A est
réalisé et 0 quand Ā est réalisé. On dit que X est une variable de Bernoulli s’il existe
p et q dans vérifiant :
PX
PX
1
0
p
p
q
q
1
On dit également que X suit une loi de Bernoulli B 0 1 p .
- Autre Définition : Une variable de Bernoulli traduit une expérience aléatoire
ayant deux issues possibles et effectuée une seule fois. B 0 1 p est la loi de
Bernoulli de paramètre p :
P X
PX
- Par convention, p (0 p
la probabilité d’échec.
0
1
1 p q
p
1) est la probabilité de succès alors que q 1 p est
3
Exemples
- Lancer d’une pièce de monnaie :
– A : pile
– Ā :face
– p q 12
- Suite de lancers de dé :
– A 1 6
– Ā 2 3 4 5
– p 13 et q 23
4
- Croisement d’hétérozygotes Bb. L’issu du croisement est un phénotype B (évènement A) ou b (évènement contraire Ā) :
– A BB Bb bB
– Ā b b
– p 34 et q 14
Caractéristiques de la loi de Bernoulli
- Loi de probabilité :
PX
PX
1
0
p
q 1 p
- Moyenne :
mX
n
∑ p i xi
E X
i 1
p
1
q
0
p
- Variance :
vX
E X
mX E X 2 ∑ pi x2i 2
n
i 1
E X 2
m2X
p p2
p 1 q
pq
5.3 Loi Binomiale
Définition 3 Considérons un schéma de Bernoulli de probabilité p. Le nombre de succès au cours d’une série de n épreuves est une variable aléatoire X. La loi de probabilité de cette variable aléatoire est par définition la loi binomiale B 0 n p .
Exemples
- Nombre de pile lors de n lancers d’une pièce de monnaie
- Nombre de 6 obtenu lors de n lancers successifs d’un dé
- Nombre d’individu obtenus de phénotype B parmi les n descendants d’un croisement Bb Bb
5
Caractéristiques de la loi Binomiale
- Loi de probabilité :
PX
n x
p
x
x
- Moyenne :
mX
E X
np
- Variance :
vX
E X
mX 2
E X 2 npq
E X 2
où nx x! nn! x ! est le coefficient binomial, c’est à dire le nombre de combinaisons de
x éléments choisis parmi n.
0.7
0.35
0.6
0.3
0.5
0.25
B(0,1,0.3)
0.2
B(0,4,0.3)
B(0,8,0.3)
0.15
B(0,16,0.3)
0.4
0.3
0.2
0.1
0.1
0.05
0
B(0,10,0.2)
B(0,10,0.5)
B(0,10,0.8)
0
0
2
4
6
8
10
12
14
16
0
2
4
6
8
10
F IG . 1 – Exemples de lois binomiales pour différentes valeurs des paramètres n et p.
Exemple d’application
Un laboratoire doit analyser N échantillons E1 E2 EN pour déterminer ceux qui contiennent
un corps C. C est présent dans l’un quelconque des échantillons Ei avec la probabilité p. Pour
faire un nombre d’analyses inférieur à N, on utilise le protocole suivant :
- On répartit les N échantillons en k groupes de n (N kn) ;
- Pour un groupe, on réalise un prélèvement dans chacun des échantillons.
- Les prélèvements sont mélangés, on crée ainsi un nouvel échantillon qu’on soumet à
l’analyse (cet échantillon “résume le groupe”).
- Si le résultat est positif on analyse séparément chacun des échantillons du groupe.
Question : Combien d’analyses sont effectuées en moyenne ?
6
Solution
- X désigne la variable aléatoire : “Nombre d’analyses effectuées” ;
- Pour chaque groupe, A est l’évènement : “Un, au moins des échantillons contient
C”.
- Y désigne la variable aléatoire : “Nombre de réalisation de A dans les k groupes.
- On a : X
k
nY
Y suit la loi binomiale B 0 k pA Déterminer pA et en déduire les caractéristiques
de Y puis de X.
La probabilité qu’aucun des n échantillons d’un goupe ne contienne le corps C est :
pA¯ qn
D’où :
pA
Alors :
PY
r
k
r
1 qn
1 qn 7
r
1 q
n k r
Comme X
k
nY , on a P X
k N
∑ iP X E X
nr k
k ∑
i
k ∑
nr P Y
k
r , d’où :
nr P X
k
r 0
i k
PY
r
r 0
k
k∑P Y
r 0
k
r 0
k
nE Y k
nk 1 qn n ∑ rP Y
r
8
r
k
nr Prenons par exemple N
200, n 4, k 50 et p 0 05
50 1
40 1
E X
Avec n 5, on a :
E X
4
5
4 1 0 95 5 1 0 95 87 14
85 28
Le gain de travail, grâce à ce protocole est, en moyenne, très important lorsque p est
petite.
translation d’une loi Binomiale
Définition 4 Si l’on ajoute un
paramètre entier positif d de translation tel que d
on définit la loi binomiale B d n p :
PX
mX
d
n d x d n
p q
x d
vX n d pq
x
n d p
x
x d d
1 d
n,
n
0.25
0.2
0.15
B(0,10,0.5)
B(5,15,0.5)
0.1
0.05
0
0
2
4
6
8
10
12
14
F IG . 2 – Exemples de lois binomiales pour différentes valeurs du paramètre de translation d.
Pour une loi B d n p lité p (Figure 2) :
– si p 0 5 alors γ1
– si p 0 5 alors γ1 – si p 0 5 alors γ1
, le signe du coefficient d’asymétrie γ1 dépend de la probabi0 (loi étalée à droite),
0 (loi symétrique),
0 (loi étalée à gauche).
5.4 Temps d’attente : Loi géométrique
5.4.1 Le modèle
Soit une urne contenant une proportion p de boules blanches et q 1 p de boules
noires. On tire des boules une à une avec remise. On note X le rang d’apparition de la
9
première boule blanche. X est le temps d’attente de la 1ère boule blanche.
5.4.2 Définition
Définition
5 On dit d’une variable aléatoire X suit une loi géométrique de paramètre
p, G 0 p , si on a :
P X k pqk 1
Caractéristiques de la loi géométrique
- Loi de probabilité :
PX
x
pqx 1
- Moyenne :
mX
1
p
E X
- Variance :
vX
E X
2
mX E X 2 q
p2
E X 2
Exemples
Dans une population de vanneaux, la probabilité de décès d’un oiseau au cours
d’une année est constante et égale à 1 3, quel est l’âge moyen d’un oiseau ?
Solution
La durée de vie X d’un oiseau suit une distribution géométrique. Et l’on peut écrire :
PX
n
pqn 1
Avec q 2 3 et p 1 3, ainsi la probabilité qu’un vanneau meure à deux ans est :
PX
n
2
3
1
3
2
9
La durée moyenne de vie d’un vanneau est alors :
mX
E X
10
1
p
3 ans
5.5 Loi binomiale négative
Définition 6 Considérons un schéma de Bernoulli de probabilité p.
- Le nombre d’épreuves pour obtenir r succès est une variable aléatoire X. La
loi de probabilité
de cette variable aléatoire est par définition la loi binomiale
négative NB r r p .
- Si r est un entier strictement positif, NB 0 r p est la loi du nombre d’échecs
avant d’avoir r
- pour d quelconque, on note la loi binomiale négative NB d r p .
Différences entre la loi binomiale et la loi binomiale négative NB d r p Dans le cadre d’une suite d’épreuves de Bernoulli indépendantes,
- la loi binomiale B 0 n p joue donc le rôle de loi de comptage
- la loi binomiale négative NB r r p joue le rôle de loi d’intervalle (de temps si
l’on assimile une épreuve de Bernoulli à une unité de temps).
- Importance prise par ces notions de loi de comptage et de loi d’intervalle dans
les processus stochastiques.
Caractéristiques de la loi binomiale négative NB d r p - Loi de probabilité :
PX
x
x d r 1 r x
pq
r 1
- Moyenne :
mX
rq
p
d
- Variance :
vX
11
rq
p2
d
x d d
1 - Une loi NB d r p est toujours étalée à droite et le coefficient d’asymétrie γ 1 est
donc toujours positif.
0.5
0.8
0.7
0.4
0.6
0.5
0.3
NB(0,1,0.5)
NB(5,1,0.5)
0.2
NB(0,0.5,0.5)
NB(0,1,0.5)
NB(0,3,0.5)
NB(0,6,0.5)
0.4
0.3
0.2
0.1
0.1
0
0
0
2
4
6
8
10
12
14
0
5
10
15
20
0.5
0.4
0.3
NB(0,2,0.7)
NB(0,2,0.5)
NB(0,2,0.3)
0.2
0.1
0
0
5
10
15
20
25
F IG . 3 – Exemples de lois de binomiale négative pour différentes valeurs du paramètre
de translation d, du paramètre r et de la probabilité p.
Exemple
Modélisation de la présence de la molécule d’alanine dans la structure du lisozyme
(protéine) chez l’homme :
1
31
61
91
121
K
L
S
D
R
V
A
R
A
Q
F
K
Y
V
Y
E
W
W
A
V
R
E
C
C
Q
C
S
N
A
G
E
G
D
K
C
L
Y
G
R
G
A
N
K
V
V
R
T
T
R
T
R
P
D
L
A
G
P
K
T
A
Q
R
N
V
G
L
Y
N
I
G
N
A
R
M
A
C
A
D
G
H
W
G
D
L
Y
Y
R
S
A
R
S
C
W
G
T
S
R
I
D
A
N
S
Y
L
R
L
G
L
C
A
I
Q
Q
N
F
D
N
W
Q
N
R
M
I
I
D
C
N
A
V
Composition :
A
R
N
D
C
S
V
(alanine)
(arginine)
(asparagine)
(ac. aspart.)
(cystéine)
(sérine)
(valine)
14
14
10
8
8
6
8
Q
E
G
H
I
T
(glutamine)
(ac.glutam.)
(glycine)
(histidine)
(isoleucine)
(thréonine)
6
3
11
1
5
5
L
K
M
F
P
W
(leucine)
(lysine)
(méthionine)
(phénylalanine)
(proline)
(tryptophane)
8
5
2
2
2
5
Nombre total de résidus : 129
Soit Xk la v.a. : “nombre d’acides aminés lus jusqu’à la k-ième rencontre avec une
molécule d’alanine”.
Question 1 : Déterminer les valeurs prises par les variables aléatoires Xk , en déduire
les valeurs moyennes xk pour les différentes valeurs de k (on prendra k 7).
Question 2 : On supopse que la synthèse du lisozyme s’effectue selon un schéma
de Bernoulli.
1. On suppose tout d’abord que la probabilité de tirer un acide aminé est la même
pour les 20 acides aminés. Déterminer les valeurs moyennes prises par les variables aléatoires Xk théoriques. Que peut on en déduire ?
12
2. On suppose maintenant que les acides aminés sont utilisés proportionnellement
à
leur fréquence dans le sang. On se pose les mêmes questions, avec P A 0 16.
Solution
Valeurs observées de Xk pour k
k
k
k
k
k
k
k
1
2
3
4
5
6
7
X1
X2
X3
X4
X5
X6
X7
:
:
:
:
:
:
:
7
9 17 6 10 5 26 3 7 7 2 2 2 11 3 26 16 31 10 9 4 14 32 41 17 6 42 41 13 47 45 73 23 76 34 Questions 1
Xk suit une loi binomiale négative NB k k p , avec p 1 20.
k
E Xk xk
1
20
7.86
2
40
15.72
3
60
24.00
4
80
32.00
5
100
46.00
6
120
48.00
7
140
55.00
Désaccord entre observation
et modèle. On rejète au moins une des hypothèse per
mettant de calculer E Xk Questions 2
Xk suit une loi binomiale négative NB k k p , avec p 0 16.
k
E Xk xk
1
6.25
7.86
2
12.50
15.72
3
18.75
24.00
4
25.00
32.00
5
31.25
46.00
6
37.50
48.00
7
43.75
55.00
5.5.1 Mémoire d’une loi discrète
Les lois géométriques NB 0 1 p et NB 1 1 p sont les seules lois discrètes sans
mémoire. Pour la loi NB 1 1 p , nous avons :
PX
x
uX
u
pqx u qu
1
pqx 1 PX
x
Interprétation
- On suppose que la variable aléatoire X représente l’intervalle de temps entre 2
événements,
- la loi de l’intervalle de temps X, sachant que le 2ème événement se produit après
l’instant u, ne dépend pas de cet instant, mais uniquement du temps écoulé depuis
cet instant.
13
- Pour NB 0 1 p on a :
PX
x
uX
u
pqx
qu
u
pqx
PX
x
5.6 Loi Hypergéométrique
Définition 7 Soit une urne contenant N boules avec une proportion de p boules blanches
X égale
et de q 1 p boules noires. On tire sans remise n boules. La variable alétoire
au nombre de boules blanches obtenues suit une loi hypergéométrique H N n p .
Caractéristiques de la loi hypergéométrique
- Loi de probabilité :
PX
Np
x
Nq
x n x
N
n
- Moyenne :
mX
E X
np
- Variance :
vX
E X
mX 2
E X 2 E X N n
npq
N 1
2
Exemple d’application
Dans une population de N individus, on prélève a individus que l’on marque et
relâche dans la population. On effectue une seconde capture de n individus. Comment
faire pour déterminer N ?
Solution
- Soit X le nombre d’individus marqués parmi les n capturés.
- X suit une loi hypergéométrique.
- Idée, estimée N à partir des valeurs expérimentales de X.
- La méthode est appelée méthode de dilution ou de capture-recapture.
X suit une loi hypergéométrique de parmètre N n p, d’où :
PN X
k
Np
Nq
k n k
N
n
14
Expérimentalement on relève la valeur a N p (ou b N a) d’où :
PN X
On choisit N tel que PN X
semblance).
On considère le rapport :
a
b
k n k
k
N
n
k soit maximum (méthode du maximum de vrais
PN X k PN 1 X k En supposant qu’on a relevé a, alors pour calculer PN , b N a et pour calculer
PN 1 , b N 1 a :
a N a
k n k PN X k PN 1 X k N a
N a n k
N 2 an nN
N 2 aN nN
- Le rapport
PN X k PN 1 X k est
- Le rapport
PN X k PN 1 X k est
- d’où PN X
1 si N
N 1
n a N 1 a
k n k N n
N
n
1 si N
N
an
kN
na k ;
na k ;
k est maximal pour N
na k.
Application Au cours d’une première capture on prélève a 160 vairons que
l’on marque et relâche. Au cours de la seconde capture, n 150 vairons sont prélevés dont 15 marqués. On estime donc à
N
160
150
15
1600
le nombre total de vairons.
5.7 Loi de Poisson
Définition 8 Soit X une variable aléatoire pouvant prendre toutes les valeurs entières
0 1 n vérifiant :
e λ λx
P X x x!
On dit que X suit une loi de Poisson P 0 λ de paramètre λ.
15
Caractéristiques de la loi de Poisson
- Loi de probabilité :
PX
e λ λx
x!
x
- Moyenne :
mX
E X
λ
- Variance :
vX
E X
E X 2 λ
2
mX E X 2
translation d’une loi de Poisson
Définition 9 Si l’on ajoute un paramètre entier positif d de translation, on définit la
loi de Poisson P d λ :
PX
e λ λx d
x d !
d λ
λ
x
mX
vX
0.2
0.4
0.15
0.3
P(0,4)
P(5,4)
0.1
x d d
1 P(0,1)
P(0,2)
P(0,4)
P(0,8)
0.2
0.1
0.05
0
0
0
2
4
6
8
10
12
14
16
0
2
4
6
8
10
12
14
16
18
F IG . 4 – Exemples de lois de Poissons pour différentes valeurs des paramètres d et λ.
Pour une loi
P d λ , le signe du coefficient d’asymétrie γ1 est toujours positif.
Une loi P d λ est donc toujours étalée à droite.
16
5.7.1 Illustration du modèle
- Nombre de véhicules franchissant un poste de péage pendant une péridode de
durée T .
- Nombre de défauts dont est affecté un objet qui est fabriqué en série.
- Nombre d’oeufs podnus au cours d’une ponte par certaines espèces animales.
- ...
Exemples
On suppose que le nombre d’oeufs podnus par un insecte suit une loi de Poisson de
paramètre λ. On suppose également que les oeufs pondus sont mutuellement indépendants et que la probabilité de développement d’un oeuf est p. Quelle est la probabilité
pour que, parmi les oeufs pondus, il y ait exactement k survivants ?
Remarque : On rappelle que
∞ ∑
λ
0
q
j!
j
eλq
Solution
Il y a k survivants si et seulement si :
Le nombre d’oeufs pondus est supérieur (ou égal) à k.
On suppose que l’insecte ponds n oeufs, avec n k.
La probabilité pour que l’insecte ponde n oeufs est :
PX
n
e λ λn
n!
Soit Y la variable aléatoire : nombre d’oeufs qui se développent parmi n oeufs
pondus.
Soit A l’évènement :”l’oeuf considérer se développe”.
Y suit une loi binomiale B n p , d’où :
PY
k
n k n
pq
k
k
La probabilité pour que l’insecte ponde n oeufs et que parmi ces n oeufs, k se
développe est :
λn
n k n k
e λ
pq
n!
k
On considère l’évènement : “k oeufs survivent.”
Cet évènement peut se réalsier d’une infinité de manières :
- l’insecte pond n k oeufs et tous survivent.
- l’insecte pond n k
- l’insecte pond n
k
1 oeufs et tous survivent sauf un.
2 oeufs et tous survivent sauf deux.
17
- etc.
P k survivants ∞
λλ
∑ e
λ k
e
p
pλ k!
λ
e
λn
n!
qn n!
k!
n
k
!
k
∑
k!
∞
λn k n q
n k !
n k
k ∞
∑
j 0
k
∑
n
k
p λk ∞
λ
e
n k n
pq
k
n!
n k
n
k
k
qλ j
j !
pλ k λq
e λ
e
k!
pλ k
e λ λq
k!
pλ k
e λp
k!
Il s’agit donc d’une loi de poisson de paramètre λp
P k survivants e
λp
pλ k!
k
5.8 Approximation de la loi binomiale
On montre que :
n k n
pq
k
k
e
np
np k!
k
On en déduit
que si Xn est une suite de variables aléatoires telles que pour tout n,
Xn suit une B n p , alors Xn converge en loi vers une variable aléatoire discrète X qui
suit une loi de Poisson P np .
Utilisation pratique
Si n est grand et p assez petit, on peut remplacer
la loi binomilae B n p par la loi
de Poisson de même espérance mathématique P np .
En pratique, on admet cette approximation satisfaisante pour n 30 et p 0 1.
18
Téléchargement