5 Lois discrètes usuelles 5.1 Loi discrète uniforme Définition 1 X est une variable aléatoire qui prend les valeurs x1 x2 xn , si pour 1 tout i on a pi , alors la distribution de la variable aéatoire X est dite uniforme. n Exemple On considère le lancé d’un dé, la variable aléatoire représentant le résultat obtenu suit une loi uniformément distribuée : 1 P X i i 1 6 6 Caractéristiques de la loi uniforme - Loi de probabilité : PX i pi 1 n - Moyenne : mX n ∑ p i xi E X i 1 1 n xi n i∑ 1 - Variance : vX E X mX E X 2 ∑ pi x2i 2 n i 1 E X 2 m2X 1 n 2 xi m2X n i∑ 1 Exemple d’application On considère que dans une espèce animale deux gènes α et β, indépendants, se traduisent morphologiquement par la présence de rayures sur la coquille de l’animal. Le gène α a deux allèles A et a et β a deux allèles B et b, tels que A domine a et B domine b. La traduction morphologique du génotype est la suivante : Génotypes Phénotypes aabb Aabb ou AAbb aaBb ou aaBB AaBb ou AABb ou AaBB ou AABB aucune rayure une rayure deux rayures trois rayures Soit X la variable aléatoire “nombre de rayures” et le croisement suivant : femelle mâle AaBb aabb Déterminer les caractéristiques de X (Loi, moyenne, variance). 1 Solution - Les femelles peuvent produire 4 types d’allèles : B ... AB A b ... Ab B ... aB a b ... ab - Les mâles ne peuvent fournir qu’un seul phénotype : ab. 2 - Les constitutions génétiques des descendants sont donc : – abab, ou encore aabb, soit X 0, – abAb, ou encore Aabb, soit X 1, – abaB, ou encore aaBb, soit X 2, – abAB, ou encore AaBb, soit X 3. Chacun des génotypes a la même probabilité d’apparition chez un descendant : PX 0 PX 1 PX 2 PX 3 1 4 X suit donc une loi uniforme de probabilité 41 d’où : - Le nombre moyen de rayures par animal descendants est : mX 1 xi 4∑ E X 0 1 2 3 4 1 5 - La variance est : 1 n 2 xi m2X n i∑ 1 vX 3 2 1 0 1 4 9 4 2 14 9 5 1 25 4 4 1 0 1 2 3 xi 1 5 ∑ 4 4 vX 5.2 Loi de Bernoulli Définition 2 Soit une expérience dont le résultat est aléatoire et soit A un évènement défini sur cette expérience. Soit X la variable aléatoire prenant la valeur 1 quand A est réalisé et 0 quand Ā est réalisé. On dit que X est une variable de Bernoulli s’il existe p et q dans vérifiant : PX PX 1 0 p p q q 1 On dit également que X suit une loi de Bernoulli B 0 1 p . - Autre Définition : Une variable de Bernoulli traduit une expérience aléatoire ayant deux issues possibles et effectuée une seule fois. B 0 1 p est la loi de Bernoulli de paramètre p : P X PX - Par convention, p (0 p la probabilité d’échec. 0 1 1 p q p 1) est la probabilité de succès alors que q 1 p est 3 Exemples - Lancer d’une pièce de monnaie : – A : pile – Ā :face – p q 12 - Suite de lancers de dé : – A 1 6 – Ā 2 3 4 5 – p 13 et q 23 4 - Croisement d’hétérozygotes Bb. L’issu du croisement est un phénotype B (évènement A) ou b (évènement contraire Ā) : – A BB Bb bB – Ā b b – p 34 et q 14 Caractéristiques de la loi de Bernoulli - Loi de probabilité : PX PX 1 0 p q 1 p - Moyenne : mX n ∑ p i xi E X i 1 p 1 q 0 p - Variance : vX E X mX E X 2 ∑ pi x2i 2 n i 1 E X 2 m2X p p2 p 1 q pq 5.3 Loi Binomiale Définition 3 Considérons un schéma de Bernoulli de probabilité p. Le nombre de succès au cours d’une série de n épreuves est une variable aléatoire X. La loi de probabilité de cette variable aléatoire est par définition la loi binomiale B 0 n p . Exemples - Nombre de pile lors de n lancers d’une pièce de monnaie - Nombre de 6 obtenu lors de n lancers successifs d’un dé - Nombre d’individu obtenus de phénotype B parmi les n descendants d’un croisement Bb Bb 5 Caractéristiques de la loi Binomiale - Loi de probabilité : PX n x p x x - Moyenne : mX E X np - Variance : vX E X mX 2 E X 2 npq E X 2 où nx x! nn! x ! est le coefficient binomial, c’est à dire le nombre de combinaisons de x éléments choisis parmi n. 0.7 0.35 0.6 0.3 0.5 0.25 B(0,1,0.3) 0.2 B(0,4,0.3) B(0,8,0.3) 0.15 B(0,16,0.3) 0.4 0.3 0.2 0.1 0.1 0.05 0 B(0,10,0.2) B(0,10,0.5) B(0,10,0.8) 0 0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 F IG . 1 – Exemples de lois binomiales pour différentes valeurs des paramètres n et p. Exemple d’application Un laboratoire doit analyser N échantillons E1 E2 EN pour déterminer ceux qui contiennent un corps C. C est présent dans l’un quelconque des échantillons Ei avec la probabilité p. Pour faire un nombre d’analyses inférieur à N, on utilise le protocole suivant : - On répartit les N échantillons en k groupes de n (N kn) ; - Pour un groupe, on réalise un prélèvement dans chacun des échantillons. - Les prélèvements sont mélangés, on crée ainsi un nouvel échantillon qu’on soumet à l’analyse (cet échantillon “résume le groupe”). - Si le résultat est positif on analyse séparément chacun des échantillons du groupe. Question : Combien d’analyses sont effectuées en moyenne ? 6 Solution - X désigne la variable aléatoire : “Nombre d’analyses effectuées” ; - Pour chaque groupe, A est l’évènement : “Un, au moins des échantillons contient C”. - Y désigne la variable aléatoire : “Nombre de réalisation de A dans les k groupes. - On a : X k nY Y suit la loi binomiale B 0 k pA Déterminer pA et en déduire les caractéristiques de Y puis de X. La probabilité qu’aucun des n échantillons d’un goupe ne contienne le corps C est : pA¯ qn D’où : pA Alors : PY r k r 1 qn 1 qn 7 r 1 q n k r Comme X k nY , on a P X k N ∑ iP X E X nr k k ∑ i k ∑ nr P Y k r , d’où : nr P X k r 0 i k PY r r 0 k k∑P Y r 0 k r 0 k nE Y k nk 1 qn n ∑ rP Y r 8 r k nr Prenons par exemple N 200, n 4, k 50 et p 0 05 50 1 40 1 E X Avec n 5, on a : E X 4 5 4 1 0 95 5 1 0 95 87 14 85 28 Le gain de travail, grâce à ce protocole est, en moyenne, très important lorsque p est petite. translation d’une loi Binomiale Définition 4 Si l’on ajoute un paramètre entier positif d de translation tel que d on définit la loi binomiale B d n p : PX mX d n d x d n p q x d vX n d pq x n d p x x d d 1 d n, n 0.25 0.2 0.15 B(0,10,0.5) B(5,15,0.5) 0.1 0.05 0 0 2 4 6 8 10 12 14 F IG . 2 – Exemples de lois binomiales pour différentes valeurs du paramètre de translation d. Pour une loi B d n p lité p (Figure 2) : – si p 0 5 alors γ1 – si p 0 5 alors γ1 – si p 0 5 alors γ1 , le signe du coefficient d’asymétrie γ1 dépend de la probabi0 (loi étalée à droite), 0 (loi symétrique), 0 (loi étalée à gauche). 5.4 Temps d’attente : Loi géométrique 5.4.1 Le modèle Soit une urne contenant une proportion p de boules blanches et q 1 p de boules noires. On tire des boules une à une avec remise. On note X le rang d’apparition de la 9 première boule blanche. X est le temps d’attente de la 1ère boule blanche. 5.4.2 Définition Définition 5 On dit d’une variable aléatoire X suit une loi géométrique de paramètre p, G 0 p , si on a : P X k pqk 1 Caractéristiques de la loi géométrique - Loi de probabilité : PX x pqx 1 - Moyenne : mX 1 p E X - Variance : vX E X 2 mX E X 2 q p2 E X 2 Exemples Dans une population de vanneaux, la probabilité de décès d’un oiseau au cours d’une année est constante et égale à 1 3, quel est l’âge moyen d’un oiseau ? Solution La durée de vie X d’un oiseau suit une distribution géométrique. Et l’on peut écrire : PX n pqn 1 Avec q 2 3 et p 1 3, ainsi la probabilité qu’un vanneau meure à deux ans est : PX n 2 3 1 3 2 9 La durée moyenne de vie d’un vanneau est alors : mX E X 10 1 p 3 ans 5.5 Loi binomiale négative Définition 6 Considérons un schéma de Bernoulli de probabilité p. - Le nombre d’épreuves pour obtenir r succès est une variable aléatoire X. La loi de probabilité de cette variable aléatoire est par définition la loi binomiale négative NB r r p . - Si r est un entier strictement positif, NB 0 r p est la loi du nombre d’échecs avant d’avoir r - pour d quelconque, on note la loi binomiale négative NB d r p . Différences entre la loi binomiale et la loi binomiale négative NB d r p Dans le cadre d’une suite d’épreuves de Bernoulli indépendantes, - la loi binomiale B 0 n p joue donc le rôle de loi de comptage - la loi binomiale négative NB r r p joue le rôle de loi d’intervalle (de temps si l’on assimile une épreuve de Bernoulli à une unité de temps). - Importance prise par ces notions de loi de comptage et de loi d’intervalle dans les processus stochastiques. Caractéristiques de la loi binomiale négative NB d r p - Loi de probabilité : PX x x d r 1 r x pq r 1 - Moyenne : mX rq p d - Variance : vX 11 rq p2 d x d d 1 - Une loi NB d r p est toujours étalée à droite et le coefficient d’asymétrie γ 1 est donc toujours positif. 0.5 0.8 0.7 0.4 0.6 0.5 0.3 NB(0,1,0.5) NB(5,1,0.5) 0.2 NB(0,0.5,0.5) NB(0,1,0.5) NB(0,3,0.5) NB(0,6,0.5) 0.4 0.3 0.2 0.1 0.1 0 0 0 2 4 6 8 10 12 14 0 5 10 15 20 0.5 0.4 0.3 NB(0,2,0.7) NB(0,2,0.5) NB(0,2,0.3) 0.2 0.1 0 0 5 10 15 20 25 F IG . 3 – Exemples de lois de binomiale négative pour différentes valeurs du paramètre de translation d, du paramètre r et de la probabilité p. Exemple Modélisation de la présence de la molécule d’alanine dans la structure du lisozyme (protéine) chez l’homme : 1 31 61 91 121 K L S D R V A R A Q F K Y V Y E W W A V R E C C Q C S N A G E G D K C L Y G R G A N K V V R T T R T R P D L A G P K T A Q R N V G L Y N I G N A R M A C A D G H W G D L Y Y R S A R S C W G T S R I D A N S Y L R L G L C A I Q Q N F D N W Q N R M I I D C N A V Composition : A R N D C S V (alanine) (arginine) (asparagine) (ac. aspart.) (cystéine) (sérine) (valine) 14 14 10 8 8 6 8 Q E G H I T (glutamine) (ac.glutam.) (glycine) (histidine) (isoleucine) (thréonine) 6 3 11 1 5 5 L K M F P W (leucine) (lysine) (méthionine) (phénylalanine) (proline) (tryptophane) 8 5 2 2 2 5 Nombre total de résidus : 129 Soit Xk la v.a. : “nombre d’acides aminés lus jusqu’à la k-ième rencontre avec une molécule d’alanine”. Question 1 : Déterminer les valeurs prises par les variables aléatoires Xk , en déduire les valeurs moyennes xk pour les différentes valeurs de k (on prendra k 7). Question 2 : On supopse que la synthèse du lisozyme s’effectue selon un schéma de Bernoulli. 1. On suppose tout d’abord que la probabilité de tirer un acide aminé est la même pour les 20 acides aminés. Déterminer les valeurs moyennes prises par les variables aléatoires Xk théoriques. Que peut on en déduire ? 12 2. On suppose maintenant que les acides aminés sont utilisés proportionnellement à leur fréquence dans le sang. On se pose les mêmes questions, avec P A 0 16. Solution Valeurs observées de Xk pour k k k k k k k k 1 2 3 4 5 6 7 X1 X2 X3 X4 X5 X6 X7 : : : : : : : 7 9 17 6 10 5 26 3 7 7 2 2 2 11 3 26 16 31 10 9 4 14 32 41 17 6 42 41 13 47 45 73 23 76 34 Questions 1 Xk suit une loi binomiale négative NB k k p , avec p 1 20. k E Xk xk 1 20 7.86 2 40 15.72 3 60 24.00 4 80 32.00 5 100 46.00 6 120 48.00 7 140 55.00 Désaccord entre observation et modèle. On rejète au moins une des hypothèse per mettant de calculer E Xk Questions 2 Xk suit une loi binomiale négative NB k k p , avec p 0 16. k E Xk xk 1 6.25 7.86 2 12.50 15.72 3 18.75 24.00 4 25.00 32.00 5 31.25 46.00 6 37.50 48.00 7 43.75 55.00 5.5.1 Mémoire d’une loi discrète Les lois géométriques NB 0 1 p et NB 1 1 p sont les seules lois discrètes sans mémoire. Pour la loi NB 1 1 p , nous avons : PX x uX u pqx u qu 1 pqx 1 PX x Interprétation - On suppose que la variable aléatoire X représente l’intervalle de temps entre 2 événements, - la loi de l’intervalle de temps X, sachant que le 2ème événement se produit après l’instant u, ne dépend pas de cet instant, mais uniquement du temps écoulé depuis cet instant. 13 - Pour NB 0 1 p on a : PX x uX u pqx qu u pqx PX x 5.6 Loi Hypergéométrique Définition 7 Soit une urne contenant N boules avec une proportion de p boules blanches X égale et de q 1 p boules noires. On tire sans remise n boules. La variable alétoire au nombre de boules blanches obtenues suit une loi hypergéométrique H N n p . Caractéristiques de la loi hypergéométrique - Loi de probabilité : PX Np x Nq x n x N n - Moyenne : mX E X np - Variance : vX E X mX 2 E X 2 E X N n npq N 1 2 Exemple d’application Dans une population de N individus, on prélève a individus que l’on marque et relâche dans la population. On effectue une seconde capture de n individus. Comment faire pour déterminer N ? Solution - Soit X le nombre d’individus marqués parmi les n capturés. - X suit une loi hypergéométrique. - Idée, estimée N à partir des valeurs expérimentales de X. - La méthode est appelée méthode de dilution ou de capture-recapture. X suit une loi hypergéométrique de parmètre N n p, d’où : PN X k Np Nq k n k N n 14 Expérimentalement on relève la valeur a N p (ou b N a) d’où : PN X On choisit N tel que PN X semblance). On considère le rapport : a b k n k k N n k soit maximum (méthode du maximum de vrais PN X k PN 1 X k En supposant qu’on a relevé a, alors pour calculer PN , b N a et pour calculer PN 1 , b N 1 a : a N a k n k PN X k PN 1 X k N a N a n k N 2 an nN N 2 aN nN - Le rapport PN X k PN 1 X k est - Le rapport PN X k PN 1 X k est - d’où PN X 1 si N N 1 n a N 1 a k n k N n N n 1 si N N an kN na k ; na k ; k est maximal pour N na k. Application Au cours d’une première capture on prélève a 160 vairons que l’on marque et relâche. Au cours de la seconde capture, n 150 vairons sont prélevés dont 15 marqués. On estime donc à N 160 150 15 1600 le nombre total de vairons. 5.7 Loi de Poisson Définition 8 Soit X une variable aléatoire pouvant prendre toutes les valeurs entières 0 1 n vérifiant : e λ λx P X x x! On dit que X suit une loi de Poisson P 0 λ de paramètre λ. 15 Caractéristiques de la loi de Poisson - Loi de probabilité : PX e λ λx x! x - Moyenne : mX E X λ - Variance : vX E X E X 2 λ 2 mX E X 2 translation d’une loi de Poisson Définition 9 Si l’on ajoute un paramètre entier positif d de translation, on définit la loi de Poisson P d λ : PX e λ λx d x d ! d λ λ x mX vX 0.2 0.4 0.15 0.3 P(0,4) P(5,4) 0.1 x d d 1 P(0,1) P(0,2) P(0,4) P(0,8) 0.2 0.1 0.05 0 0 0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16 18 F IG . 4 – Exemples de lois de Poissons pour différentes valeurs des paramètres d et λ. Pour une loi P d λ , le signe du coefficient d’asymétrie γ1 est toujours positif. Une loi P d λ est donc toujours étalée à droite. 16 5.7.1 Illustration du modèle - Nombre de véhicules franchissant un poste de péage pendant une péridode de durée T . - Nombre de défauts dont est affecté un objet qui est fabriqué en série. - Nombre d’oeufs podnus au cours d’une ponte par certaines espèces animales. - ... Exemples On suppose que le nombre d’oeufs podnus par un insecte suit une loi de Poisson de paramètre λ. On suppose également que les oeufs pondus sont mutuellement indépendants et que la probabilité de développement d’un oeuf est p. Quelle est la probabilité pour que, parmi les oeufs pondus, il y ait exactement k survivants ? Remarque : On rappelle que ∞ ∑ λ 0 q j! j eλq Solution Il y a k survivants si et seulement si : Le nombre d’oeufs pondus est supérieur (ou égal) à k. On suppose que l’insecte ponds n oeufs, avec n k. La probabilité pour que l’insecte ponde n oeufs est : PX n e λ λn n! Soit Y la variable aléatoire : nombre d’oeufs qui se développent parmi n oeufs pondus. Soit A l’évènement :”l’oeuf considérer se développe”. Y suit une loi binomiale B n p , d’où : PY k n k n pq k k La probabilité pour que l’insecte ponde n oeufs et que parmi ces n oeufs, k se développe est : λn n k n k e λ pq n! k On considère l’évènement : “k oeufs survivent.” Cet évènement peut se réalsier d’une infinité de manières : - l’insecte pond n k oeufs et tous survivent. - l’insecte pond n k - l’insecte pond n k 1 oeufs et tous survivent sauf un. 2 oeufs et tous survivent sauf deux. 17 - etc. P k survivants ∞ λλ ∑ e λ k e p pλ k! λ e λn n! qn n! k! n k ! k ∑ k! ∞ λn k n q n k ! n k k ∞ ∑ j 0 k ∑ n k p λk ∞ λ e n k n pq k n! n k n k k qλ j j ! pλ k λq e λ e k! pλ k e λ λq k! pλ k e λp k! Il s’agit donc d’une loi de poisson de paramètre λp P k survivants e λp pλ k! k 5.8 Approximation de la loi binomiale On montre que : n k n pq k k e np np k! k On en déduit que si Xn est une suite de variables aléatoires telles que pour tout n, Xn suit une B n p , alors Xn converge en loi vers une variable aléatoire discrète X qui suit une loi de Poisson P np . Utilisation pratique Si n est grand et p assez petit, on peut remplacer la loi binomilae B n p par la loi de Poisson de même espérance mathématique P np . En pratique, on admet cette approximation satisfaisante pour n 30 et p 0 1. 18