Université Pierre & Marie Curie UE LM345 – Probabilités élémentaires Licence de Mathématiques L3 Année 2014–15 TD3. Variables aléatoires discrètes et suites d’événements. 1. Dans une population de n oiseaux, on en capture m que l’on bague puis que l’on relâche. Un peu plus tard, on en capture à nouveau m. a) Soit k ∈ {0, . . . , n}. Quelle est la probabilité que parmi les m oiseaux capturés, k soient bagués ? b) Pour quelle valeur de k la probabilité calculée ci-dessus est-elle maximale ? Solution de l’exercice 1. a) On suppose n ≥ m. On choisit comme univers Ω l’ensemble des tirages possibles de n m oiseaux parmi n, alors |Ω| = m . On munit Ω de la tribu P(Ω) et de la probabilité uniforme, notée P. Ainsi, pour tout événement A de P(Ω), P(A) = |A| . (mn ) Soit k ∈ {0, . . . , n} et Ak , l’événement “parmi les m oiseaux capturés, k sont bagués” ; calculons |Ak |. Pour que Ak soit réalisé, il faut capturer k oiseaux parmi les m oiseaux bagués et m−k oiseaux parmi les n−m restants. Ainsi, il faut que k ≤ m et m−k ≤ n−m, m n−m autrement dit, max{0, 2m − n} ≤ k ≤ m. Alors, |Ak | = k m−k , et m n−m m!2 (n − m)!2 k m−k . = P(Ak ) = n 2 (n − 2m + k)! n!k!(m − k)! m Ceci est un exemple de loi hypergéométrique de paramètres n et m. b) Notons P (n, m, k) cette probabilité la probabilité P(Ak ) et supposons que k est tel que max{0, 2m − n} ≤ k ≤ m, on obtient, en mettant le dénominateur sous forme canonique (en la variable m − k) : P (n, m, k + 1) (m − k)2 (m − k)2 = = . P (n, m, k) (k + 1)(n − 2m + k + 1) (n/2 + 1 − (m − k))2 − (n/2 − m)2 Ce ratio est strictement décroissant en k (en effet, le numérateur est décroissant en k et le dénominateur est croissant en k). Supposons 2m − n ≤ 0 (c’est-à-dire m ≤ n/2, le raisonnement étant analogue dans l’autre cas). Pour k = 0, le quotient est supérieur ou égal à 1, et pour k = m (dernière valeur), il est strictement inférieur à 1. Ainsi, P (n, m, k) est croissant en k jusqu’à un certain max{0, 2m − n} ≤ k0 ≤ m − 1, et ensuite décroissant pour k ≥ k0 (voire décroissant depuis le début si m = n/2). Il reste à déterminer k0 qui va réaliser le maximum de la probabilité. D’après la formule précédente, on a : P (n, m, k + 1) > 1 ⇔ (m − k)2 < (n/2 + 1 − (m − k))2 − (n/2 − m)2 . P (n, m, k) 1 En développant, cela se simplifie en : P (n, m, k + 1) > P (n, m, k) ⇔ (n + 2)k < m2 + 2m − n − 1. Ainsi P (n, m, k) est maximal pour 2 m + 2m − n − 1 (m + 1)2 k = k0 := 1 + = . n+2 n+2 2 est entier, la valeur maximale est réalisée aussi atteinte pour k0 − 1, sinon elle Si (m+1) n+2 n’est atteinte que pour k0 . On n’est pas surpris de constater que la valeur de k maximisant P (n, m, k) est telle que la proportion d’oiseaux bagués k/m capturés la seconde fois est très proche de celle dans la population m/n. 2. Soit X une variable aléatoire à valeurs dans N. Pour tout n ≥ 0, on note pn = P(X = n) et on suppose pn > 0. Soit λ > 0 un réel. Montrer que les deux assertions suivantes sont équivalentes. 1. La variable aléatoire X suit la loi de Poisson de paramètre λ. pn λ 2. Pour tout n ≥ 1, on a = . pn−1 n Solution de l’exercice 2. n 1. La première assertion s’écrit aussi ∀n ∈ N, pn = exp(−λ) λn! . Il est clair que cela entraine la seconde assertion. 2. Supposons maintenant la seconde assertion vraie. Par récurrence sur n, on obtient immédiatement λn pn = p 0 . n! P Il P reste à déterminer p0 . Grâce à la formule précédente, l’égalité n∈N pn = 1 s’écrit λn λ p0 n∈N n! = 1, ou encore p0 e = 1. D’où le résultat. 3. Soit X une variable aléatoire à valeurs dans N admettant une espérance E[X]. Montrer qu’on a l’égalité X E[X] = P(X ≥ n). n≥1 Solution de l’exercice 3. Première solution. 2 On a E[X] = X = X nP(X = n) n≥1 n(P(X ≥ n) − P(X ≥ n + 1)) n≥1 = lim N →+∞ = lim N X n=1 N X N →+∞ N X nP(X ≥ n) − nP (X ≥ n + 1) n=1 N +1 X nP(X ≥ n) − (n − 1)P (X ≥ n) n=1 n=2 N +1 X = lim P(X ≥ 1) − (N + 1)P(X ≥ N + 1) + P (X ≥ n) N →+∞ = lim N →+∞ = X n=2 − (N + 1)P(X ≥ N + 1) + N +1 X P (X ≥ n) n=1 P (X ≥ n). n≥1 Le de la série P fait que (N + 1)P(X ≥ N + 1) soit de limite nulle découle de la convergence P iP[X = i]. nP(X = n). En effet N P[X ≥ N ] = E[N 11X≥N ] ≤ E[X11X≥N ] = ∞ i=N Deuxième solution. X P(X ≥ n) = n≥1 XX P(X = k) n≥1 k≥n = XX = XX = X 1{k≥n} P(X = k) n≥1 k≥1 1{k≥n} P(X = k) k≥1 n≥1 P(X = k) X 1{k≥n} n≥1 k≥1 = X P(X = k)k = E[X]. k≥1 4. Soient X, Y : (Ω, F , P) → R deux variables à valeurs dans N. Montrer de deux façons différentes que X X X nP(X = n) + nP(Y = n) = nP(X + Y = n). n≥0 n≥0 n≥0 3 Solution de l’exercice 4. Le membre de gauche est E(X) + E(Y ) et le membre de droite est E(X + Y ). Par linéarité de l’espérance, ils sont donc égaux. Donnons une deuxième démonstration de cette égalité. Calculons le membre de droite. On trouve X nP(X + Y = n) = n≥0 n XX nP(X = k et Y = n − k) n≥0 k=0 = 1{k≤n} nP(X = k et Y = n − k) XX n≥0 k≥0 = 1{k≤n} nP(X = k et Y = n − k) XX k≥0 n≥0 = XX = XX nP(X = k et Y = n − k) k≥0 n≥k (k + l)P(X = k et Y = l) k≥0 l≥0 X X X X P(X = k et Y = l). l P(X = k et Y = l) + k = k≥0 l≥0 l≥0 k≥0 Dans le premier terme de la dernière ligne, pour tout k ≥ 0, la somme sur l est la somme des probabilités d’événements deux à deux disjoints dont la réunion vaut {X = k}. De même, dans le deuxième terme, pour tout l ≥ 0, la somme sur k est la somme des probabilités d’événements deux à deux disjoints dont la réunion vaut {Y = l}. Ainsi, on trouve X X X lP(Y = l), kP(X = k) + nP(X + Y = n) = n≥0 l≥0 k≥0 ce qui, au nom des indices près, est la formule voulue. 5. On étudie des variables aléatoires qui ont une propriété d’absence de mémoire. Soit T une variable aléatoire à valeurs dans N. On suppose que pour tous n, m ≥ 0 entiers, on a P(T ≥ n + m) = P(T ≥ n)P(T ≥ m). Que peut on dire sur la loi de T ? Solution de l’exercice 5. Par récurrence sur n, on voit immédiatement que P(T ≥ n) = P(T ≥ 1)n pour tout entier n ≥ 0. On en déduit que pour tout n ≥ 0, P(T = n) = P(T ≥ n) − P(T ≥ n + 1) = P(T ≥ 1)n (1 − P(T ≥ 1)). Ainsi T suit une loi géométrique de paramètre 1 − P(T ≥ 1). 4 6. On considère l’espace de probabilités ([0, 1[, B[0,1[ , Leb). Pour tout n ≥ 1, on définit une variable Xn à valeurs réelles en posant ∀x ∈ [0, 1[, Xn (x) = b2{2n−1 x}c. a) Représenter le graphe de X1 , X2 , X3 vues comme fonctions de [0, 1[ dans R. b) Déterminer la loi de Xn pour tout n ≥ 1. c) Soit n ≥ 1 un entier. Soient ε1 , . . . , εn ∈ {0, 1}. On pose a = a + 2−n . Montrer que Pn k=1 2−k εk et b = {x ∈ [0, 1[: X1 (x) = ε1 , . . . , Xn (x) = εn } = [a, b[. En déduire la loi de la variable aléatoire (X1 , . . . , Xn ) à valeurs dans {0, 1}n . La suite des variables aléatoires (Xn )n≥1 , définie sur l’espace de probabilités ([0, 1[, B[0,1[ , Leb), constitue donc un jeu de pile ou face infini. Solution de l’exercice 6. a) On remarque que pour tout x ∈ [0, 1[, b2xc = 1[1/2,1[ (x), ce qui permet de mieux comprendre la définition des Xn . X1 = 1[1/2,1[ , X2 = 1[1/4,1/2[∪[3/4,1[ , X3 = 1[1/8,1/4[∪[3/8,1/2[∪[5/8,3/4[∪[7/8,1[ . b) On va montrer que pour tout n ≥ 1, P(Xn = 1) = P(Xn = 0) = 1/2. On fixe n ≥ 1. On partage [0, 1[ en 2n intervalles Ik = [k2−n , (k + 1)2−n [, k = 0, . . . , 2n − 1. Soit x ∈ [0, 1[. Il existe un unique k tel que x ∈ Ik . On distingue deux cas : Si k =: 2i est pair, alors 2n−1 x ∈ [i, i + 21 [, {2n−1 x} ∈ [0, 12 [ and Xn (x) = 0. Si k =: 2i + 1 est impair, alors 2n−1 x ∈ [i + 21 , i + 1[, {2n−1 x} ∈ [ 12 , 1[ and Xn (x) = 1. Comme il y a exactement 2n−1 intervalles Ik avec k pair et autant avec k impair, et que chaque Ik a pour mesure de Lebesgue 2−n , la disjonction ci-dessus donne le résultat annoncé. c) Soit x ∈ [a, b[ et k un entier tel que 1 ≤ k ≤ n. Alors 2k−1 x ∈ [2k−1 a, 2k−1 b[. Or 2k−1 a = 2k−2 ε1 + · · · + 21 εk−2 + εk−1 +2−1 εk + · · · + 2k−1−n εn =: Ekn (x)+2−1 εk +Rkn (x) où, avec des notations évidentes, Ekn (a) est entier et 0 ≤ Rkn (a) ≤ 21 − 2k−1−n . De plus, on a la même écriture pour b avec Ekn (b) = Ekn (a) mais 2k−1−n ≤ Rkn (b) ≤ 12 . Comme a ≤ x < b, on en déduit que 2k−1 x ∈ [εk /2, (1 + εk )/2[, et donc Xk (x) = εk . On a montré que pour chaque choix de ε1 , . . . , εn , et pour a et b qui en résultent comme dans l’énoncé, l’intervalle [a, b[ est inclus dans {x ∈ [0, 1[: X1 (x) = ε1 , . . . Xn (x) = εn }. Montrons maintenant par l’absurde que ces inclusions sont en fait des égalités. Supposons que ce soit faux, on dispose alors de ε1 , . . . , εn et du [a, b[ associé par l’énoncé, et d’un x ∈ [0, 1[ tel que X1 (x) = ε1 , . . . Xn (x) = εn } serait inclus dans un autre intervalle 5 P dyadique [a0 , b0 [, avec a0 = nk=1 2−k ε0k . Avec (ε1 , . . . , εn ) 6= (ε01 , . . . , ε0n ). Mais d’après ce qu’on vient de voir, on devrait avoir [a0 , b0 [⊂ {x ∈ [0, 1[: X1 (x) = ε1 , . . . Xn (x) = εn }, et x fournit une contradiction. Ce qui prouve l’égalité demandée : pour tout choix de Pn ε1 , . . . , εn , en notant a = k=1 2−k εk et b = a + 2−n , on a {x ∈ [0, 1[: X1 (x) = ε1 , . . . Xn (x) = εn } = [a, b[. En prenant la mesure de Lebesgue de l’ensemble ci-dessus, on obtient la loi jointe des Xk : P(X1 = ε1 , . . . Xn = εn ) = 2−n . Il s’agit bien de la loi d’un jeu de pile ou face, après n lancers. Comme la suite de variables aléatoires (Xk )k≥1 est bien définie sur l’espace de probabilité ([0, 1[, B[0,1[ , Leb), on a construit un jeu de pile ou face infini, et ainsi démontré le théorème 2.1.1 du polycopié de cours. d) On sait déjà que la tribu engendrée par les {x ∈ [0, 1[: Xn (x) = ε}. est incluse dans B[0,1[ puisque ces ensembles sont boréliens (on a vu au b) qu’il s’agissait de réunions finies d’intervalles). Il reste à montrer l’autre inclusion. Par le c), il suffit de vérifier que les intervalles dyadiques engendrent la tribu borélienne. Il suffit même de montrer que la tribu qu’ils engendrent contiennent tous les intervalles [0, c[, c ∈]0, 1[ (puisque ceux-ci engendrent la tribu borélienne). C’est bien vrai, puisqu’un intervalle [0, c[, c ∈]0, 1[, est la réunion des intervalles dyadiques élémentaires (autrement dit, ceux considérés au c)) qu’il contient. Il s’agit essentiellement de démontrer quePsi c ∈]0, 1[, et si x ∈ [0, c[, alors on peut trouver n, et ε1 , . . . , εn , tels que, en notant a = nk=1 2−k εk et b = a + 2−n , on ait a ≤ x < b ≤ c. Pour cela, on choisit n tel que 2−n = b − a < c − x. Ceci entraine que dès qu’on aura a ≤ x, on aura aussi, automatiquement, b ≤ c. Il ne reste alors plus qu’à prendre ε1 = X1 (x), . . . , εn = Xn (x), et x ∈ [a, b[ a été démontré au c). 7. Un chimpanzé tape à la machine à écrire en appuyant chaque seconde sur une touche choisie au hasard. Quelle est la probabilité qu’il parvienne à écrire Hamlet, c’est-à-dire qu’à un certain moment il écrive d’une traite le texte de cette pièce ? Solution de l’exercice 7. Soit n la longueur, en caractères, de la pièce Hamlet. La probabilité p qu’il tape la pièce du premier coup est faible, mais strictement positive. Pour tout entier naturel k, on définit une variable aléatoire Xk qui vaut 1 si les caractères nk + 1 à n(k + 1) correspondent au texte de la pièce. Les Xk sont les mêmes que dans un jeu de pile ou face biaisé. Or on sait dans ce cas qu’il finira par sortir un pile, ce qui correspond ici à écrire le texte de la pièce d’une traite. La probabilité que le chimpanzé écrive Hamlet au bout d’un certain nombre (aléatoire, mais fini) de tentatives vaut donc 1. Néanmoins, en pratique, il y a fort à parier que le chimpanzé (ou la machine à écrire) arrivera à épuisement bien avant. 6 8. Soit Ω un ensemble. Soit (Xn )n≥1 une suite de fonctions à valeurs entières définies sur Ω. a. Décrire en français et sans utiliser les expressions "quelque soit" ni "il existe" les parties suivantes de Ω : [[\ A= {ω ∈ Ω : a ≤ Xn (ω) ≤ b}, a∈N b∈N n≥1 B= [ \ \ {ω ∈ Ω : Xn (ω) − Xm (ω) ≥ 0}, N ≥1 n≥N m≥n C= [ \ [ [ k≥1 N ≥1 n≥N m≥N 1 ω ∈ Ω : |Xn (ω) − Xm (ω)| > k . b. Faire l’opération de traduction inverse pour les parties suivantes de Ω : D E L’ensemble des ω ∈ Ω tels que la suite (Xn (ω))n≥1 ... ... ne soit pas bornée supérieurement, ... tende vers +∞, Solution de l’exercice 8. a. Le tableau suivant donne les descriptions en français de A, B, C, D : L’ensemble des ω ∈ Ω tels que la suite (Xn (ω))n≥1 ... A ... soit bornée, B ... soit décroissante à partir d’un certain rang, C ... ne soit pas de Cauchy. Puisque R est complet, les suites de Cauchy sont exactement celles qui convergent (vers une limite finie). Ainsi, C est l’ensemble des ω ∈ Ω tels que la suite (Xn (ω))n≥1 ne converge pas vers une limite finie. On aurait donc pu l’écrire sous la forme \[ \ [ 1 C= ω ∈ Ω : |Xn (ω) − `| > . k `∈R k≥1 N ≥1 n≥N Toutefois, cette écriture a l’inconvénient de faire intervenir une intersection non dénombrable (la première). Si la suite (Xn )n≥1 est une suite de variables aléatoires, il n’est pas évident avec cette écriture que C soit un événement, alors que l’écriture donnée dans l’énoncé permet de l’affirmer. b. On a D= \ [ {ω ∈ Ω : Xn (ω) ≥ M } , M ≥1 n≥1 E= \ [ \ {ω ∈ Ω : Xn (ω) ≥ M } , M ≥1 N ≥1 n≥N 7 9. Soit Ω un ensemble. Soit (An )n≥1 une suite de parties de Ω. Déterminer les relations d’inclusion qui existent toujours entre les parties suivantes de Ω : [ \ \ [ [ \ An , An , An , An , Ω, ∅. N ≥1 n≥N N ≥1 n≥N n≥1 n≥1 Montrer par un exemple que ces six parties peuvent être deux à deux distinctes. Solution de l’exercice 9. La partie vide est incluse dans toute partie de Ω, et toute partie de Ω est incluse dans Ω. En ce qui concerne les quatre autres parties, on peut les décrire avec des mots de la façon suivante : L’ensemble \ ci-dessous An [n≥1\ An N ≥1 n≥N \ [ An N ≥1 n≥N [ An est l’ensemble des ω ∈ Ω qui sont dans ... ... tous les An , ... tous les An à partir d’un certain rang, ... une infinité des An , ... au moins un des An . n≥1 Ces conditions sont de moins en moins contraignantes : elles sont donc satisfaites par une partie de plus en plus grande de Ω. On a donc toujours les inclusions \ [ \ \ [ [ ∅⊂ An ⊂ An ⊂ An ⊂ An ⊂ Ω. n≥1 N ≥1 n≥N N ≥1 n≥N n≥1 Prenons l’exemple suivant : Ω = {1, 2, 3, 4, 5}. Posons A1 = {1}, A2 = {1, 2, 3, 4}, A3 = {1, 2}, A4 = {1, 2, 3}, puis A2n+1 = {1, 2} et A2n+2 = {1, 2, 3} pour tout n ≥ 2. On a alors \ [ \ \ [ [ An = {1}, An = {1, 2}, An = {1, 2, 3}, An = {1, 2, 3, 4} n≥1 N ≥1 n≥N N ≥1 n≥N n≥1 si bien que les cinq inclusions qui sont vraies en général sont, dans ce cas particulier, strictes. 8