M1: EXERCICES DE PROBABILITÉS-STATISTIQUES 1. Rappels de probabilités Exercice 1. Un livre de 400 pages contient 100 erreurs distribuées au hasard. On ouvre le livre à une page quelconque. Le nombre d’erreurs rentrées sur cette page est une variable aléatoire. 1.1. Quelle est la loi de probabilité de X? 1.2. Quelle est la probabilité que le nombre d’erreurs constatées sur la page soit strictement supérieur à 5? 1.3. Quelle est la probabilité qu’il soit égal à 2, 3, ou 4? Exercice 2. On considère dans cet exercice des variables aléatoires de Poisson, que l’on note P(λ). 2.1. Soit X1 ∼ P(λ) avec λ > 0. Calculer E(X1 ) et E(X1 (X1 − 1)) puis vérifier que E(X1 ) = V (X1 ). 2.2. Calculer pour tout z ∈ [0, 1] E(z X1 ) = X P (X1 = k)z k , k≥0 c’est-à-dire la transformée en z de la loi de X1 . Comment en déduire les valeurs trouvées précédemment? (on cherchera à dériver l’expression en la variable z). 2.3. Soient X1 et X2 deux variables aléatoires indépendantes suivant respectivement une loi P(λ1 ) et P(λ2 ). En calculant E(z X1 +X2 ), montrer que X1 + X2 suit une loi P(λ1 + λ2 ). 2.4. Soit (X1 , · · · , Xn ) un n-échantillon de loi P(λ). Déduire de la question précédente la loi de Sn lorsque Sn = X1 + · · · + Xn . 2.5. On retourne à la situation de la question 2.3, et on note X = X1 + X2 . Déterminer la loi conditionnelle de X1 sachant (X = n) pour n ∈ N. Exercice 3. La loi du couple (X, Y ) est définie par le tableau suivant: P (2, 1) = 14 P (2, 2) = 0 P (2, 3) = 14 . P (1, 1) = 0 P (1, 2) = 12 P (1, 3) = 0 3.1. Trouver les lois marginales de X et Y . 3.2. Montrer que X et Y ne sont pas indépendantes. 3.3. Calculer cov(X, Y ). Donner une conclusion à cet exercice. Exercice 4. Soient deux variables continues, X et Y , qui ont pour fonction de densité conjointe f (x, y) = x + y, pour 0 ≤ x ≤ 1, et 0 ≤ y ≤ 1. 1 2 M1 PROBAS - LISTE D’EXERCICES 4.1. Déterminer les fonctions de densité marginales de X et Y . 4.2. Calculer E[X + Y ], V (X + Y ) et ρX,Y . Exercice 5. Un restaurant peut servir 75 repas. La pratique montre que 20 % des clients ayant réservé ne viennent pas. 5.1. Le retaurateur accepte 90 réservations. Quelle est la probabilité qu’il se présente plus de 65 clients? 5.2. Combien le restaurateur doit-il accepter de réservations pour avoir une probabilité supérieure ou égale à 0.9 de pouvoir servir tous les clients se présentant? Exercice 6. Pendant un temps déterminé, le nombre N de véhicules se présentant à un péage est une variable aléatoire de Poisson de paramètre λ. 6.1. Déterminer les lois de probabilité des variables aléatoires F et M représentant les nombres de conducteurs de sexe féminin et masculin respectivement (N = F +M ), sachant que la probabilité que le conducteur d’un véhicule soit de sexe féminin est p. 6.2. F et M sont-elles indépendantes? Exercice 7. Soit X une variable aléatoire réelle suivant la loi de Cauchy, de densité 1 . Dans les deux cas suivants, montrer que l’on a une variable aléatoire, puis déterπ(1+x2 ) miner sa densité lorsqu’elle existe. 7.1. Y1 = 1/X. 7.2. Y2 = X 2 − 4X + 3. Exercice 8. Soit (X, Y ) un couple indépendant de variables aléatoires. On suppose que X suit la loi uniforme U([0, 1]) et Y la loi exponentielle E(1). 8.1. Calculer la loi de la variable aléatoire Z = X + Y . Exercice 9. Quand Riton et Nandrianina déjeunent chez Samira, Riton fait le partage du saké. Il répartit équitablement le contenu du pichet entre les deux verres qui lui font face. La différence X de volume de saké entre le verre de droite et le verre de gauche suit une loi normale de moyenne nulle. Sachant que Riton prend soit le verre de droite avec une probabilité p, soit le verre de gauche avec un probabilité q = 1 − p, on note Y la différence de volume entre le verre de Riton et celui de Nandrianina. 9.1. Montrer que X et −X ont même loi. 9.2. Montrer que la variable aléatoire Y suit la même loi de probabilité que X. 9.3. Reprendre la même question dans le cas où X suit une loi absolument continue quelconque de densité paire. Exercice 10. Gabriel Sagard (missionnaire franciscain du 17è siècle envoyé au Québec pour évangéliser les Hurons) attend qu’un bateau vienne le chercher sur les berges du Saint Laurent. Le temps Xi qui sépare le passage du bateau i − 1 du bateau i pour i ≥ 1 suit une loi exponentielle de paramètre λ > 0, et on suppose que les temps d’attente entre deux bateaux successifs sont tous indépendants. On note Tn la variable aléatoire, définie sur un certain espace de probabilité (Ω, F, P ), égale au temps qu’il faut attendre pour le passage de n bateaux. 10.1. Calculer E[Tn ] et V [Tn ]. M1 PROBAS - LISTE D’EXERCICES 3 10.2. Notons fn la densité de probabilité de Tn et Fn sa fonction de répartition. En remarquant que Tn+1 = Tn + Xn+1 , montrer que Z t fn+1 (t) = λ fn (u) exp(−λ(t − u)) du 1[0,∞[ (t), 0 pour tout n ≥ 1. n−1 t exp(−λt)1[0,∞[ (t) pour tout n ≥ 1. 10.3. Montrer que fn (t) = λn (n−1)! 10.4. Trouver une relation de récurrence entre Fn et Fn+1 . En déduire la valeur de Fn . 10.5. Fixons un instant t ∈ [0, ∞[. Notons Nt la variable aléatoire discrète égale au nombre de navires qui sont passés avant l’instant t. Montrer que pour n ≥ 1 on a P (Nt = n) = Fn (t) − Fn+1 (t), et que P (Nt = 0) = 1 − F1 (t). 10.6. Déterminer la loi de Nt . Remarque: La fonction t 7→ Nt se nomme processus de Poisson. Exercice 11. Soit γa,b la fonction: 1 γa,b (x) = xa−1 e−x/b 1{x>0} , a Γ(a)b R ∞ −t x−1 où a > 0 et b > 0 et Γ(x) = 0 e t dt. 11.1. Montrer que γa,b est une densité. 11.2. Soit X une v.a. de densité γa,b . Vérifier, pour λ > 0: 1 E[e−λX ] = , E[X] = ab, V arX = ab2 . a (1 + λb) 11.3. Soit X (resp. X 0 ) une v.a. de densité γa,b (resp. γa0 ,b ); on suppose X et X 0 indépendantes. Montrer que X + X 0 a pour densité γa+a0 ,b . 11.4. Application: Soient X1 , X2 , ..., Xn , n v.a. indépendantes de même loi N1 (0, 1). Montrer que X12 + X22 + ... + Xn2 suit une loi gamma. 2. Vecteurs aléatoires gaussiens R ∞ −x2 /2 Exercice 12. Soit I = 0 e dx. 12.1. Montrer que I est une intégrale convergente. 12.2. Calculer I 2 en utilisant le théorème de Fubini et en passant en coordonnées polaires; en déduire la valeur de I. Exercice 13. Soit X une v.a. de loi N1 (m, σ 2 ) telle que P (X ≥ 3) = 0.8413 et P (X ≥ 9) = 0.0228. Calculer m et σ (on donne Φ(1) = 0.8413 et Φ(2) = 0.9772). Exercice 14. Soit X de loi N1 (m, σ 2 ) . 2 14.1. On supppose que m = 0. On pose Y = eαX avec α 6= 0. Calculer E[Y n ]. 14.2. Déterminer la densité de |X − 1| lorsque m = 2 et σ = 1. Exercice 15. Soit une v.a. de Bernoulli: P ( = 1) = P ( = −1) = 1/2. On suppose que est indépendante de X, X de loi N1 (0, 1). Montrer que la loi de X est encore gaussienne. 4 M1 PROBAS - LISTE D’EXERCICES Exercice 16. Soit A la matrice définie par 1 1 1 1 5 −1 1 −1 2 16.1. Montrer qu’il existe un vecteur gaussien G centré et de matrice de covariance A. On notera X, Y et Z les coordonnées de G. 16.2. G admet-il une densité? Calculer la fonction caractéristique de G. 16.3. Caractériser la loi de U = X + Y + Z. 16.4. Montrer que (X − Y, X + Z) est un vecteur gaussien. 16.5. Déterminer l’ensemble des v.a. ξ = aX + bY + cZ, indépendantes de U . Exercice 17. Soit Q une forme quadratique définie et positive sur Rn . On lui associe la fonction f définie par: Q(x) , x ∈ Rn . f (x) = λ exp − 2 17.1. En fonction de Q, calculer l’unique valeur de λ telle que f est une densité (on pourra montrer que f est la densité d’un vecteur gaussien). 17.2. Application: n = 2, Q(x, y) = 3x2 + y 2 + 2xy. Exercice 18. Soit X un vecteur aléatoire gaussien de loi Nn (ξ, Γ). On pose Y = AX et Z = BX où A et B sont deux matrices d’ordre (m, n) et (k, n). 18.1. Montrer que les deux v.a. Y et Z sont indépendantes si et seulement si: Y 0 = A(X − ξ) et Z 0 = B(X − ξ) sont indépendantes. On supposera ξ = 0 dans la suite de l’exercice. 18.2. Soit u un vecteur de Rm . Calculer E[exp{iu? AX}]. Vérifier que Y et Z sont deux v.a. indépendantes si et seulement si AΓB ? = 0; prouver ensuite que cette condition est équivalente à: cov(Y, Z) = 0. Pn 0 18.3. On suppose que Γ est la matrice identité. On note U = i=1 λi X Pi n et U 0 = P n 0 0 i=1 λi λi = i=1 λi Xi . Vérifier que les v.a. U et U sont indépendantes si et seulement si 0. Exercice 19. Soit une v.a. de Bernoulli: P ( = 1) = P ( = −1) = 1/2, indépendante d’une v.a. X de loi N1 (0, 1). Montrer que le couple (X, X) n’est pas gaussien. Exercice 20. (X1 , X2 , ..., Xn ) désigne un vecteur gaussien centré, de covariance Γ définie 2 positive. Soit H le sous-espace par {X1 , X2 , ..., Xn } (i.e. Y ∈ Pn vectoriel de L (Ω) engendré H si et seulement si Y = i=1 λi Xi ). Pour tout Y et Y 0 de H on note hY, Y 0 i = E[Y Y 0 ] = cov(Y, Y 0 ). 20.1. Montrer que h., .i est un produit scalaire sur H. 20.2. On travaille ici sur l’espace H défini précédemment. (1) Etablir l’équivalence: Z et Z 0 sont deux v.a. indépendantes si et seulement si hZ, Z 0 i = 0 pour tout Z et Z 0 éléments de H. M1 PROBAS - LISTE D’EXERCICES 5 (2) Soient Y1 , Y2 , ..., Yk et Z1 , Z2 , ..., Zl , l + k v.a. appartenant à H. Montrer que (Y1 , Y2 , ..., Yk ) et (Z1 , Z2 , ..., Zl ) sont deux v.a. indépendantes si et seulement si H1 ⊂ H2⊥ où H1 (resp. H2 ) est le sous-espace vectoriel de H engendré par Y1 , Y2 , ..., Yk (resp. Z1 , Z2 , ..., Zl ). (3) Prouver que les v.a. Y1 , Y2 , ..., Yk sont indépendantes si et seulement si les vecteurs Y1 , Y2 , ..., Yk sont deux à deux orthogonaux. 20.3. On suppose que la matrice de covariance de (X1 , X2 , ..., Xn ) est l’identité. (1) MontrerPque la v.a. (X1 − X̄, X2 − X̄, ..., Xn − X̄) est indépendante de X̄, où X̄ = n1 ( ni=1 Xi ). (2) En déduire que les v.a. X̄ et W = max Xi − min Xi 1≤i≤n 1≤i≤n sont indépendantes. Exercice 21. Soit X un vecteur gaussien de loi Nn (0, Id). montrer que Y = AX suit la même loi , lorsque A est une matrice carré orthogonale d’ordre n. Exercice 22. Soient ρ et θ deux v.a. indépendantes , θ de loi uniforme sur [−π, π] et ρ2 de loi exponentielle de paramètre 12 . On note X = ρ cos θ et Y = ρ sin θ. Montrer que les v.a. X et Y sont indépendantes et suivent des lois gaussiennes réduites et centrées. Exercice 23. Soient (Xn ; n ≥ 1) une suite de v.a., indépendantes et de même loi, de carré intégrable et à valeurs dans Rk . (ξn ; n ≥ 1) désigne une suite de v.a. indépendantes, bornées, à valeurs réelles et équidistribuées. On suppose que la famille (Xn ; n ≥ 1) est indépendante de la famille (ξn ; n ≥ 1) et que X1 ou ξ1 est centrée. On note Yn = n 1 X n1/2 ξi Xi . i=1 Montrer que (Yn ) converge en loi lorsque n tend vers l’infini, vers une loi gaussienne que l’on caractérisera. Exercice 24. Pour tout t > 0 et x > 0 on pose, Z n/t n−1 n y x −yx an (x, t) = e dy. (n − 1)! 0 24.1. En utilisant le théorème de la loi forte des grands nombres (resp. central limite), montrer que limn→∞ an (x, t) = 1{x>t} si x 6= t (resp. 1/2 lorque x = t). 24.2. Soit X une v.a. à valeurs dans R+ . On note G(θ) = E[e−θX ]. (1) Déduire de la question précédente : Z n/t y n−1 dn G 1 n lim (−1) (y)dy = P (X = t) + P (X > t) n n→∞ (n − 1)! dy 2 0 (2) Montrer alors que G caractérise la loi de X. 6 M1 PROBAS - LISTE D’EXERCICES 3. Simulation de variables aléatoires Exercice 25. On se propose ici de simuler une v.a. X de loi binomiale B(n, p): pour k ∈ {0, ..., n}, on a P (X = k) = Cnk (1 − p)k pn−k . 25.1. Utiliser la méthode classique. 25.2. Utiliser la méthode basée sur le théorème central de la limite. Exercice 26. On voudrait simuler une v.a. T de loi géométrique de paramètre p: pour k ≥ 1, P (T = k) = (1 − p)k−1 p. 26.1. Utiliser la méthode classique. 26.2. Soit Y une variable aléatoire suivant une loi E(λ). On pose q = 1 − e−λ . Montrer que, pour n ≥ 0, P (n ≤ Y ≤ n + 1) = P (Z = n + 1), où Z ∼ G(q). 26.3. Soit U ∼ U([0, 1]), et X la variable aléatoire définie par log(U ) + 1. X= log(1 − p) Montrer que X ∼ G(p). Notons que, dû aux appels à la fonction log, cet algorithme n’est une améliotration, par rapport à l’algorithme classique, que lorsque p ≤ 41 . Exercice 27. A l’aide de la méthode de la fonction réciproque, donner un algorithme permettant de simuler une v.a. X dans les cas suivants: 27.1. La loi de X est E(λ), de densité λe−λx 1x≥0 . 27.2. La loi de X est la loi de Cauchy, de densité 1 . π(1+x2 ) Exercice 28. On s’intéresse dans cet exercice à la simulation d’une v.a. X de loi de Poisson de paramètre λ, notée P(λ): pour k ≥ 0, P (X = k) = e−λ λk /k!. 28.1. Utiliser la méthode classique. 28.2. On admet le résultat suivant: soit {Ti ; i ≥ 1} une suite i.i.d de variables aléatoires de loi E(λ). Soit X la variable aléatoire définie par ( ) n X X = inf n ≥ 0; Ti ≥ 1 − 1. i=1 Alors X ∼ P(λ). En déduire un algorithme de simulation de la loi P(λ). Exercice 29. Dans cet exercice, nous essaierons de simuler une v.a. de loi normale centrée réduite par la méthode du rejet. 29.1. On considère la densité de probabilité 1/2 2 2 f (x) = e−x /2 1x≥0 . π On s’intéresse aussi à g(x) = e−x 1x≥0 , la densité d’une loi exponentielle de paramètre 1. (1) Montrer que si c = (2e/π)1/2 alors on a, pour tout x ∈ R, f (x) ≤ cg(x). (2) En déduire un algorithme de simulation d’une v.a. X de loi f (x)dx. M1 PROBAS - LISTE D’EXERCICES 7 29.2. Soit X une v.a. de loi f (x)dx, et U une v.a. indépendante, de loi uniforme sur [0, 1]. Montrer que la v.a. Z définie par Z = X1U <1/2 − X1U >1/2 suit une loi N (0, 1). 29.3. Ecrire un algorithme qui permet de simuler une v.a. de loi N (0, 1). Quel est son coût ? Exercice 30. On aimerait simuler une v.a. de loi 1 1 δ0 (dx) + e−x 1x≥0 . 2 2 30.1. Utiliser la méthode de la fonction réciproque. 30.2. Utiliser la méthode de la combinaison linéaire, puis comparer les deux méthodes. Exercice 31. Pour α, β > 0 fixés, on s’intéresse à la loi Γα,β , de densité Z ∞ β α α−1 −βx f (x) = xα−1 e−βx dx. x e 1x≥0 , où Γ(α) = Γ(α) 0 31.1. On suppose d’abord que α < 1. On va effectuer une simulation d’une v.a. de loi Γ(α, β) par la méthode du rejet. On considère pour cela la fonction g(x) = cα,β xα−1 10≤x≤1 + e−βx 1x>1 . (1) (2) (3) (4) Calculer cα,β pour que g soit une densité de probabilité. Décrire une méthode de simulation des v.a. de loi g(x)dx. Trouver une constante c > 1 telle que pour tout x dans R, f (x) ≤ cg(x). Simuler une v.a. de loi de loi Γ(α, β). 31.2. On suppose maintenant que α > 1. On note [α] sa partie entière. (1) Montrer que si X et Y sont des v.a. indépendantes de loi respectives Γ([α], β) et Γ(α − [α], β), alors Z = X + Y a pour loi Γ(α, β). (2) Montrer que si n ∈ N∗ , si U1 , ...,Un sont des v.a. i.i.d. de loi uniforme sur [0, 1], alors 1 Y = − ln(U1 × ... × Un ) β a pour loi Γ(n, β). (3) En déduire un algorithme de simulation d’une v.a. de loi Γ(α, β). Exercice 32. On cherche dans cet exercice une valeur approchée de Γ(α), défini par: Z ∞ Γ(α) = xα−1 e−x dx, 0 pour α > 1 fixé. 32.1. Montrer que Γ(α) peut s’exprimer comme 1 α−1 (λ−1)X E X e , λ où X est une variable aléatoire de loi E(λ), avec λ > 0 arbitraire. En déduire un algorithme d’approximation de Γ(α) associé à la méthode de Monte Carlo. 32.2. Optimiser cette méthode par rapport au paramètre λ. 8 M1 PROBAS - LISTE D’EXERCICES 32.3. Supposons à présent que α = π (cette valeur est arbitraire, et les calculs ci-dessous fonctionneraient exactement de la même manière pour tout α > 1). (1) Effectuer une majoration (éventuellement grossière) de la variance associée à la méthode de Monte Carlo utilisée. (2) En déduire des intervalles de confiance sur Γ(π) à l’aide de l’inégalité de BienayméeTchebichev. Soit > 0 fixé. Quel n faut-il choisir pour que l’erreur soit plus petite que 0.02 avec une probabilité supérieure à 0.99? (3) Reprendre la question précédente, en utilisant cette fois le TCL. 4. Convergences et n-échantillons Exercice 33. Soit {Xn : n ∈ N} une suite i.i.d. de variables aléatoires de carré intégrable, d’espérance m et de variance σ 2 . On pose : n 1X X̄n = Xi , n i=1 n et Sn2 1X = (Xi − X̄n )2 . n i=1 33.1. Montrer : Var(X̄n ) = σ2 , n E[Sn2 ] = n−1 2 σ . n 33.2. Lorsque X1 admet un moment d’ordre 3, montrer : n−1 3 Cov X̄n , Sn2 = µ , (où µ = E (X − m) ). 3 3 1 n2 33.3. On suppose de plus que la v.a. X1 admet un moment d’ordre 4 fini. On note µ4 le moment centré d’ordre 4 de X1 : µ4 := E (X1 − m)4 . Montrer : Var(Sn2 ) = µ4 − 2σ 4 µ4 − 3σ 4 µ4 − σ 4 −2 + . n n2 n3 En déduire un équivalent de Var(Sn2 ) lorsque n → ∞. Exercice 34. Soit {Xn : n ∈ N} une suite i.i.d. de variables aléatoires de carré intégrable, d’espérance m et de variance σ 2 . 34.1. Calculer les limites presque sûre de X̄n et de Sn2 , quand n → ∞. 34.2. Calculer la limite, quand n → ∞, de la suite de fonctions √ n(X̄n − m) Gn (x) = P ≤ x , x ∈ R. σ De quel type de convergence s’agit-il? On peut montrer que la convergence est uniforme en x ∈ R. 34.3. Montrer que √ n−1 p (X̄n − m) → N (0, 1) Sn2 lorsque n → ∞. √ n et p (X̄n − m) → N (0, 1) Sn2 en loi , M1 PROBAS - LISTE D’EXERCICES 9 Exercice 35. Le but de l’exercice est de donner un exemple d’application du théorème central limite au cas multidimensionnel. Soient (Yi ; i ≥ 1) une suite de v.a. réelles indépendantes et de même loi . On notera F leur fonction de répartition commune et F̂n la fonction de répartition empirique de l’échantillon de taille n : (Y1 , . . . , Yn ) : n 1X 1{Yi ≤x} , x ∈ R. F̂n (x) = n i=1 35.1. Soit x un réel fixé. Montrer : • F̂n (x) converge p.s. vers F (x), lorsque n → ∞; √ • n(F̂n (x) − F (x)) converge en loi, lorsque n → ∞, vers une v.a. gaussienne centrée de variance F (x)(1 − F (x)). 35.2. Nous allons généraliser ce résultat au cas multidimensionnel. Soient x1 , x2 , ..., xd une suite de réels, x1 < x2 < ... < xd et Xn le vecteur aléatoire, à valeurs dans Rd , de (1) (2) (d) coordonnées Xn , Xn , · · · , Xn avec: Xn(i) = 1{Yn ≤xi } ; 1 ≤ i ≤ d, pour tout n ≥ 1. Montrer que: √ √ n(Fn (x1 ) − F (x1 )), ..., n(Fn (xd ) − F (xd )) converge en loi, lorsque n tend vers l’infini, vers un vecteur gaussien centré dont on déterminera sa matrice de covariance. Exercice 36. Soient (Tk ) et (ξk ) deux suites de v.a., telles que Tk (resp. ξk ) suive la loi de Student à k degrés de liberté (resp. la loi du chi-deux à k degrés de liberté). Montrer que Tk et ξ√k −k convergent en loi vers la loi gaussienne réduite et centrée. 2k Exercice 37. Soient x1 , x2 , · · · , xn des réels deux à deux distincts (i.e. xi 6= xj pour tout i 6= j). On les ordonne par ordre croissant, soit x(1) , x(2) , · · · , x(n) le ré-arragement croissant obtenu : x1 , x2 , · · · , xn = x(1) , x(2) , · · · , x(n) , x(1) < x(2) < · · · < x(n) . En particulier x(1) = min1≤i≤n xi et x(n) = max1≤i≤n xi . Soit Xi , 1 ≤ i ≤ n une suite de v.a.r. i.i.d. de fonction de répartition F . 37.1. Déterminer la fonction de répartition de Mn := max1≤i≤n Xi . Dans le cas où X1 admet une densité f , déterminer la densité de Mn . 37.2. Mêmes questions pour In := min1≤i≤n Xi On suppose dans la suite que F admet une densité f . 37.3. Montrer que presque sûrement, Xi 6= Xj pour tout i 6= j. 37.4. Vérifier que X(1) , X(2) , · · · , X(n) a pour densité ϕ(x1 , · · · , xn ) = n!f (x1 ) × · · · × f (xn )1{x1 <···<xn } . 37.5. Montrer l’identité suivante, valable pour −∞ ≤ a < b ≤ ∞: Z p Y (F (b) − F (a))p . Ma,b ≡ 1{a<x1 <···<xp <b} f (xj )dx1 · · · dxp = p! R j=1 10 M1 PROBAS - LISTE D’EXERCICES 37.6. Soient k ∈ {1, . . . , n}. Déterminer la densité de X(k) . 37.7. Reprendre la question précédente lorsque X1 suit la loi uniforme sur [0, 1]. 5. Estimation ponctuelle Exercice 38. Soit Ci le cours du Dow Jones (indice de la bourse de New-York) au jour i. Le modèle de Black et Scholes pour Ci suppose que les variables {Xi ; i ≥ 1} avec i Xi = Ci+1C−C sont des variables i.i.d. suivant une loi gaussienne centrée N (0, σ 2 ). En i finance, Xi se nomme accroissement relatif de Ci , et le coefficient σ 2 se nomme volatilité des cours. On considère ici des données recensant n = 1588 accroissement relatifs sur une période s’achevant le 21 avril 1998. On trouve pour ces données x1 , . . . , xn une moyenne empirique xn = 3.09 10−4 et un écart type empirique sn = 0.0126. 38.1. Pour cette question, on suppose que (X1 , . . . , Xn ) est un n-échantillon de loi N (µ, σ 2 ) avec µ et σ 2 inconnues. (1) Modéliser cette situation comme la donnée d’une famille de lois en précisant l’ensemble Θ des paramètres et l’ensemble E des valeurs prises par les variables aléatoires Xi . (2) Donnez, en justifiant vos résultats, deux estimateurs fortement consistants de µ. (3) Montrez que X n est un estimateur sans biais de µ. (4) Montrez que X n est un estimateur efficace de µ. (5) En justifiant vos résultats, donnez un intervalle de confiance pour µ aux niveaux de confiance suivants: 1 − α1 = 95% et 1 − α2 = 99% (on admettra que pour m grand, la loi de Student t(m) peut être approchée par une loi N (0, 1)). Ces intervalles contiennent-ils la valeur 0? En déduire une conclusion sur la validité de l’hypothèse µ = 0. 38.2. On suppose ici que µ = 0. Donnez un intervalle de confiance à 95% pour la volatilité σ 2 (on admettra que pour n > 60, Zn = (χ2 (n)) − n)/(2n)1/2 suit une loi normale cetrée réduite). 38.3. Donnez un intervalle de confiance à 95% pour la volatilité σ 2 lorsqu µ n’est plus supposée nulle, et comparez vos résultats avec ceux de la question 1-2. Donnez vos conclusions sur le modèle de Black et Scholes. Exercice 39. Un informaticien aimerait avoir des informations sur le temps d’attente entre deux requêtes sur un réseau informatique. Il modélise ce temps d’attente par une loi exponentielle E(λ). Il mesure n = 20 temps d’attente, et obtient le résultat suivant (en mn). 0.90 0.50 0.08 0.44 0.06 0.64 0.20 0.07 0.23 0.36 0.16 0.02 0.39 0.02 0.12 0.01 0.06 0.38 0.17 0.31 39.1. Modéliser cette situation en termes de n-échantillon d’une famille de lois pour laquelle on précisera les ensembles Θ et E. 39.2. Montrer, par la méthode des moments, que X1n et S1n sont des estimateurs fortement consistants de λ. Donnez les deux résultats numériques obtenus sur notre échantillon et comparez-les. 39.3. Calculez l’estimateur du maximum de vraisemblance de λ. 39.4. Calculer le biais de l’estimateur 1 . Xn Par ailleurs, cet estimateur est-il efficace? M1 PROBAS - LISTE D’EXERCICES 39.5. Même question pour l’estimateur 11 1 . Sn 39.6. Construire un intervalle de confiance à 95% pour λ. Exercice 40. Une administration effectue une étude sur le fonctionnement de ses guichets. Un guichet témoin a été testé pendant une journée continue de 8 heures, et on a relevé la longueur de la file d’attente toutes les 5 minutes, avec les résultats suivants: Nb clients 0 1 2 3 4 ≥5 Nb observations 29 36 25 2 3 0 Soit X la variable aléatoire “longueur de la file d’attente”. On suppose que nos observations correspondent à un 95-échantillon de loi X. On suppose de plus que X suit une loi de Poisson P(λ) de paramètre λ inconnu. 40.1. Calculer l’estimateur du maximum de vraisemblance de λ. 40.2. On se propose de comparer ici les deux estimateurs λ̂1 = Pn 1 i=1 Xi , pour n > 5. n+5 1 n Pn i=1 Xi et λ̂2 = (1) Calculer le biais des deux estimateurs λ̂1 et λ̂2 . (2) Calculer le risque quadratique de λ̂1 et λ̂2 . (3) Pour quelles valeurs de λ l’estimateur λ̂2 est-il meilleur que λ̂1 ? 40.3. Donner la définition d’efficacité. Les estimateurs λ̂1 et λ̂2 sont-il efficaces? 6. Intervalles de confiance et test Exercice 41. Dans l’atmosphère, le taux d’un gaz nocif, pour un volume donné, suit une loi normale d’espérance µ et de variance σ 2 inconnues. On effectue n prélèvements conduisant aux valeurs x1 , x2 , . . . , xn . 41.1. P Sur un échantillon de taille n = 10, on observe que x̄10 = 50 et s210 = 100 où 2 s210 = 10 i=1 (xi − x10 ) /9. Quel est l’intervalle de confiance de niveau de confiance 95% du taux moyen µ de gaz dans l’atmosphère ? 41.2. Quel serait cet intervalle si la variance σ 2 était connue (on la prendra égale à 100). 41.3. On dispose maintenant d’un échantillon 10 fois plus grand conduisant aux résultats suivants: x100 = 48 et s2100 = 90. Quel est alors l’intervalle de confiance de niveau de confiance 90% pour µ? Exercice 42. Une entreprise qui produit des lecteurs de DVD fait un sondage pour estimer la proportion p de ménages possesseurs d’un appareil. Sur un échantillon de 1000 ménages, elle observe une fréquence de 0.75. 42.1. En supposant que les observations réalisées sont indépendantes et identiquement distribuées, estimer ponctuellement p. 42.2. Construire un intervalle de confiance pour p de niveau de confiance 95%, en résolvant une équation du second degré. 42.3. Quelle est la précision, en pourcentage, obtenue pour cette estimation? 42.4. Comparer avec les résultats obtenus lorsque l’on remplace la variance par une estimation. 12 M1 PROBAS - LISTE D’EXERCICES 42.5. Quelle est la taille minimum de l’échantillon pour que l’erreur commise sur p ne dépasse pas 1%. Exercice 43. On considère dans cet exercice une famille de données que l’on note (y1 , . . . , yn ) à valeurs dans un espace discret E = {1, . . . , k}. On suppose que ces données sont la réalisation d’un n-échantillon (Y1 , . . . , Yn ), où les variables aléatoires Yi sont à valeurs dans E. On cherche à déterminer, à partir de nos données (y1 , . . . , yn ), si les variables Yi suivent une loi donnée par p = (p1 , . . . , pk )∗ . On considère pour cela les variables aléatoires n X Nn (i) = 1(Yj =i) , i ≤ k, j=1 et les vecteurs suivants: q= 1/2 1/2 (p1 , . . . , pk )∗ , Tn = Nn (1) − np1 Nn (k) − npk ,... 1/2 (np1 ) (npk )1/2 ∗ . On notera aussi (e1 , . . . , ek ) la base canonique de Rk . On supposera dans un premier temps que Yi suit bien la loi définie par p. 43.1. P En appliquant le théorème central de la limite à la suite de vecteurs aléatoires Xj = l≤k 1(Yj =l) el , montrer que Tn converge en loi vers une loi Nk (0, Γ), avec Γ = I −qq ∗ . 43.2. Montrer qu’il existe une matrice orthogonale B telle que BΓB ∗ = Diag(1, . . . , 1, 0). 43.3. On pose dn = |Tn |. Montrer que, si les variables Yi suivent la loi donnée par p, alors d2n converge en loi vers une loi χ2 (k − 1). 43.4. Déduire des questions précédentes la forme habituelle du test du χ2 . 43.5. Le tableau suivant représente la répartition de 72 habitants du village de Carrizosa selon leur mois de naissance (la deuxième ligne du tableau représente le nombre ni de personnes dans chaque catégorie). Jan Fev Mar Avr Mai Jun Jul Aoû Sep Oct Nov Dec 6 5 3 5 10 8 7 7 3 2 5 11 Peut-on considerer, sur cet échantillon, que le nombre de naissances ne dépend pas du mois de l’année? 7. Exhaustivité, Borne de Cramer-Rao Exercice 44. On considère la famille de lois {µv ; v > 0} avec µv = N (m, v), où m ∈ R est supposée connue. Pour le modèle d’échantillonnage associé à cette famille, montrer: 44.1. Que l’ensemble Ev ne dépend pas de v. 44.2. Donner une expression de la quantité d’information. 44.3. Exhiber un estimateur exhaustif s’il en existe. 44.4. Déterminer si l’on a affaire à une famille exponentielle, et si oui, identifier ses coefficients. 44.5. Donner une expression pour la borne de Cramer-Rao 44.6. Déterminer l’estimateur du maximum de vraisemblance. Puis, pour cet estimateur: M1 PROBAS - LISTE D’EXERCICES 13 (1) Calculer son biais. (2) Determiner si l’estimateur est asymptotiquement normal et s’il est efficace. Exercice 45. Reprendre l’exercice 44 dans les cas suivants: 45.1. Lois binomiales Bin(n, p) à n ≥ 1 fixé. 45.2. Lois de Poisson P(λ). 45.3. Lois exponentielles E(λ). 45.4. Lois uniformes U([0, θ]). Exercice 46. On se propose dans cet exercice d’étudier l’estimation de la moyenne par un sondage stratifié: on étudie un caractère quantitatif C sur la population P de N individus. La moyenne des valeurs du caractère C pour tous les individus de la population est notée m et la variance σ 2 . On classe les individus de cette population en r groupes homogènes G1 , G2 · · · , Gr , appelés strates, suivant les valeurs de plusieurs caractères que l’on suppose être en relation avec le caractère C. L’effectif de la strate Gi est notée Ni . La moyenne des valeurs du caractère C pour les individus de la strate Gi est notée mi , la variance σi2 . Dans chaque strate Gi , on extrait au hasard ni individus. On suppose que ni est négligeable par rapport à Ni . On note Xi,j la v.a. qui a pour réalisation la valeur xi,j du caractère C pour le j-ième individu extrait de la strate Gi , avec 1 ≤ i ≤ r et 1 ≤ j ≤ ni . On note : Xi,1 + · · · + Xi,ni X̄i := ni 2 2 2 2 + · · · + Xi,n Xi,1 − X̄ X − X̄ + · · · + X i i,1 i i,n i i 2 Si := = − X̄i2 . ni ni On étudie dans la suite les propriétés de la statistique : r 1 X Ni X̄i T := N i=1 en tant qu’estimateur de m. 46.1. On étudie ici des propriétés générales de l’estimateur T . Pr 1 (1) Montrer que m = i=1 Ni mi . N (2) Calculer E X̄i et Var(X̄i . (3) Montrer que T est un estimateur sans-biais de m. (4) Calculer la variance de T . Quelle est sa limite lorsque tous les ni tendent vers l’infini ? Commenter ce résultat. (5) On désire estimer une proportion des individus de la population P qui ont une propriété A. Proposer une estimation de cette proportion. 46.2. On suppose dans la suite que dans chaque strate, le caractère C est distribué suivant une loi normale. (1) Donner la loi de T . (2) On propose pour estimateur de la variance de T la statistique : r 1 X Ni2 2 S . N 2 i=1 ni − 1 i Montrer que cet estimateur est sans-biais. Calculer sa variance. 14 M1 PROBAS - LISTE D’EXERCICES 46.3. Comparaison de la méthode stratifiée avec la méthode simple. (1) Montrer que r 1 X 2 σ = Ni σi2 + m2i − m2 . N i=1 (2) On suppose (on dit que le taux de sondage est constant): n2 nr n1 = = ··· = =f N1 N2 Nr Comparer la variance de T à la variance de l’estimateur de m que l’on utiliserait si l’on effectuait un sondage P élémentaire dans la population P, la taille de l’échantillon extrait étant n := ri=1 ni . Quelle est la méthode de sondage la plus efficace? Exercice 47. Considérons la fonction F : R → R définie par: 1 F (x) = , x ∈ R (α > 0, β ∈ R). 1 + e−αx−β 47.1. Montrer que F est la fonction de répartition d’une v.a. Z à densité f . On dit que Z suit la loi logistique. 47.2. Montrer la relation : f (x) = αF (x) 1 − F (x) , pour x ∈ R. 47.3. La fonction logistique est utilisée couramment en biostatistiques, dans le type de situation suivant: on suppose que lorsque l’on injecte une quantité x de substance toxique à un animal, celui ci a une probabilité : 1 , p(x) = 1 + e−αx−β de mourir, où α > 0, β ∈ R sont deux paramètres. On réalise une expérience où k doses différentes de drogues sont injectées, chaque dose est donnée à un certain nombre d’animaux et on note ensuite les animaux qui n’ont pas survécu. Les résultats sont consignés dans un tableau du type: Dose x 1 x2 · · · xk Nombre d’animaux utilisés n1 n2 · · · nk Nombre de décès Y1 Y2 · · · Yk où x1 , x2 , · · · , xk et n1 , n2 , · · · , nk sont des données, et les v.a. Y1 , Y2 , · · · , Yk sont indépendantes. (1) Construire le modèle statistique : quelle est la loi des v.a. Y1 , Y2 , · · · , Yk ? (2) Montrer que le modèle est exponentiel. (3) Montrer que la statistique k X i=1 est exhaustive pour (α, β). Yi , k X i=1 0 xi Y i ,