Exercice 61 On commence par ranger les donnés dans l’ordre croissant : x⇤1 = 54.8, x⇤2 = 55.4 etc... 1. Par la loi empirique de Sturges, on choisit un nombre de classes à peu près égal à 1 + log2 (20) ⇡ 5. On obtient l’histogramme ci-dessous : La loi semble répartie également de part et d’autres de la valeur 64 et plus concentrée en cette valeur. On peut donc supposer qu’il s’agisse d’une loi normale centrée en 64. 2. Si X est de loi Exp ( ), sa fonction de répartion est donné par F (x) = 1 e x pour x 0 d’où ln (1 F (x)) = x. Par conséquent, le graphe de probabilités pour la loi exponentielle est le nuage de points x⇤i , ln 1 ni pour i 2 {1, . . . , n 1} (le dernier point doit être enlevé car ln est définir sur R⇤+ ). On obtient le graphe suivant : 1 Clairement, les points ne sont pas alignés ce qui laisse penser que la loi du bruit dans Montreal ne suit pas une loi exponentielle. Si X est de loi N µ, 2 , alors U = F (x) = X µ est de loi N (0, 1). Alors, sa fonction de répartition est donnée ✓ ◆ ✓ ◆ x µ x µ P (X x) = P U = où est la fonction de réparition de la loi N (0, 1). Etant donné que est strictement croissante, elle est 1 inversible et on a (F (x)) = x µ = 1 x µ . Par conséquent, le graphe de probabilités pour la loi normale et le nuage de points x⇤i , 1 ni . On obtient le graphe suivant : 2 Les points semblent alignés donc on valide l’hypothèse que la loi du bruit dans les rues de Montreal est une loi normale. 3. La première estimation est tirée du graphe des probabilités : on trace sur le graphique précédent la droite autour de laquelle les points semblent alignés : dans mon cas, il s’agit de la droite d’équation ! 3 20 x⇤3 1 y = ⇡ 1 57.7 0.18x 16 20 x⇤16 3 20 1 = 1 68.1 16 20 x+ 1 x+ 1 (x⇤3 ) 3 20 x⇤3 1 (57.7) x⇤16 3 20 1 16 20 1 1 57.7 68.1 11.46 c’est à dire la droite qui rejoint les points 57.7, 1 3 (57.7) et 68.1, 1 (68.1) . 17 20 · x⇤3 · 57.7 ! On a donc un estimateur de la moyenne et de la variance de cette loi donnés par ✓ ◆2 p 1 2 = 2 · 11.46 ⇡ 63, 7 ⇡ 30.9, µ = 0.18 La deuxième estimation est obtenue par une simple analyse des données. C’est la moyenne empirique µ̃ et la variance empirique ˜2 = = 20 X x⇤i = 64.245 20 n=1 20 X (x⇤i n=1 µ̃) n 2 ⇡ 25.23 4. Pour estimer la probabilité que le bruit dépasse une certaine valeur, on peut se servir de la fonction de répartition empirique 8 > si x < x⇤1 <0 i F20 (x) = 20 si x⇤i x < x⇤i+1 > : 1 si xi x⇤20 Ainsi, un extimateur de la probabilité que le bruit dépasse 70dB est 1 F20 (70) = 1 17 20 = 0.85. Un estimateur de la probabilité que le bruit dépasse 74dB est 1 F20 (74) = 1 1 = 0. On peut aussi se servir de la véritable fonction de répartion de la loi N (63, 7; 30, 9) (on trouve à peu près les quantités 0,87 et 0,87) ou celle de la loi N (64, 245; 25, 23) (on trouve les quantités 0,87 et 0,97). 4 Exercice 62 De même que dans l’exercice précédent, on note (x⇤i )1i25 les données triées dans l’ordre croissant. 1. Par la loi empirique de Sturges, on choisit un nombre de classes à peu près égal à 1 + log2 (25) ⇡ 5. On obtient l’histogramme ci-dessous : 2. On dresse le tableau suivant : 1 1 i x⇤i i n ⇡ i x⇤i i n ⇡ 1 1,4 -1,75 13 9.1 0.05 2 1,6 -1,41 14 9.5 0.15 3 3,5 -1,18 15 9,8 0,25 et le graphe des probabilités x⇤i , 4 3,9 -0,99 16 10.2 0.36 1 i n 5 3.9 -0.84 17 1à,3 0,47 i 6 4.8 -0.71 18 11.2 0.58 suivant : 5 19 11,9 0,71 7 6,7 -0,58 20 12.7 0.84 8 6.8 -0.47 21 12,9 0,99 9 7,6 -0,36 10 8.2 -0.25 22 13,8 1,18 23 14,5 1,41 11 8,6 0,15 24 18 1,75 12 9.0 -0.05 Les points ne sont pas alignés. On invalide l’hypothèse que la durée entre un sinistre et son remboursement suit une loi normale. 3. On utilise la fonction de répartition empirique : F25 (3) = 2 25 = 0.08. Exercice 63 P(X=k) e 1. Soit X une loi de Poisson de paramètre . On constate que pour tout k, P(X=k+1) = k! · (k+1)! = k+1 = k+1 e 1 k + 1 . Ainsi, on peut supposer que si on réalise n fois la variable aléatoire X, les fréquences empiriques ⇣ ⌘ nombres de réalisations prenant la valeur k pk pk = vérifieront que le fait suivant : les points k, seront n pk+1 k alignés et disposés sur la droite d’équation y = x + 1. 2. Dans notre exemple, on a un échantillon de n = 1000 réalisations de notre variable aléatoire qui prennent des valeurs de 0 à 9 données dans le tableau suivant : Nombre d’appels k Fréquence pk pk pk+1 ⇡ 0 0.13 0.51 1 0.255 0.90 2 0.283 1.54 3 0.184 1.94 4 0.095 2.57 5 0.037 3.36 6 0.011 2.75 ⇣ ⌘ On trace les points k, pk+1 pour 0 k 7, on obtient le graphe suivant : pk 6 7 0.004 4 8 0.001 9 0 On invalide l’hypothèse de la loi de Poisson en constatant que les points ne sont pas alignés : Exercice 64 1. On veut des classes de même effectif, c’est à dire que le nombre de données dans une classe doit être un diviseur de 10, soit 2 soit 5, soit 10. Prenons 5 classes, c’est à dire des classes avec 2 données. On peut par exemple obtenir l’histogramme suivant : 7 2. On remarque que (formellement) 1 , ln (1 , ln ( ln (1 On propose donc la transformation ln ( ln (1 {1, . . . , n 1} et on observe s’ils sont alignés. F (x) = exp F (x)) = F (x))) = ✓ ◆ x ⌘ ln (x) ✓ ◆ ! x ⌘ ln (⌘) F )). On trace les points ln (x⇤i ) , ln ln 1 3. On obtient le tableau suivant : ln i x⇤i ln (x⇤i ) ⇡ ln 1 ni ⇡ 1 0.89 -0.17 -2.25 2 1.10 0.10 -1.50 3 1.69 0.52 -1.03 4 2.11 0.75 -0.67 5 2.40 0.88 -0.37 et le graphe suivant : 8 6 2.66 0.98 -0.09 7 2.80 1.03 0.19 8 3.42 1.23 0.48 9 4.20 1.44 0.83 10 4.65 i n pour i 2 Comme les points sont à peu près alignés, on valide la loi de la durée de bon fonctionnement d’un interrupteur proposée par l’équipe de statisticiens. 4. On trace la droite qui semble relier les points : 9 Dans mon cas, la droite est d’équation : y = ⇡ ln 1.91x ln 1 9 10 ln (x⇤9 ) 1.92 ln ln 1 ln (x⇤1 ) 1 10 x ln ln (x⇤9 ) c’est à dire la droite qui rejoint les points ln (x⇤1 ) , ln un estimateur de et ⌘ donnés par = ⌘ = 0 B exp @ ln ln 1 ln 1 9 10 ln (x⇤9 ) ln( ln(1 )) ln( ) 9 10 x⇤ 9 9 10 ln 1 ln( ln(1 ln( x⇤ 1 ) 10 1 10 ln ln 1 ln (x⇤1 ) 1 10 )) x⇤1 + ln 1 10 ln ln 1 ln (x⇤1 ) et ln (x⇤9 ) , ln 1 10 x⇤1 + ln ln 1 9 10 ⇡ 1.91 ln 1 1 10 1 ✓ C A ⇡ 1.92 ✓ ln 1 1 10 ◆◆ . On a donc