Loi Gamma, loi du 2 et loi de Student A. Fonction Gamma A.1. Définition La fonction Gamma est définie pour les réels positifs par l’intégrale : ( x ) 0 e t t x 1 dt pour x 0 A.2 Relation de récurrence Considérons (x+1) : ( x 1) 0 e t t x dt En intégrant par partie nous obtenons : (x 1) x (x) pour x 0 Pour cette raison la fonction Gamma est aussi appelée factorielle généralisée. A.3 Argument entier ou demi-entier Calculons (1) : (1) 0 e t dt e t 0 1 La relation de récurrence nous permet de calculer (n) pour tout entier n : (n) (n 1)! Calculons maintenant (1/2) : dt 1 e t 0 t 2 Par changement de variable (t = u2) nous obtenons : 2 2 1 e u 2 du e u du 0 2 S. Tisserant – Eléments de Probabilités – 2009 4-1 Le calcul de cette intégrale se trouve dans l’annexe du chapitre sur la distribution normale. Ce résultat associé à la formule de récurrence nous permet de calculer la fonction pour tout demi-entier. Nous avons : 1 2 n 1 (2 n )! n 2 2 2 2 n n! Un résultat très similaire a également été démontré dans l’annexe du chapitre sur la distribution normale (cf. calcul de I2n). A.4. Courbes L’allure de la fonction Gamma est présentée sur la figure suivante. La première courbe a été tracée entre 0.01 et 6. La seconde, tracée entre 0.1 et 4.5, montre un peu mieux la vallée. Fig. 4-1 : Fonction Gamma sur [0.01, 6] (à gauche) et sur [0.1, 4.5] (à droite) Etudions la variation de l’intégrande servant à la définition de la fonction Gamma : f ( t ) e t t x 1 Elle a pour dérivée : d f (t) e t t x 2 (x 1 t) dt Celle-ci s’annule pour t = x-1. Donc sur le domaine d’intégration nous avons : - Pour x > 1 : f(0) = 0, fonction croissante puis décroissante avec maximum en t = x-1 ; - Pour x = 1 : f(0) = 1, fonction toujours décroissante ; - Pour x < 1 : f(0) +, fonction toujours décroissante. S. Tisserant – Eléments de Probabilités – 2009 4-2 Il est facile de calculer numériquement la fonction Gamma pour x 1. Pour x < 1 on peut utiliser la relation de récurrence avec : ( x ) ( x 1) x B. Loi Gamma B.1. Densité de probabilité La loi Gamma de paramètres a > 0 et b > 0, notée (a, b), a pour densité de probabilité : f (x) a b a x b 1 e x pour x 0 ( b) Le paramètre a correspond à un facteur d’échelle. La figure suivante illustre la densité de probabilité d’une loi Gamma pour quelques valeurs des paramètres. Fig. 4-2 : Densité de probabilité de (a,b) – en vert : a = 0.5 et b = 1, en rouge : a = 1 et b = 2, en bleu : a = 0.5 et b = 2. B.2 Moments Calculons le moment d’ordre n : E( x n ) ab e a x x n b 1 dx ( b) 0 Effectuons un changement de variable : S. Tisserant – Eléments de Probabilités – 2009 4-3 ( b) 0 1 u a x E( x n ) a n e u u n b 1 du 1 n a ( b) ( b n ) Nous avons donc : E( x n ) ( b n ) n a ( b) b (b 1) (b 2) ... (b n 1) an En particulier pour les deux premiers moments et la variance nous avons : E( x ) b a E( x 2 ) var( x ) b (b 1) a2 b a2 B.3 Fonction caractéristique Déterminons la fonction caractéristique d’une loi Gamma. Nous avons : X ( u ) E (e j u x ) X (u ) ab e a x e j u x x b 1 dx ( b) 0 ab e (a j u ) x x b 1 dx ( b) 0 Effectuons un changement de variable : v (a j u ) x X ( u ) X (u ) ab ab v b 1 dv e v ( b) 0 (a j u ) b 1 a j u (a j u ) b ( b ) 0 e v v b 1 dv ab (a j u ) b Nous avons donc pour la fonction caractéristique d’une loi Gamma de paramètres a et b : a X (u ) a j u S. Tisserant – Eléments de Probabilités – 2009 b 4-4 C. Loi du 2 C.1. Densité de probabilité et fonction de répartition La loi du 2 à n degrés de liberté est un cas particulier important de la loi Gamma : 1 n 2 (n ) , 2 2 Elle a donc pour densité de probabilité : 1 f (x) n 2 n 2 e x / 2 x n / 2 1 La figure suivante illustre cette densité pour quatre valeurs de n. Pour n 2, la densité est maximale pour x = n-2 qui constitue alors la valeur la plus probable. La figure 4-4 présente les fonctions de répartition correspondantes. Fig. 4-3 : Densité de probabilité de 2(n) pour n = 1 (jaune), n = 2 (vert), n = 5 (rouge) et n = 10 (bleu). Nous déduisons des résultats obtenus pour la loi Gamma les deux premiers moments et la variance d’une loi de 2 : E( x ) n E( x 2 ) n (n 2) var( x ) 2 n De même la fonction caractéristique s’écrit : S. Tisserant – Eléments de Probabilités – 2009 4-5 X (u) (1 2 j u) n / 2 Fig. 4-4 : Fonction de répartition d’une loi de 2(n) pour n=1 (jaune), n = 2 (vert), n = 5 (rouge) et n = 10 (bleu). Pour n = 1, nous avons pour la densité de probabilité et la fonction de répartition : f (x) 1 e x / 2 2 et x x F( x ) erf 2 Pour n = 2, nous avons pour la densité de probabilité et la fonction de répartition : f (x) 1 x / 2 e 2 et F( x ) 1 e x / 2 Pour n grand (n > 100) la loi 2(n) peut être approximée par la loi normale de moyenne n et de variance 2n : N (n, 2 n ) . C.2. Intervalles de confiance La distribution de 2 est souvent utilisée pour définir des intervalles de confiance. Deux types d’intervalles peuvent être définis. Le premier intervalle, à un seul pivot, [0, a] correspondant à un niveau confiance , ou facteur de risque , est tel que : P( x a ) 1 Cette définition est illustrée par la figure 4-5, construite pour n = 10 et = 90 %. Pour un intervalle, basé sur deux pivots, [a, b] la définition : P( a x b) 1 S. Tisserant – Eléments de Probabilités – 2009 4-6 n’est pas suffisante. Nous pouvons, par exemple, choisir les deux bornes de l’intervalle en prenant une définition symétrique : P ( x a ) P ( x b) 2 Cette définition est illustrée par la figure 4-6, également construite pour n = 10 et = 90 %. Fig. 4-5 : La surface bleue représente le niveau de confiance , alors que l’aire verte correspond à . Fig. 4-6 : La surface bleue représente le niveau de confiance , alors que chaque aire verte correspond à . Dans tous les cas la détermination d’une borne correspond à la résolution d’une équation du type : S. Tisserant – Eléments de Probabilités – 2009 4-7 P(x c) F(c) c F 1 () La solution c est appelée quantile d’ordre , parfois notée : c 2 (n ) La table 4-1, en fin de chapitre, rassemble quelques quantiles pour diverses valeurs de n et . C.3. Simulation Une manière (pas la plus efficace) de simuler une variable pseudo-aléatoire suivant une loi du chi2 à n degrés de liberté consiste à prendre la somme des carrés de n variables pseudoaléatoires normales centrées indépendantes : n x xi2 avec x i N (0,1) et ind. i 1 La figure suivante présente la distribution obtenue de cette façon pour n = 10, comparée avec la densité de probabilité théorique normalisée au nombre d’événements engendrés. Fig. 4-7 : Simulation d’une loi de 2(n) pour n = 10. D. Loi de Student Considérons deux variables aléatoires indépendantes x variable normale centrée réduite et z suivant une loi de 2 à n degrés de liberté (n 1). La variable aléatoire t définie par : t S. Tisserant – Eléments de Probabilités – 2009 x zn 4-8 suit une loi de Student à n degrés de liberté, ayant pour densité de probabilité : f ( t; n ) ( n 1) / 2 (n 1) 2 t 2 1 n n (n 2) 1 La figure 4-8 présente l’allure de cette densité de probabilité pour trois valeurs de n. Lorsque n tend vers l’infini elle tend vers la distribution normale centrée réduite (en noir sur la figure). Comparée à celle-ci une distribution de Student présente des queues plus importantes pour n petit. La figure 4-9 présente l’allure de la fonction de répartition pour les mêmes valeurs de n. Fig. 4-8 : Densité de probabilité d’une loi de Student pour n = 1 (vert), n = 2 (rouge) et n = 5 (bleu), comparée à une loi normale centrée réduite (noir). Fig. 4-9 : Fonction de répartition d’une loi de Student pour n = 1 (vert), n = 2 (rouge) et n = 5 (bleu). S. Tisserant – Eléments de Probabilités – 2009 4-9 Pour n = 1 il s’agit d’une distribution de Cauchy ou Breit-Wigner. L’espérance mathématique n’est définie que pour n > 1 et la variance pour n > 2 : E( t ) 0 var( t ) pour n 1 n n2 pour n 2 La distribution de Student est souvent utilisée pour définir des intervalles de confiance. Par définition un intervalle symétrique [-a, a] correspondant à un niveau confiance , ou facteur de risque , est tel que : P( t a ) 1 Fig. 4-10 : La surface bleue représente le niveau de confiance , alors que chaque aire verte correspond à . Cette définition correspond à la surface bleue de la figure 4-10. La distribution de Student étant symétrique, les deux zones vertes sur cette figure ont la même aire : P(t a ) P(t a ) De manière évidente nous avons : 1 2 et 2 La borne a s’obtient par exemple en inversant la fonction de répartition : F(a; n) 1 S. Tisserant – Eléments de Probabilités – 2009 4 - 10 La quantité a est appelée quantile d’ordre 1- de la loi de Student à n degrés de liberté. Nous la notons : a t1n Remarquons que : P(t a ) F(a; n) a t n Nous avons donc : t1n t n Le résultat est tabulé dans la table 4-2 pour diverses valeurs de n et du niveau de confiance . S. Tisserant – Eléments de Probabilités – 2009 4 - 11 n\ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0.005 0.00 0.01 0.07 0.21 0.41 0.68 0.99 1.34 1.73 2.16 2.60 3.07 3.57 4.07 4.60 5.14 5.70 6.26 6.84 7.43 8.03 8.64 9.26 9.89 10.52 11.16 11.81 12.46 13.12 13.79 20.71 27.99 35.53 43.28 51.17 59.20 67.33 0.010 0.00 0.02 0.11 0.30 0.55 0.87 1.24 1.65 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 8.90 9.54 10.20 10.86 11.52 12.20 12.88 13.56 14.26 14.95 22.16 29.71 37.48 45.44 53.54 61.75 70.06 0.025 0.00 0.05 0.22 0.48 0.83 1.24 1.69 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 10.28 10.98 11.69 12.40 13.12 13.84 14.57 15.31 16.05 16.79 24.43 32.36 40.48 48.76 57.15 65.65 74.22 0.050 0.00 0.10 0.35 0.71 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.12 10.85 11.59 12.34 13.09 13.85 14.61 15.38 16.15 16.93 17.71 18.49 26.51 34.76 43.19 51.74 60.39 69.13 77.93 0.100 0.02 0.21 0.58 1.06 1.61 2.20 2.83 3.49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.09 10.86 11.65 12.44 13.24 14.04 14.85 15.66 16.47 17.29 18.11 18.94 19.77 20.60 29.05 37.69 46.46 55.33 64.28 73.29 82.36 0.500 0.45 1.39 2.37 3.36 4.35 5.35 6.35 7.34 8.34 9.34 10.34 11.34 12.34 13.34 14.34 15.34 16.34 17.34 18.34 19.34 20.34 21.34 22.34 23.34 24.34 25.34 26.34 27.34 28.34 29.34 39.34 49.33 59.33 69.33 79.33 89.33 99.33 0.900 0.950 0.975 0.990 2.71 3.84 5.02 6.63 4.61 5.99 7.38 9.21 6.25 7.81 9.35 11.35 7.78 9.49 11.14 13.28 9.24 11.07 12.83 15.09 10.64 12.59 14.45 16.81 12.02 14.07 16.01 18.48 13.36 15.51 17.53 20.09 14.68 16.92 19.02 21.67 15.99 18.31 20.48 23.21 17.28 19.68 21.92 24.72 18.55 21.03 23.34 26.22 19.81 22.36 24.74 27.69 21.06 23.68 26.12 29.14 22.31 25.00 27.49 30.58 23.54 26.30 28.85 32.00 24.77 27.59 30.19 33.41 25.99 28.87 31.53 34.81 27.20 30.14 32.85 36.19 28.41 31.41 34.17 37.57 29.62 32.67 35.48 38.93 30.81 33.92 36.78 40.29 32.01 35.17 38.08 41.64 33.20 36.42 39.36 42.98 34.38 37.65 40.65 44.31 35.56 38.89 41.92 45.64 36.74 40.11 43.19 46.96 37.92 41.34 44.46 48.28 39.09 42.56 45.72 49.59 40.26 43.77 46.98 50.89 51.81 55.76 59.34 63.69 63.17 67.50 71.42 76.15 74.40 79.08 83.30 88.38 85.53 90.53 95.02 100.43 96.58 101.88 106.63 112.33 107.57 113.15 118.14 124.12 118.50 124.34 129.56 135.81 0.995 7.88 10.60 12.84 14.86 16.75 18.55 20.28 21.95 23.59 25.19 26.76 28.30 29.82 31.32 32.80 34.27 35.72 37.16 38.58 40.00 41.40 42.80 44.18 45.56 46.93 48.29 49.64 50.99 52.34 53.67 66.77 79.49 91.95 104.21 116.32 128.30 140.17 Table 4-1 : Quantiles pour une loi du 2 à n degrés de liberté. Chaque case, identifiée par n et , donne c tel que P(x < c) = . S. Tisserant – Eléments de Probabilités – 2009 4 - 12 1- 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0.50 0.75 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.681 0.679 0.679 0.678 0.678 0.677 0.677 0.60 0.80 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.851 0.849 0.848 0.847 0.846 0.846 0.845 0.70 0.85 1.963 1.386 1.250 1.190 1.156 1.134 1.119 1.108 1.100 1.093 1.088 1.083 1.079 1.076 1.074 1.071 1.069 1.067 1.066 1.064 1.063 1.061 1.060 1.059 1.058 1.058 1.057 1.056 1.055 1.055 1.050 1.047 1.045 1.044 1.043 1.042 1.042 0.80 0.90 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.299 1.296 1.294 1.292 1.291 1.290 0.90 0.95 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.676 1.671 1.667 1.664 1.662 1.660 0.95 0.975 12.71 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.009 2.000 1.994 1.990 1.987 1.984 0.98 0.99 31.82 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.403 2.390 2.381 2.374 2.368 2.364 0.99 0.995 63.66 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.678 2.660 2.648 2.639 2.632 2.626 0.995 0.9975 127.3 14.09 7.453 5.598 4.773 4.317 4.029 3.833 3.690 3.581 3.497 3.428 3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.135 3.119 3.104 3.091 3.078 3.067 3.057 3.047 3.038 3.030 2.971 2.937 2.915 2.899 2.887 2.878 2.871 0.998 0.999 318.3 22.33 10.21 7.173 5.893 5.208 4.785 4.501 4.297 4.144 4.025 3.930 3.852 3.787 3.733 3.686 3.646 3.610 3.579 3.552 3.527 3.505 3.485 3.467 3.450 3.435 3.421 3.408 3.396 3.385 3.307 3.261 3.232 3.211 3.195 3.183 3.174 0.999 0.9995 636.6 31.60 12.92 8.610 6.869 5.959 5.408 5.041 4.781 4.587 4.437 4.318 4.221 4.140 4.073 4.015 3.965 3.922 3.883 3.850 3.819 3.792 3.768 3.745 3.725 3.707 3.690 3.674 3.659 3.646 3.551 3.496 3.460 3.435 3.416 3.402 3.390 Table 4-2 : Quantiles pour une loi de Student à n degrés de liberté. Chaque case, identifiée par n et ou n et 1-, donne c tel que P(|x| < c) = ou P(x > c) = . S. Tisserant – Eléments de Probabilités – 2009 4 - 13