Loi Gamma, loi du χ2 et loi de Student

publicité
Loi Gamma, loi du 2 et loi de Student
A. Fonction Gamma
A.1. Définition
La fonction Gamma est définie pour les réels positifs par l’intégrale :
( x ) 

0
e  t t x 1 dt pour x  0
A.2 Relation de récurrence
Considérons (x+1) :
( x  1) 

0
e  t t x dt
En intégrant par partie nous obtenons :
(x  1)  x (x) pour x  0
Pour cette raison la fonction Gamma est aussi appelée factorielle généralisée.
A.3 Argument entier ou demi-entier
Calculons (1) :
(1) 

0



e  t dt   e  t 0
1
La relation de récurrence nous permet de calculer (n) pour tout entier n :
(n)  (n  1)!
Calculons maintenant (1/2) :

dt
1
  
e t
0
t
2

Par changement de variable (t = u2) nous obtenons :


2
2
1
  
e  u 2 du 
e  u du  
0

2

S. Tisserant – Eléments de Probabilités – 2009

4-1
Le calcul de cette intégrale se trouve dans l’annexe du chapitre sur la distribution normale.
Ce résultat associé à la formule de récurrence nous permet de calculer la fonction pour tout
demi-entier. Nous avons :
1
 2 n  1  (2 n )!

 n    


2

 2  2 2 n n!
Un résultat très similaire a également été démontré dans l’annexe du chapitre sur la
distribution normale (cf. calcul de I2n).
A.4. Courbes
L’allure de la fonction Gamma est présentée sur la figure suivante. La première courbe a été
tracée entre 0.01 et 6. La seconde, tracée entre 0.1 et 4.5, montre un peu mieux la vallée.
Fig. 4-1 : Fonction Gamma sur [0.01, 6] (à gauche) et sur [0.1, 4.5] (à droite)
Etudions la variation de l’intégrande servant à la définition de la fonction Gamma :
f ( t )  e  t t x 1
Elle a pour dérivée :
d f (t)
 e  t t x  2 (x  1  t)
dt
Celle-ci s’annule pour t = x-1. Donc sur le domaine d’intégration nous avons :
- Pour x > 1 : f(0) = 0, fonction croissante puis décroissante avec maximum en t = x-1 ;
- Pour x = 1 : f(0) = 1, fonction toujours décroissante ;
- Pour x < 1 : f(0)  +, fonction toujours décroissante.
S. Tisserant – Eléments de Probabilités – 2009
4-2
Il est facile de calculer numériquement la fonction Gamma pour x  1. Pour x < 1 on peut
utiliser la relation de récurrence avec :
( x ) 
( x  1)
x
B. Loi Gamma
B.1. Densité de probabilité
La loi Gamma de paramètres a > 0 et b > 0, notée (a, b), a pour densité de probabilité :
f (x) 
a b  a x b 1
e
x
pour x  0
 ( b)
Le paramètre a correspond à un facteur d’échelle. La figure suivante illustre la densité de
probabilité d’une loi Gamma pour quelques valeurs des paramètres.
Fig. 4-2 : Densité de probabilité de (a,b) – en vert : a = 0.5 et b = 1,
en rouge : a = 1 et b = 2, en bleu : a = 0.5 et b = 2.
B.2 Moments
Calculons le moment d’ordre n :
E( x n ) 

ab
e  a x x n  b 1 dx
 ( b) 0

Effectuons un changement de variable :
S. Tisserant – Eléments de Probabilités – 2009
4-3

 ( b)  0
1
u  a x  E( x n ) 
a
n
e  u u n  b 1 du 
1
n
a  ( b)
( b  n )
Nous avons donc :
E( x n ) 
( b  n )
n
a  ( b)

b (b  1) (b  2) ... (b  n  1)
an
En particulier pour les deux premiers moments et la variance nous avons :
E( x ) 
b
a
E( x 2 ) 
var( x ) 
b (b  1)
a2
b
a2
B.3 Fonction caractéristique
Déterminons la fonction caractéristique d’une loi Gamma. Nous avons :
 X ( u )  E (e j u x ) 
 X (u ) 

ab
e  a x e j u x x b 1 dx
 ( b) 0


ab
e  (a  j u ) x x b 1 dx
 ( b) 0

Effectuons un changement de variable :
v  (a  j u ) x   X ( u ) 
 X (u ) 
ab

ab
v b 1
dv
e v
 ( b) 0
(a  j u ) b 1 a  j u



(a  j u ) b  ( b ) 0
e  v v b 1 dv 
ab
(a  j u ) b
Nous avons donc pour la fonction caractéristique d’une loi Gamma de paramètres a et b :
 a 

 X (u )  
a

j
u


S. Tisserant – Eléments de Probabilités – 2009
b
4-4
C. Loi du 2
C.1. Densité de probabilité et fonction de répartition
La loi du 2 à n degrés de liberté est un cas particulier important de la loi Gamma :
1 n
 2 (n )   , 
2 2
Elle a donc pour densité de probabilité :
1
f (x) 
n
2 n  
2
e  x / 2 x n / 2 1
La figure suivante illustre cette densité pour quatre valeurs de n. Pour n  2, la densité est
maximale pour x = n-2 qui constitue alors la valeur la plus probable. La figure 4-4 présente
les fonctions de répartition correspondantes.
Fig. 4-3 : Densité de probabilité de 2(n) pour n = 1 (jaune),
n = 2 (vert), n = 5 (rouge) et n = 10 (bleu).
Nous déduisons des résultats obtenus pour la loi Gamma les deux premiers moments et la
variance d’une loi de 2 :
E( x )  n
E( x 2 )  n (n  2)
var( x )  2 n
De même la fonction caractéristique s’écrit :
S. Tisserant – Eléments de Probabilités – 2009
4-5
 X (u)  (1  2 j u) n / 2
Fig. 4-4 : Fonction de répartition d’une loi de 2(n) pour n=1 (jaune),
n = 2 (vert), n = 5 (rouge) et n = 10 (bleu).
Pour n = 1, nous avons pour la densité de probabilité et la fonction de répartition :
f (x) 
1 e x / 2
2
et
x
 x

F( x )  erf 

 2
Pour n = 2, nous avons pour la densité de probabilité et la fonction de répartition :
f (x) 
1 x / 2
e
2
et
F( x )  1  e  x / 2
Pour n grand (n > 100) la loi 2(n) peut être approximée par la loi normale de moyenne n et de
variance 2n : N (n, 2 n ) .
C.2. Intervalles de confiance
La distribution de 2 est souvent utilisée pour définir des intervalles de confiance. Deux types
d’intervalles peuvent être définis. Le premier intervalle, à un seul pivot, [0, a] correspondant à
un niveau confiance , ou facteur de risque , est tel que :
P( x  a )    1  
Cette définition est illustrée par la figure 4-5, construite pour n = 10 et  = 90 %.
Pour un intervalle, basé sur deux pivots, [a, b] la définition :
P( a  x  b)    1  
S. Tisserant – Eléments de Probabilités – 2009
4-6
n’est pas suffisante. Nous pouvons, par exemple, choisir les deux bornes de l’intervalle en
prenant une définition symétrique :
P ( x  a )  P ( x  b)   

2
Cette définition est illustrée par la figure 4-6, également construite pour n = 10 et  = 90 %.
Fig. 4-5 : La surface bleue représente le niveau de confiance ,
alors que l’aire verte correspond à .
Fig. 4-6 : La surface bleue représente le niveau de confiance ,
alors que chaque aire verte correspond à .
Dans tous les cas la détermination d’une borne correspond à la résolution d’une équation du
type :
S. Tisserant – Eléments de Probabilités – 2009
4-7
P(x  c)  F(c)    c  F 1 ()
La solution c est appelée quantile d’ordre , parfois notée :
c   2 (n )
La table 4-1, en fin de chapitre, rassemble quelques quantiles pour diverses valeurs de n et .
C.3. Simulation
Une manière (pas la plus efficace) de simuler une variable pseudo-aléatoire suivant une loi du
chi2 à n degrés de liberté consiste à prendre la somme des carrés de n variables pseudoaléatoires normales centrées indépendantes :
n
x
 xi2
avec x i  N (0,1) et ind.
i 1
La figure suivante présente la distribution obtenue de cette façon pour n = 10, comparée avec
la densité de probabilité théorique normalisée au nombre d’événements engendrés.
Fig. 4-7 : Simulation d’une loi de 2(n) pour n = 10.
D. Loi de Student
Considérons deux variables aléatoires indépendantes x variable normale centrée réduite et z
suivant une loi de 2 à n degrés de liberté (n  1). La variable aléatoire t définie par :
t
S. Tisserant – Eléments de Probabilités – 2009
x
zn
4-8
suit une loi de Student à n degrés de liberté, ayant pour densité de probabilité :
f ( t; n ) 
( n 1) / 2
 (n  1) 2  t 2 
1
n 
n   (n 2) 
1
La figure 4-8 présente l’allure de cette densité de probabilité pour trois valeurs de n. Lorsque
n tend vers l’infini elle tend vers la distribution normale centrée réduite (en noir sur la figure).
Comparée à celle-ci une distribution de Student présente des queues plus importantes pour n
petit. La figure 4-9 présente l’allure de la fonction de répartition pour les mêmes valeurs de n.
Fig. 4-8 : Densité de probabilité d’une loi de Student pour n = 1 (vert), n = 2 (rouge) et
n = 5 (bleu), comparée à une loi normale centrée réduite (noir).
Fig. 4-9 : Fonction de répartition d’une loi de Student pour n = 1 (vert),
n = 2 (rouge) et n = 5 (bleu).
S. Tisserant – Eléments de Probabilités – 2009
4-9
Pour n = 1 il s’agit d’une distribution de Cauchy ou Breit-Wigner.
L’espérance mathématique n’est définie que pour n > 1 et la variance pour n > 2 :
E( t )  0
var( t ) 
pour n  1
n
n2
pour n  2
La distribution de Student est souvent utilisée pour définir des intervalles de confiance. Par
définition un intervalle symétrique [-a, a] correspondant à un niveau confiance , ou facteur
de risque , est tel que :
P( t  a )    1  
Fig. 4-10 : La surface bleue représente le niveau de confiance ,
alors que chaque aire verte correspond à .
Cette définition correspond à la surface bleue de la figure 4-10. La distribution de Student
étant symétrique, les deux zones vertes sur cette figure ont la même aire :
P(t  a )  P(t  a )  
De manière évidente nous avons :
  1  2  et  

2
La borne a s’obtient par exemple en inversant la fonction de répartition :
F(a; n)  1  
S. Tisserant – Eléments de Probabilités – 2009
4 - 10
La quantité a est appelée quantile d’ordre 1- de la loi de Student à n degrés de liberté. Nous
la notons :
a  t1n 
Remarquons que :
P(t  a )    F(a; n)    a  t n
Nous avons donc :
t1n    t n
Le résultat est tabulé dans la table 4-2 pour diverses valeurs de n et du niveau de confiance .
S. Tisserant – Eléments de Probabilités – 2009
4 - 11
n\
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
0.005
0.00
0.01
0.07
0.21
0.41
0.68
0.99
1.34
1.73
2.16
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
8.03
8.64
9.26
9.89
10.52
11.16
11.81
12.46
13.12
13.79
20.71
27.99
35.53
43.28
51.17
59.20
67.33
0.010
0.00
0.02
0.11
0.30
0.55
0.87
1.24
1.65
2.09
2.56
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
8.90
9.54
10.20
10.86
11.52
12.20
12.88
13.56
14.26
14.95
22.16
29.71
37.48
45.44
53.54
61.75
70.06
0.025
0.00
0.05
0.22
0.48
0.83
1.24
1.69
2.18
2.70
3.25
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.59
10.28
10.98
11.69
12.40
13.12
13.84
14.57
15.31
16.05
16.79
24.43
32.36
40.48
48.76
57.15
65.65
74.22
0.050
0.00
0.10
0.35
0.71
1.15
1.64
2.17
2.73
3.33
3.94
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.12
10.85
11.59
12.34
13.09
13.85
14.61
15.38
16.15
16.93
17.71
18.49
26.51
34.76
43.19
51.74
60.39
69.13
77.93
0.100
0.02
0.21
0.58
1.06
1.61
2.20
2.83
3.49
4.17
4.87
5.58
6.30
7.04
7.79
8.55
9.31
10.09
10.86
11.65
12.44
13.24
14.04
14.85
15.66
16.47
17.29
18.11
18.94
19.77
20.60
29.05
37.69
46.46
55.33
64.28
73.29
82.36
0.500
0.45
1.39
2.37
3.36
4.35
5.35
6.35
7.34
8.34
9.34
10.34
11.34
12.34
13.34
14.34
15.34
16.34
17.34
18.34
19.34
20.34
21.34
22.34
23.34
24.34
25.34
26.34
27.34
28.34
29.34
39.34
49.33
59.33
69.33
79.33
89.33
99.33
0.900 0.950 0.975 0.990
2.71
3.84
5.02
6.63
4.61
5.99
7.38
9.21
6.25
7.81
9.35
11.35
7.78
9.49
11.14 13.28
9.24
11.07 12.83 15.09
10.64 12.59 14.45 16.81
12.02 14.07 16.01 18.48
13.36 15.51 17.53 20.09
14.68 16.92 19.02 21.67
15.99 18.31 20.48 23.21
17.28 19.68 21.92 24.72
18.55 21.03 23.34 26.22
19.81 22.36 24.74 27.69
21.06 23.68 26.12 29.14
22.31 25.00 27.49 30.58
23.54 26.30 28.85 32.00
24.77 27.59 30.19 33.41
25.99 28.87 31.53 34.81
27.20 30.14 32.85 36.19
28.41 31.41 34.17 37.57
29.62 32.67 35.48 38.93
30.81 33.92 36.78 40.29
32.01 35.17 38.08 41.64
33.20 36.42 39.36 42.98
34.38 37.65 40.65 44.31
35.56 38.89 41.92 45.64
36.74 40.11 43.19 46.96
37.92 41.34 44.46 48.28
39.09 42.56 45.72 49.59
40.26 43.77 46.98 50.89
51.81 55.76 59.34 63.69
63.17 67.50 71.42 76.15
74.40 79.08 83.30 88.38
85.53 90.53 95.02 100.43
96.58 101.88 106.63 112.33
107.57 113.15 118.14 124.12
118.50 124.34 129.56 135.81
0.995
7.88
10.60
12.84
14.86
16.75
18.55
20.28
21.95
23.59
25.19
26.76
28.30
29.82
31.32
32.80
34.27
35.72
37.16
38.58
40.00
41.40
42.80
44.18
45.56
46.93
48.29
49.64
50.99
52.34
53.67
66.77
79.49
91.95
104.21
116.32
128.30
140.17
Table 4-1 : Quantiles pour une loi du 2 à n degrés de liberté. Chaque case, identifiée par n et
, donne c tel que P(x < c) = .
S. Tisserant – Eléments de Probabilités – 2009
4 - 12

1-
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100
0.50
0.75
1.000
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.691
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.681
0.679
0.679
0.678
0.678
0.677
0.677
0.60
0.80
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.851
0.849
0.848
0.847
0.846
0.846
0.845
0.70
0.85
1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.050
1.047
1.045
1.044
1.043
1.042
1.042
0.80
0.90
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.299
1.296
1.294
1.292
1.291
1.290
0.90
0.95
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.684
1.676
1.671
1.667
1.664
1.662
1.660
0.95
0.975
12.71
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.021
2.009
2.000
1.994
1.990
1.987
1.984
0.98
0.99
31.82
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.423
2.403
2.390
2.381
2.374
2.368
2.364
0.99
0.995
63.66
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.704
2.678
2.660
2.648
2.639
2.632
2.626
0.995
0.9975
127.3
14.09
7.453
5.598
4.773
4.317
4.029
3.833
3.690
3.581
3.497
3.428
3.372
3.326
3.286
3.252
3.222
3.197
3.174
3.153
3.135
3.119
3.104
3.091
3.078
3.067
3.057
3.047
3.038
3.030
2.971
2.937
2.915
2.899
2.887
2.878
2.871
0.998
0.999
318.3
22.33
10.21
7.173
5.893
5.208
4.785
4.501
4.297
4.144
4.025
3.930
3.852
3.787
3.733
3.686
3.646
3.610
3.579
3.552
3.527
3.505
3.485
3.467
3.450
3.435
3.421
3.408
3.396
3.385
3.307
3.261
3.232
3.211
3.195
3.183
3.174
0.999
0.9995
636.6
31.60
12.92
8.610
6.869
5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.850
3.819
3.792
3.768
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.551
3.496
3.460
3.435
3.416
3.402
3.390
Table 4-2 : Quantiles pour une loi de Student à n degrés de liberté. Chaque case, identifiée
par n et  ou n et 1-, donne c tel que P(|x| < c) =  ou P(x > c) = .
S. Tisserant – Eléments de Probabilités – 2009
4 - 13
Téléchargement