Autres LOIS de PROBABILITES Professeur Pascale FRIANT-MICHEL > Faculté de Pharmacie [email protected] Les autres LOIS de PROBABILITES I - INTRODUCTION > II - LOI du x2 (1) - Grand nombre de lois de probabilités - Etude de trois lois très utilisées dans les tests statistiques de formulation connue mais complexe => seules leurs principales caractéristiques seront données II – LOI du χ2 (lettre grecque : khi, on dit : loi du khi deux) Permet, en particulier, de comparer des distributions 1. Définition Soient X1, X2, . . . Xν, ν lois normales centrées réduites N (0, 1) indépendantes II - LOI du χ2 (2) 1. Définition (2) La loi de χ2 à ν degrés de liberté est la loi de la variable aléatoire somme : χ2 ν = X 12 + X 22 + . . . + X 2ν Remarque : χ2 à 1 degré de liberté est le carré d’une variable normale centrée réduite ? ? ? 2. Propriétés a) χ2 ∈ [ 0, + ∞ [ b) distribution de χ2 continue c) représentation graphique de la loi de χ2 . courbe en cloche unimodale asymétrique avec étalement vers la droite (pour les faibles valeurs de ν) . famille de courbes de χ2 suivant le nombre ν de degrés de liberté II - LOI du χ2 (3) 2. Propriétés (2) P (χ2) ν=4 0,15 ν=1 0,10 ν = 15 0,05 0 10 20 30 χ2 . La loi de χ2 tend vers la loi normale quand ν ∞ Les deux lois deviennent quasiment identiques quand ν > 30 d) En pratique : tables de la distribution de χ2 tables établies par PEARSON II - LOI du χ2 (4) 3. Table du χ2 (la plus utilisée) . donne, en fonction du nombre de degrés de liberté, les valeurs limites χ2α du χ2 correspondant au coefficient de risque α P (χ2) α 0 χ2α χ2 . table à double entrée (du fait de la dépendance en ν) La valeur de α est lue en ligne, celle de ν en colonne, la valeur recherchée χ2α se situant à l’intersection II - LOI du χ2 (5) 3. Table du χ2 (2) Exemple : α ν 0,99 ... pour ν = 8 et α = 0,05 ... 0,05 1 3,841 . . 8 ... ... ... 0,010 ? . . . 30 Dans les tests statistiques, on utilise souvent comme seuil de risque : α=5% α=1% soit pour ν = 8 " χ25% = 15,51 χ21% = 20,09 avec II - LOI du χ2 (6) > III - LOI de STUDENT ou de STUDENT-FISHER (1) 3. Table du χ2 (3) Remarques : - pour toute la 1ère ligne, les valeurs sont celles du carré de la variable normale centrée réduite t - la table s’arrête pour ν = 30, au-delà on prend l’approximation de la loi normale et on utilise la table de t III - LOI de STUDENT ou de STUDENT-FISHER Permet, en particulier, de comparer les moyennes d’échantillons 1. Définition La loi de STUDENT notée ts à ν degrés de liberté est le quotient d’une loi normale centrée réduite N (0, 1) par la racine carrée d’une loi du khi2 à ν degrés de liberté divisée par ν ; les deux lois étant indépendantes N (0, 1) ts= χ2 ν III - LOI de STUDENT ou de STUDENT-FISHER (2) 2. Propriétés a) t s ∈ ] - ∞, + ∞ [ b) représentation graphique de la loi de STUDENT . courbe en cloche symétrique, plus aplatie que la courbe de Gauss (courbe hyper-normale) P (t) courbe normale courbe hyper-normale 0 . d’autant plus aplatie que ν est plus petit t III - LOI de STUDENT ou de STUDENT-FISHER (3) 2. Propriétés (2) . famille de distributions de t s suivant le nombre ν de degrés de liberté P (t s) ν = 40 ν = 10 ν=3 0 ts . La loi de STUDENT tend vers la loi normale centrée réduite quand ν ∞ Les deux lois deviennent quasiment identiques quand ν > 30 III - LOI de STUDENT ou de STUDENT-FISHER (4) 2. Propriétés (3) c) En pratique : tables de la variable t s 3. Table de la variable de STUDENT-FISHER (la plus utilisée) . similaire à celle de l’écart-réduit (loi normale) α/2 α/2 -ts 0 ts . table à double entrée (du fait de la dépendance en ν) La valeur de α est lue en ligne, celle de ν en colonne, la valeur recherchée t s se situant à l’intersection III - LOI de STUDENT ou de STUDENT-FISHER (5) 3. Table de la variable de STUDENT-FISHER (2) Exemple : α ν 0,90 ... pour ν = 10 et α = 0,05 ... 0,05 1 . . . 10 ... ... ... 0,001 ? . . . 120 ∞ 0,126 1,960 3,291 Dans les tests statistiques, on utilise souvent comme seuil de risque : α=5% α=1% soit t s = 2,228 t s = 3,169 (t = 1,96 pour loi normale) (t = 2,58 " ) IV - LOI de SNEDECOR ou de FISHER-SNEDECOR (1) Permet, en particulier, de comparer les variances d’échantillons 1. Définition Soient χ2 ν1 et χ2 ν2 deux lois indépendantes du χ2 à ν1 et ν2 degrés de liberté respectivement La loi de SNEDECOR à ν1 et ν2 degrés de liberté notée Fν1,ν2 (en hommage à Fisher) est définie comme le quotient : χ 2ν 1 Fν1,ν2 = ν1 χ 2 ν2 ν2 2. Propriétés a) F ∈ [ 0, + ∞ [ ? b) attention : Fν1,ν2 ≠ Fν2,ν1 IV - LOI de SNEDECOR ou de FISHER-SNEDECOR (2) 2. Propriétés (2) Remarque : quand on échange les degrés de liberté, on démontre que l’on transforme le calcul de la probabilité par le calcul de son complémentaire c) représentation graphique de la loi de SNEDECOR . dépendance avec les deux degrés de liberté ν1 et ν2 => famille de courbes de SNEDECOR . courbes en cloche unimodale asymétrique avec étalement vers la droite P (F) (ν1, ν2) = (2, 5) (ν1, ν2) = (10, 10) (ν1, ν2) = (5, 2) 0 F IV - LOI de SNEDECOR ou de FISHER-SNEDECOR (3) 2. Propriétés (3) d) En pratique : tables de la distribution de F 3. Table de SNEDECOR . similaire à celle de χ2 P (F) α F Fα 0 . table à triple entrée (du fait de la double dépendance en degrés de liberté) => une table par valeur de α . pour chaque α, table à double entrée (ν1 et ν2) La valeur de ν1 est lue en ligne, celle de ν2 en colonne, la valeur recherchée Fα se situant à l’intersection IV - LOI de SNEDECOR ou de FISHER-SNEDECOR (4) 3. Table de SNEDECOR (2) Exemple : pour α = 0,05, ν1 = 20 et ν2 = 10 Reportons-nous à la table α = 5% ν1 ν2 1 ... ... 20 1 . . . 10 ... ... ... ∞ ? . . . 100 ∞ 3,84 1,57 Soit F20,10 = 2,77 1,00 IV - LOI de SNEDECOR ou de FISHER-SNEDECOR (5) 3. Table de SNEDECOR (3) Quand les valeurs ne sont pas dans les tables, on procède par interpolation x <- 0:10 y <- dbinom(x, size=10, prob=.25) # évalue les probas {plot(x, y, type = "h", lwd = 30, main = "Densité Binomiale avec \n n = 10, p = .25", ylab = "p(x)", lend ="square" )} • Pour cet exemple, nous avons d'abord créé le vecteur x contenant les entiers allant de 0 à 10. Nous avons ensuite calculé les probabilités qu'une variable de loi binomiale prenne chacune de ces valeurs, par dbinom. Le type de tracé est spécifié avec l'option type=h (lignes verticales d'un diagramme en bâtons), épaissies grâce à l'option lwd=30. L'option lend ="square" permet de tracer des barres rectangulaires. Pour tracer des densités de lois absolument continues ou des fonctions de répartitions de celles-ci, on peut utiliser la fonction curve(). Par exemple, le tracé de la densité d'une loi Gaussienne centrée réduite sur l'intervalle s'obtient avec la commande curve(dnorm(x), from = -3, to = 3) • X=0:10 • curve(dnorm(x), from = -3, to = 3) • alors que la commande • curve(pnorm(x, mean=10, sd=2), from = 4, to = 16) • produit le tracé de la fonction de répartition d'une loi N(10,4) sur l'intervalle [4,16] • Notons que la fonction curve() permet également de superposer une courbe sur un autre tracé (dans ce cas il est inutile de spécifier from et to). Essayons par exemple de comparer l'histogramme des fréquences des valeurs obtenues par un tirage de 1000 nombres selon la loi N(O,1) avec la densité de la loi N(0,1) : • X=0:10 • simu <- rnorm(1000) {hist(simu, prob=T, breaks="FD", main="Histogramme de 1000 tirages N(0,1)")} curve(dnorm(x), add=T) L1 SANTE