STAT-I301 Chapitre II: Distributions de probabilités Caroline Verhoeven Je suis aussi −x 2 1 e 2σ2 p 2πσ2 que tout le monde Table des matières 1 Introduction 2 Probabilités 3 Variables aléatoires 4 Distribution de probabilité Variables discrètes La distribution binomiale Variables continues La distribution normale eamerlogo Caroline Verhoeven STAT-I301 2 / 24 1. Introduction Inférence statistique I 1 échantillonnage population µ =? échantillon x Statistique descriptive 2 inférence 3 Population : l’ensemble des individus qui nous intéressent Exemple : adultes souffrant de maux de dos, élèves du secondaire avec un certificat médicale pour le cours de gym Echantillon : Partie de la population qu’on étudie vraiment Hypothèse de la biostatistique : la population est beaucoup plus grande que l’échantillon eamerlogo Caroline Verhoeven STAT-I301 3 / 24 1. Introduction Inférence statistique II 1 échantillonnage population µ =? échantillon x Statistique descriptive 2 inférence 3 Inférence statistique : Processus pour généraliser les conclusions obtenues pour l’échantillon vers la population Il faut idéalement que l’échantillon soit aléatoire simple, c.-à-d. que tous les individus de la population aient la même probabilité d’être choisi eamerlogo Caroline Verhoeven STAT-I301 4 / 24 2. Probabilités Expériences Exemple 1 J’ai 1000 chanson sur mon iPod J’appuie sur le bouton “shuffle” La probabilité d’entendre ma chanson préférée est de 1/1000 eamerlogo Caroline Verhoeven STAT-I301 5 / 24 2. Probabilités La planche de Galton Exemple 2 eamerlogo Caroline Verhoeven STAT-I301 6 / 24 2. Probabilités L’aléatoire Expérience aléatoire : expérience avec 2 ou plusieurs possibilités et dont les résultat n’est pas connu à l’avance Exemple : Appuyer sur le bouton “shuffle” de l’iPod Tester le groupe sanguin Evénement aleatoire : Evénement qui se réalise ou non à l’issue de l’expérience aléatoire Exemple : Ma chanson préférée est jouée par l’iPPod Le groupe sanguin O Domaine d’echantillonage : Résultats possibles de l’expérience aléatoire Exemple : Les 1000 chansons sur l’ iPod Les groupes sanguins {O,A,B,AB} eamerlogo Caroline Verhoeven STAT-I301 7 / 24 2. Probabilités Probabilités : définition La probabilité d’un événement est la proportion (idéalisée) que l’événement se produise quand on répète l’expérience encore et encore dans les mêmes conditions Remarque 3 La proportion est toujours entre 0 et 1 ⇒ la probabilité est entre 0 et 1 eamerlogo Caroline Verhoeven STAT-I301 8 / 24 3. Variables aléatoires Variables aléatoires : Définitions et notations Une variable aléatoire est une variable dont on ne peut pas prédire la valeur avant l’expérience aléatoire Notations X , Y , Z , . . . Notation pour les valeurs de cette variable : x , y , z , . . . 2 types de variables aléatoires : Variables aléatoires discrètes : On peut énumérer toutes les valeurs possibles Exemple : Le nombre de piles pour 5 lancers d’1 pièce, le nombre de garçons dans 1 famille de 8 enfants Variables aléatoires continues : Peut prendre n’importe quelle valeur dans un intervalle Exemple : La durée de vie réelle d’une ampoule, Le taux d’acide urique dans le sang eamerlogo Caroline Verhoeven STAT-I301 9 / 24 4. Distribution de probabilité 1. Variables discrètes Fonction de probabilité Exemple 4 Nombre de garçons parmi N = 38495 familles de 8 enfants xj 0 1 2 3 4 5 6 7 8 nj 161 1152 3951 7603 10263 8498 4948 1635 284 nj′ 0,004 0,030 0,103 0,198 0,267 0,221 0,129 0,042 0,007 Vu le nombre de familles, les proportions nj′ sont une bonne approximation des probabilité πj fonction de probabilité : fonction qui attribue à chaque valeur de la variable la probabilité d’obtenir cette valeur à l’issue de l’expérience eamerlogo Caroline Verhoeven STAT-I301 10 / 24 4. Distribution de probabilité 2. La distribution binomiale Un jeu malhonnête Exemple 5 On lance une pièce de monnaie 10 fois. Quelle est la probabilité qu’elle tombe sur pile 1 fois, 2 fois, . . ., 10 fois ? Un des joueurs n’est pas honnête et a “faussé” la pièce telle que la probabilité de tomber sur pile à chaque lancer est de 0.3 La probabilité de tomber x fois sur piles au bour de 10 lancers correspond à une distribution binomiale eamerlogo Caroline Verhoeven STAT-I301 11 / 24 4. Distribution de probabilité 2. La distribution binomiale Distribution binomiale On a une distribution biomiale quand : Le nombre de d’essais, n, est fixe Les essais sont indépendants l’un de l’autre La probabilité de succes, π, est le même dans chaque essai Probabilité d’avoir x succes, chacun avec une probabilité π, en n essais : à ! n x b(x;n, π) = π (1 − π)n−x , x à ! n n! = x x!(n − x)! eamerlogo Caroline Verhoeven STAT-I301 12 / 24 4. Distribution de probabilité 2. La distribution binomiale Exemples de distributions binomiales I Exemple 6 On retourne à notre lancer de pièce monnaie malhonnête (Exemple 5) : 0.20 0.25 probabilité On a n = 10, π = 0, 3 par exemple : Quelle est la probabilité d’obtenir 5 piles ? (x = 5) 0.20 0.15 à ! 10 b(5;10, 0, 3) = (0, 3)5 (0, 7)5 5 0.10 0.05 = 0, 103 0 1 2 3 4 5 6 7 8 9 10 nombre de piles eamerlogo Caroline Verhoeven STAT-I301 13 / 24 4. Distribution de probabilité 2. La distribution binomiale Exemples de distributions binomiales II Exemple 7 Nombre de garçons parmi N = 38495 familles de 8 enfants xj 0 1 2 3 4 5 6 7 8 nj 161 1152 3951 7603 10263 8498 4948 1635 284 nj′ 0,004 0,030 0,103 0,198 0,267 0,221 0,129 0,042 0,007 πj 0.004 0.031 0.109 0.219 0.273 0.219 0.109 0.031 0.004 Ici : n = 8, π ≈ 0, 5 La probabilité d’avoir 3 garçons (x = 3) b(3;8, 0, 5) = à ! 8 (0, 5)3 (0, 5)5 3 = 0, 219 eamerlogo Caroline Verhoeven STAT-I301 14 / 24 4. Distribution de probabilité 3. Variables continues Tableau de fréquences Exemple 8 Nombres aléatoires continus nombre 184.0286 187.3946 178.3470 175.7662 179.4007 177.8262 182.3469 182.7644 185.0921 173.8282 nj 1 1 1 1 1 1 1 1 1 1 nombre 181.1581 185.6901 175.7819 178.7683 179.6735 179.6033 175.4822 178.9815 172.0980 181.4440 nj 1 1 1 1 1 1 1 1 1 1 nombre 175.0512 176.5793 182.4888 183.3151 182.4265 187.6758 180.1794 169.7284 179.6067 177.8535 nj 1 1 1 1 1 1 1 1 1 1 nombre 186.6979 173.5403 187.4425 175.7290 177.0225 176.9676 176.8623 180.6628 176.5917 180.2790 nj 1 1 1 1 1 1 1 1 1 1 nombre 181.4475 179.6354 177.2676 173.9934 179.2517 173.2632 182.6770 187.9647 174.8772 178.1606 nj 1 1 1 1 1 1 1 1 1 1 10 mesures ⇒ nj′ = 1/10 30 mesures ⇒ nj′ = 1/30 50 mesures ⇒ nj′ = 1/50 Beaucoup de mesures ⇒ nj′ → 0 eamerlogo Caroline Verhoeven STAT-I301 15 / 24 4. Distribution de probabilité 3. Variables continues Probabilité d’une variable continue La proportion de la mesure devient de plus en plus petite quand on a de plus en plus de mesures ⇒ La proportion → 0 quand on a beaucoup de mesure ⇒ La probabilité d’obtenir une mesure spécifique est 0 eamerlogo Caroline Verhoeven STAT-I301 16 / 24 4. Distribution de probabilité 3. Variables continues Histogramme Exemple 9 100000 mesures aléatoires yj′ yj′ yj′ 0,08 0,08 0,08 0,06 0,06 0,06 0,04 0,04 0,04 0,02 0,02 0,02 150 160 170 180 190 200 210 6 classes, Ij = 10 eamerlogo f (x) 0,08 150 160 170 180 190 200 210 30 classes, Ij = 2 150 160 170 180 190 200 210 60 classes, Ij = 1 0,06 0,04 Ij → dx 0,02 f : densité de probabilité 160 170 180 190 200 210 x Caroline Verhoeven STAT-I301 17 / 24 4. Distribution de probabilité 3. Variables continues Densité de probabilité I Approximation ′ Plus fine Densité ′ yj yj 0,08 0,08 0,06 0,06 0,04 0,04 0,04 0,02 0,02 0,02 150 160 170 180 190 200 210 Proportion des sujets de mesures 178 à 192 0,08 0,06 150 160 170 180 190 200 210 Proportion de sujets de mesures 178 à 192 160 170 180 190 200 210 P(178 ≤< X ≤ 192) eamerlogo Caroline Verhoeven STAT-I301 18 / 24 4. Distribution de probabilité 3. Variables continues Densité de probabilité II Si X suit une loi avec densité de probabilité f : P(X ≤ a) = Za P(X < ∞) = f (x)dx −∞ Z ∞ −∞ P(a ≤ X ≤ b) = f (x)dx = 1 Zb a f (x)dx = P(X ≤ b) − P(X ≤ a) P(a ≤ X ) = 1 − P(X ≤ a) eamerlogo Caroline Verhoeven STAT-I301 19 / 24 4. Distribution de probabilité 4. La distribution normale Distribution normale I Une distribution continue très importante est la distribution normale. Elle est définie par sa fonction de densité de probabilité (x −µ)2 1 − e 2σ2 f (x) = p 2πσ µ correspond à la moyenne pour la population σ correspond à la déviation standard de la population 0,08 0,06 µ = 180, σ = 5 µ = 190, σ = 5 0,04 µ = 180, σ = 10 0,02 170 180 190 200 210 eamerlogo Caroline Verhoeven STAT-I301 20 / 24 4. Distribution de probabilité 4. La distribution normale Distribution normale II Soit X une variable aléatoire continue, si X suit la distribution normale de paramêtre µ, σ, on notera X ∼ N(µ, σ2 ) Nous avons que P(a ≤ X ≤ b) = Zb a p 1 2πσ e − (x −µ)2 2σ2 dx En particulier : 1.0 0.8 F (x) = P(X ≤ x) = Zx −∞ p 1 2πσ e (x ′ −µ)2 − 2σ2 F (x) 0.6 dx’ 0.4 0.2 160 170 180 190 200 210 x eamerlogo Caroline Verhoeven STAT-I301 21 / 24 4. Distribution de probabilité 4. La distribution normale Propriétés de la normale La distribution normale est unimodale La distribution normale est symétrique : médiane=mode=moyenne La normale et la déviation standard : P(µ − σ ≤ X ≤ µ + σ) = 0, 68 P(µ − 1, 96σ ≤ X ≤ µ + 1, 96σ) = 0, 95 P(µ − 2, 58σ ≤ X ≤ µ + 2, 58σ) = 0, 99 eamerlogo Caroline Verhoeven STAT-I301 22 / 24 4. Distribution de probabilité 4. La distribution normale La distribution normale centrée réduite I BProblème ! Il n’y a pas moyen de calculer l’intégrale Zb a p 1 2πσ e − (x −µ)2 2σ2 dx On peut utiliser des logiciels ou des tables Des tables pour chaque µ et σ.... NON eamerlogo Caroline Verhoeven STAT-I301 23 / 24 4. Distribution de probabilité 4. La distribution normale La distribution normale centrée réduite II X a une moyenne µ ⇒ Y = aX + b a une moyenne aµ + b X a une déviation standard σ ⇒ Y = aX + b a une déviation standard |a|σ X ∼ N(µ, σ2 ), alors : Z= X −µ a comme moyenne 0 σ X −µ Z= a comme déviation standard 1 σ X −µ ∼ N(0, 1) ⇒ Z= σ La fonction de la loi normale centrée réduite a comme fonction de densité 2 1 ϕ(z) = p e−z /2 2π et on note Zz Φ(z) = P(Z ≤ z) = ϕ(z ′ )dz ′ −∞ eamerlogo Caroline Verhoeven STAT-I301 24 / 24