Exercices Lois discrètes Lois continues Statistiques II Alexandre Caboussat [email protected] Classe : Mardi 11h15 - 13h00 Salle : C110 http://campus.hesge.ch/caboussata 12 avril 2011 A. Caboussat, HEG STAT II, 2011 1 / 27 Exercices Lois discrètes Lois continues Exercice 3.3 (suite) On note N le nombre de personnes à interroger pour obtenir exactement 3 personnes connaissant l’entreprise (p étant toujours égal à 0.6). 3 Quelle est la loi de N? Donner son espérance et sa variance. 4 Calculer P(N > 3). A. Caboussat, HEG STAT II, 2011 2 / 27 Exercices Lois discrètes Lois continues Exercice 3.4 1 Calculer p, la probabilité qu’un individu de cette ville achète le journal A. 2 Quelle loi suit N ? Donner son espérance et sa variance. 3 Calculer P(N = 2), P(N > 2) et P(N = 0). A. Caboussat, HEG STAT II, 2011 3 / 27 Exercices Lois discrètes Lois continues Exercice 3.4 (suite) On s’intéresse maintenant au nombre de personnes que l’on doit interroger pour obtenir deux acheteurs du journal. 4 Calculer P(N = 4) et P(N > 4). A. Caboussat, HEG STAT II, 2011 4 / 27 Exercices Lois discrètes Lois continues Exercice 3.7 1 En fonction des informations données, quelle est la loi de distribution de la variable X ? Calculer son espérance et sa variance. 2 Calculer la probabilité que dans l’échantillon sélectionné il y ait exactement 2 entreprises créées après l’an 2000. A. Caboussat, HEG STAT II, 2011 5 / 27 Exercices Lois discrètes Lois continues Loi de Poisson Nous nous intéressons maintenant à un phénomène purement aléatoire se produisant un certain nombre de fois durant un laps de temps donné ou sur une surface donnée. Les différentes réalisations du phénomène sont supposées indépendantes les unes des autres. Si λ représente le nombre moyen de réalisations du phénomène dans l’intervalle de temps étudié ou sur la surface étudiée, alors une variable Y représentant le nombre de survenances du phénomène suit une loi de Poisson: Y ∼ Poisson(λ) A. Caboussat, HEG STAT II, 2011 6 / 27 Exercices Lois discrètes Lois continues Construction de la loi de Poisson Considérons un intervalle de temps de longueur T . Si l’on divise l’intervalle [0,T ] en un grand nombre g de sous-intervalles de longueur T /g , il est possible d’admettre que le phénomène pourra se produire au plus une fois dans chaque sous-intervalle. A. Caboussat, HEG STAT II, 2011 7 / 27 Exercices Lois discrètes Lois continues Construction de la loi de Poisson (2) La probabilité d’observer le phénomène dans l’un des intervalles est p = λ/g et il est possible d’associer une variable de Bernoulli Xi à chacun des intervalles: 0 xi p(xi ) (1 − gλ ) 1 λ g où 0 dénote la non-survenance du phénomène et 1 sa survenance. A. Caboussat, HEG STAT II, 2011 8 / 27 Exercices Lois discrètes Lois continues Construction de la loi de Poisson (3) La variable Y représentant le nombre total de réalisations sur [0, T ] s’exprime alors comme la somme des Xi : Y = g X Xi i=1 et elle suit une loi binomiale de paramètres g et p = λ/g : λ Y ∼ Bin g , g avec E(Y ) = λ Var(Y ) = λ A. Caboussat, HEG 1− λ g STAT II, 2011 9 / 27 Exercices Lois discrètes Lois continues Construction de la loi de Poisson (4) La loi de Poisson proprement dite correspond au cas où le nombre g d’intervalles tend vers l’infini, c’est-à-dire au cas où la taille de chacun de ces intervalles devient infinitésimale. Dans ce cas, Y ∼ Poisson(λ) et la distribution de probabilité s’écrit P(Y = y ) = A. Caboussat, HEG e −λ λy y! STAT II, 2011 10 / 27 Exercices Lois discrètes Lois continues P(Y = y ) = = lim g →∞ lim g →∞ = λy y! = λy y! g y A. Caboussat, HEG λ 1− g g! y ! (g − y )! g −y y λ g g −y y λ λ λ 1− 1− g g gy g −y λ λ g (g − 1) . . . (g − y + 1) · 1 − 1 − g →∞ gy g g lim lim g (g − 1) g →∞ g |{z} | 1 = g {z →1 } . . . (g − y + 1) · | g {z →1 } „ « „ « λ −y λ g 1− 1− g g | {z }| {z } →e −λ →1 e −λ λy y! STAT II, 2011 11 / 27 Exercices Lois discrètes Lois continues Loi de Poisson La loi de Poisson a pour propriétés: E(Y ) = Var(Y ) = λ. Ainsi, la loi de Poisson est caractérisée par le fait que son espérance est égale à sa variance. Remarque: Le nombre possible de succès y n’est pas borné supérieurement, donc l’ensemble de modalités que peut prendre la variable Y est l’ensemble des nombres naturels N. Cet ensemble est infini, mais dénombrable, ce qui fait de Y une variable aléatoire discrète. A. Caboussat, HEG STAT II, 2011 12 / 27 Exercices Lois discrètes Lois continues Loi de Poisson Exemple: Chaque jour, 48 personnes en moyenne se présentent au service des urgences d’un hôpital régional. En supposant que ces personnes arrivent de façon parfaitement aléatoire durant les 24 heures, quelle est la probabilité d’observer l’arrivée de 3 personnes en 1 heure? Y : nombre de personnes arrivant en une heure. λ = 48/24=2 personnes par heure en moyenne. Y ∼ Poisson(2) =⇒ E(Y ) = Var(Y ) = 2 P(Y = 3) = e −2 23 = 0.180 3! y 0 1 2 3 4 ... p(y ) 0.135 0.271 0.271 0.180 0.090 . . . A. Caboussat, HEG STAT II, 2011 13 / 27 Exercices Lois discrètes Lois continues Loi de Poisson Lorsque l’unité de temps ou de surface est multipliée par un coefficient ω, on obtient une nouvelle loi de Poisson de paramètre ω λ. Loi suivie par la variable Y24 représentant le nombre de personnes arrivant durant 24 heures: Y24 ∼ Poisson(24 · λ) = Poisson(48) A. Caboussat, HEG STAT II, 2011 14 / 27 Exercices Lois discrètes Lois continues Lois de probabilités continues A. Caboussat, HEG STAT II, 2011 15 / 27 Exercices Lois discrètes Lois continues Introduction Dans beaucoup de situations, le nombre de modalités que peut prendre une variable aléatoire est très grand, voire infini. En statistique inférentielle notamment, les caractéristiques d’un échantillon telles que la moyenne ou la variance peuvent prendre une infinité de valeurs différentes. Ces quantités sont alors représentées par des lois de probabilité continues. Les plus utilisées sont la loi uniforme; X la loi exponentielle; X la loi normale (loi de Laplace-Gauss);X la loi du chi-2; la loi de Student; la loi de Fisher-Snedecor. A. Caboussat, HEG STAT II, 2011 16 / 27 Exercices Lois discrètes Lois continues Introduction Ces lois sont parfaitement connues et des tables statistiques permettent de déterminer les probabilités qui leurs sont associées. L’utilisation de ces lois permet notamment de calculer des intervalles de confiance et de tester des hypothèses statistiques. A. Caboussat, HEG STAT II, 2011 17 / 27 Exercices Lois discrètes Lois continues Variable aléatoire continue Une variable aléatoire continue X prend ses valeurs dans un ensemble continu. Cet ensemble peut être n’importe quel intervalle, qui est un sous-ensemble de l’ensemble des réels R (éventuellement R tout entier): X ∈ [v , w ] avec v , w ∈ R, v < w . Le nombre de valeurs possibles de X étant infini, chacune de ces valeurs a une probabilité nulle. En revanche, il est possible de calculer la probabilité associée à n’importe quel sous-intervalle [a, b] de [v , w ]: P(X = x) = 0, P(X ∈ [a, b]) ≥ 0, A. Caboussat, HEG pour x ∈ [v , w ] pour a < b, [a, b] ⊆ [v , w ] STAT II, 2011 18 / 27 Exercices Lois discrètes Lois continues Fonction de densité Une distribution continue est définie soit par sa fonction de densité, soit par sa fonction de répartition. Une distribution continue peut être représentée par un histogramme. Si l’on dispose d’un grand nombre d’observations, il est possible de définir des classes de très petite amplitude. A la limite, les classes devienent d’amplitude nulle et l’histogramme devient une courbe. Cette courbe est la fonction de densité de la variable aléatoire continue X , notée f (x). A. Caboussat, HEG STAT II, 2011 19 / 27 Exercices Lois discrètes Lois continues Fonction de densité A. Caboussat, HEG STAT II, 2011 20 / 27 Exercices Lois discrètes Lois continues Fonction de densité La fonction de densité n’est pas une distribution de probabilité. En effet, pour tout x ∈ [v , w ], P(X = x) = 0, mais f (x) ≥ 0. En revanche, la probabilité d’être dans un intervalle de longueur dx très petit est donnée par f (x) dx: P(X ∈ [x, x + dx]) = f (x) dx La probabilité de se trouver dans un intervalle [a, b] est définie comme l’aire sous la fonction de densité: A. Caboussat, HEG STAT II, 2011 21 / 27 Exercices Lois discrètes Lois continues Fonction de densité Mathématiquement, cela revient à calculer l’intégrale de la fonction f (x) entre a et b: Z P(X ∈ [a, b]) = b f (x) dx a Pour que la fonction f (x) soit une fonction de densité, on doit avoir Z ∞ P(X ∈ ] − ∞, ∞[) = 1 = f (x) dx −∞ f (x) ≥ 0, pour x ∈R Remarque: Contrairement aux lois de probabilité, il est tout à fait possible que f (x) > 1 pour certaines valeurs de x. Cependant, vu que l’aire totale sous la courbe doit être égale à 1, f (x) ne pourra pas être supérieure à 1 sur un trop grand intervalle. A. Caboussat, HEG STAT II, 2011 22 / 27 Exercices Lois discrètes Lois continues Fonction de répartition (ou de distribution) La fonction de répartition, notée F (x), donne pour toute valeur x la probabilité d’être inférieur ou égal à x. Cela correspond à la surface sous la fonction de densité à gauche de x: Z x f (x) dx F (x) = P(X ≤ x) = −∞ La fonction de répartition vérifie F (−∞) = 0, F (∞) = 1. La probabilité d’être dans un intervalle [a, b] est donnée par P(X ∈ [a, b]) = F (b) − F (a) A. Caboussat, HEG STAT II, 2011 23 / 27 Exercices Lois discrètes Lois continues Complémentarité Par complémentarité, la relation suivante est vérifiée pour toute fonction de répartition: A. Caboussat, HEG STAT II, 2011 24 / 27 Exercices Lois discrètes Lois continues Symétrie Si la fonction de densité est symétrique autour d’une valeur µ, alors A. Caboussat, HEG STAT II, 2011 25 / 27 Exercices Lois discrètes Lois continues Monotonie Puisque P(X ∈ [a, b]) = F (b) − F (a) ≥ 0, alors F (a) ≤ F (b) quels que soient a < b, c’est à dire que F n’est jamais décroissante. On dit que F est monotone non décroissante. A. Caboussat, HEG STAT II, 2011 26 / 27 Exercices Lois discrètes Lois continues Exercices A. Caboussat, HEG STAT II, 2011 27 / 27