Chapitre 5 VARIABLES ALEATOIRES LOIS FONDAMENTALES Objectifs : o o o Définir la notion de variable aléatoire dans les différents cas d’univers. Déterminer la loi de probabilité d’une variable aléatoire et calculer ses valeurs caractéristiques. Etudier les trois lois fondamentales de référence :loi binomiale, loi de Poisson, loi normale (ou de Gauss). I] VARIABLE ALEATOIRE DISCRETE (A NOMBRE FINI DE VALEURS) : 1°) Variable aléatoire – Variable discrète : Soit Ω un univers probabilisé. Une variable aléatoire X est une fonction définie sur Ω à valeurs dans R. L’ensemble image X( Ω ) ou ensemble fondamental de X est une partie de R. La variable aléatoire X est dite discrète si X( Ω ) est fini. Rq : X peut être discrète si Ω est fini ou infini. 2°) Variable aléatoire sur un univers fini : Soit X une variable aléatoire définie sur l’univers fini à N éventualités : Ω = { ω 1; ω 2; …… ; ω N}. L’ensemble image X( Ω ) = {x1,x2,…,xn} est nécessairement fini et comporte un nombre n de valeurs (n ≤ N). Partie de l’univers (X=xi) associée à la valeur xi : On convient de noter par (X = xi), la partie (ou l'événement) de Ω formée de toutes les éventualités ω k ayant pour image xi (au lieu d’utiliser la notation { ω ∈ Ω /X ( ω )=xi }.) Ces parties sont au nombre de n. Toute éventualité ω appartient à l'une de ces parties et à une seule puisqu'elle a une image unique. L’ensemble de ces n parties constitue donc une partition de Ω . Notations utilisées Æ Une variable aléatoire est habituellement représentée par une majuscule. On note : (X > x) la partie de Ω formée de toutes les éventualités dont l'image par X est strictement supérieure à x. (x < X < y) la partie de Ω formée de toutes les éventualités dont l'image par X est strictement comprise entre x et y. http://www.chez.com/christophetesti/ -1- C.TESTI Æ La variable aléatoire X étant une fonction, les conventions habituelles d'écriture permettent d'écrire, quel que soit ω ∈ Ω et son image x par X : aX: ω a ax ; X + b: ω a x+b ; X²: ω a x² etc. Æ X et Y étant deux variables aléatoires définies sur le même univers Ω , quel que soit ω ∈ Ω et ses images x par X et y par Y, on a : X +Y : ω a x+y; XY : ω a xy. Le couple (X, Y) est un couple aléatoire défini sur Ω . 3°) Loi de probabilité et fonction, de répartition : Loi de probabilité : Soit un univers fini probabilisé Ω et X une variable aléatoire sur Ω : On appelle loi de probabilité de X, la fonction qui à chaque valeur image xi fait correspondre la probabilité pi de la partie (X = xi ) de Ω . On a donc pi = P (X = Xi) et n ∑ i =1 pi = P ( Ω ) = 1, La loi de probabilité d'une variable aléatoire est généralement présentée sous forme d'un tableau complet des valeurs xi et pi, souvent sans référence à l'univers initial Ω . Valeurs xi x1 x2 … xi … xn P(X=xi) p1 p2 … pi … pn La connaissance des probabilités pi permet de calculer la probabilité pour que la variable aléatoire X ait son image dans l'intervalle [xk;xh]. On a: P [Xk ≤ X ≤ Xh] =Pk +Pk+1 + … +Ph Fonction de répartition La fonction de répartition F de la variable aléatoire X associe à tout réel x la probabilité P (X ≤ x). On a donc : P (X ≤ x) = F (x) et aussi P (X > x) = 1 - F (x). On a de même P(x<X ≤ y)=F(y)-F(x). Comme une probabilité est toujours positive, F (y) ≥ F (x) quels que soient x et y, (x < y). La fonction de répartition F est croissante. 4°) Valeurs caractéristiques (ou paramètres) : Soit X une variable aléatoire prenant les n valeurs xi, i ∈ {1;2;3 ;…;n} avec les probabilités pi. http://www.chez.com/christophetesti/ -2- C.TESTI Espérance mathématique de X On appelle espérance mathématique de X, le nombre E (X) défini par : n m = E (X) = ∑ pi.xi = p1.xi + p2.x2+…+pn.xn (autre notation X ) i =1 Comme la somme des probabilités est égale à 1, l'espérance mathématique peut s'interpréter comme la moyenne des valeurs xi pondérées par leur probabilité pi. Interprétation : dans le cas d'un jeu où les valeurs xi sont les gains et les valeurs pi des probabilités calculées ou estimées, E (X) est la somme moyenne qu'on a l'espoir de gagner par partie sur un grand nombre d'épreuves. Variable centrée : une variable aléatoire est dite centrée si son espérance mathématique est nulle. C'est le cas de la variable : X - m. E (X - M)= n ∑ i =1 n n i =1 i =1 pi (xi - m) = ∑ pi.xi – m ∑ pi = m – m.1 = 0 Propriétés faisant intervenir une constante réelle k • E (k) = k (variable certaine prenant la seule valeur k avec la probabilité 1). • E (X+k) = E(X) + k • E (k.X) = k.E (X). Variance et écart-type On appelle variance de X l'espérance mathématique du carré de la variable centrée X - m. Elle est notée V (X). V (X) = n ∑ i =1 pi.xi² - m² = n ∑ i =1 pi.xi² - X ² L’écart type σ (X) est la racine carrée de la variance : σ (X) = V(X) Propriétés faisant intervenir une constante réelle k : • V (k) = 0. • V (X+k) = V(X). • V (k.X) = k².V(X) d’où σ (X) = |k|. σ (X) 5°) Variable discrète à univers infini : Les parties (X = xi) associées à une valeur image xi sont définies comme dans le cas d'un univers fini. S'il correspond à chacun de ces événements une probabilité, la loi de probabilité de la variable X est parfaitement déterminée. L’étude d'une telle http://www.chez.com/christophetesti/ -3- C.TESTI variable et en particulier le calcul des valeurs caractéristiques ne présente pas de difficulté particulière. De telles variables se rencontrent en particulier dans des régionnements finis de la droite, du plan ou de l'espace, chaque région étant probabilisée. Exemple : cible numérotée. II] VARIABLE ALEATOIRE A NOMBRE INFINI DE VALEURS Deux cas fondamentaux, correspondant au cas d'un ensemble image infini, peuvent se produire : • L'ensemble image est dénombrable (on peut numéroter chaque valeur) • La variable aléatoire est continue. 1°) Variable aléatoire à ensemble dénombrable de valeurs : La suite des valeurs : x1, x2, ..., xi, ... étant connue, la loi de probabilité de la variable aléatoire X est déterminée par la connaissance de pi = P(X=xi) pour toute valeur de i. Les valeurs caractéristiques X seront définies comme somme de séries (sous réserve de convergence). On a alors : p1+p2+ … + pi + … = n ∑ i =1 n pi = E (X) = ∑ pi.xi X i =1 n V = ∑ pi.(xi - X )² i =1 2°) Densité de probabilité. Variable aléatoire continue : Différents cas peuvent se produire suivant que l'ensemble des valeurs de X est R ou des intervalles de R. La présentation de cette partie étant destinée à préparer l'étude de la loi normale nous nous limiterons au cas où cet ensemble est R. On dit alors que : La variable aléatoire X est continue s'il existe une fonction positive f, continue sur R, +∞ appelée densité de probabilité de X, telle que ∫−∞ f(t)dt = 1. La loi de probabilité P de X vérifie : P (X ≤ a) = ∫ a −∞ ∫ f(t)dt b f(t)dt ; P (a < x ≤ b) = a ; P (X = a) = 0 3°) Fonction de répartition : On appelle fonction de répartition de X la fonction F définie sur R par : F (x) = 4°) Valeurs caractéristiques : X = E (X) = ∫ +∞ −∞ xf(x)dx http://www.chez.com/christophetesti/ ; V(X) = ∫ +∞ −∞ ∫ x −∞ f(t)dt f(x)( x −X)² dx -4- ; σ(X) = V( X) C.TESTI III] LES LOIS FONDAMENTALES DE REFERENCE: 1°) Loi de Bernoulli : Définition : Une variable aléatoire X définie sur un univers probabilisé Ω est une variable de Bernoulli si elle ne prend que les deux valeurs 1 et 0 avec les probabilités respectives p et q = 1 -p. Valeurs caractéristiques : E(X) = p ; V(X) = p.q ; σ(X) = p.q 2°) Loi binomiale : Définition : Il s'agit de la loi de probabilité du nombre de succès dans une épreuve de Bernoulli répétée n fois (par exemple tirages répétés dans une urne, avec remise). Une variable aléatoire X à valeurs entières : 0 ; 1 ; 2 ;… ; n suit une loi binomiale de paramètres n et p (p∈ [0;11]) si, et seulement si, pour toute valeur entière k ∈ [0, n], on a : P (X = k) = k C n . pk.q n-k (avec q = 1 – p) Valeurs caractéristiques : E (X) = n.p ; V(X) = n.p.q ; σ(X) = n.p.q 3°) Loi de Poisson: Rq : on admettra que Définition : xn = e ∑ n =0 n! +∞ x C’est une loi ou l’ensemble des valeurs est N (ensemble infini dénombrable). Une variable aléatoire dénombrable X à valeurs dans N suit une loi de Poisson de mk –m paramètre m (m>0) si, et seulement si P (X = k) = e . k! Valeurs caractéristiques : E (X) = m ; http://www.chez.com/christophetesti/ V(X) = m ; -5- σ(X) = m C.TESTI 4°) Loi de Laplace – Gauss ou loi normale Ν (m, σ ) La loi normale est la loi de référence la plus utilisée. Elle doit son importance d'une part au fait qu'elle est constatée expérimentalement de façon fréquente, en particulier dans tous les cas de dispersion de valeurs au hasard autour d'une valeur centrale (mesures de grandeurs liées à une production de série, écarts d'un projectile autour du point visé, ... ) : elle est souvent qualifiée de loi du hasard. Comme nous le verrons, de nombreuses lois « tendent » vers la loi normale dans certaines conditions. Cette loi a en outre l'avantage de bien se prêter aux calculs théoriques. Définition : C'est une loi continue dont la densité de probabilité f est définie sur R. On appelle loi de Laplace - Gauss la loi d'une variable aléatoire continue dont la densité de probabilité est : f (x) = 1 exp σ 2π − 1 ( x − m)² 2 σ = − 1 ( x −m )² 2 σ 1 exp σ 2π * ( σ ∈ R + ; m ∈ R). Variables caractéristiques : E (X) = m ; V(X) = σ² Loi normale centrée réduite N (0,1): En prenant comme nouvelle origine m et en divisant les abscisses par σ , donc en faisant le changement de variable t = x −m , on obtient une variable aléatoire centrée σ normale T = X−m , dite variable normale réduite, satisfaisant à la loi N (0, 1) σ E (T ) = 0 ; σ (T) = 1 Dont la densité de probabilité Ψ est définie en fonction de t par : Ψ (t) = 1 2π − t² 2 e On obtient alors une courbe unique de référence, ne dépendant plus d’autant de paramètres, on utilise des tables donnant les valeurs des fonctions Ψ (t) ou Π (t) (fonction de répartition) et G(t) définies par : Π (t) = Φ (t) = G(t) = ∫ t 0 ∫ t −∞ 1 − t2² dt 2π e 1 − t2² dt 2π e http://www.chez.com/christophetesti/ -6- C.TESTI Les relations suivantes sont à connaître : P (T ≤ t) = Φ (t) = Π (t) (1) P(t0 ≤ T ≤ t1) = Φ (t1) - Φ (t0) (3) P(T>t) = 1 - Φ (t) = Φ (-t) P(-t ≤ T ≤ t) = 2 Φ (t) – 1 P(t ≤ -T ou T ≥ t) = 2 Φ (-t) = 2( 1 – Φ (t) ) (2) (4) (5) Les inégalités peuvent être indifféremment strictes ou larges. Tracé de la courbe de densité : La densité Ψ est représentée par la courbe de Gauss (courbe en cloche) (figure page suivante). La probabilité Φ (t) est égale à la mesure de l’aire ombrée. Il est utile de retenir les probabilités suivantes déjà utilisées en statistiques, correspondant aux intervalles de référence : Intervalles m -σ ≤ m –1,96 σ ≤ m –2,58 σ ≤ m–t ≤ α X X X X ≤ ≤ ≤ ≤ m +σ m +1,96 σ m +2,58 σ m+t α Probabilités -1 ≤ T ≤ 1 -1,96 ≤ T ≤ 1,96 -2,58 ≤ T ≤ 2,58 –t ≤ T ≤ t α α 0,683 0,95 0,99 1- α Pourcentages Correspondants 68,3 % 95 % 99 % 100 (1- α ) % Approximation de la loi binomiale et de la loi de Poisson par la loi normale : Le calcul de la probabilité P (X = x) dans le cas de la loi binomiale est assez long ; il en est de même du calcul de la probabilité P (X ≤ x) dans le cas de cette loi et de la loi de Poisson (sauf à disposer de tables ou de moyens de calculs programmés). Des démonstrations théoriques, parfaitement vérifiées expérimentalement, montrent que, dans les conditions indiquées, les tracés des courbes représentatives des fonctions de répartition des lois suivantes sont très voisins. B(n,p) ≈ P(n,p) p ≤ 0,1, npq ≤ 10 et n>30 B(n,p) ≈ P(n.p, n.p.q ) npq>10 et n ≥ 50 http://www.chez.com/christophetesti/ -7- P(m) ≈ N(m, m ) m>20 C.TESTI Æ Selon les conditions d'utilisation, d'autres critères voisins peuvent être indiqués suivant les ouvrages spécialisés. Æ Dans la pratique il convient de s'assurer que l'on se trouve bien, au départ, dans la situation d'une loi binomiale : • • Répétition dans les mêmes conditions, d'une épreuve à deux éventualités. Probabilité constante p de succès de l'éventualité à laquelle on s'intéresse. Si le calcul demandé est trop long, en particulier : nombre de succès compris entre deux valeurs entières k1, et k2 ou nombre de succès supérieur (ou inférieur) à k, il est utile de voir si les conditions sont remplies pour utiliser une loi approchée de Poisson ou de Gauss, rendant les calculs plus faciles. Æ Les lois B et P sont des lois discrètes dont les fonctions de répartition ont des représentations en escalier, leur approximation par une loi continue N n'est valable que sur un intervalle avec en principe les mêmes précautions que pour un calcul d'aire. On aura ainsi aux erreurs d'approximation près: P[k1<X<k2] = Φ (t2) - Φ (t1) avec t1 = k1−m et t2 = k2−m . σ σ Correction de continuité : on obtient en principe une valeur plus précise en effectuant une correction de continuité consistant à remplacer k, par k1 - 1 et k2 par k2+ 1 2 2 EXERCICES RESOLUS Exercice 1 – Variable aléatoire associée à une loterie à roue Une roue de loterie comporte cinq secteurs inégaux dont les couleurs notées : R (rouge), V (vert), J (Jaune), B (bleu), 0 (orange) constituent l'univers Ω ={R,V,J, B,O}. Cet univers est probabilisé par la probabilité p et l'on a : pR = pB = 0,1 ; pO = 3 pJ ; pJ + 2 pV = 0,55 (pR est mis pour p ({R}). La sortie de R ou de B rapporte 1 point, celle de J ou de V rapporte 2 points, celle de 0 rapporte 3 points. Dresser le tableau de la loi de probabilité de la variable aléatoire X dont les valeurs sont égales au nombre de points obtenus. Calculer E (X) et σ (X). Résolution On trouve : pO = 0,45 ; pJ = 0,15 ; pV = 0,20. D'où le tableau de la loi de X : x P (X=x) 1 0,2 2 0,35 3 0, 45 D’où E (X) = 2,5 ; V(X) = 0,5875 ; http://www.chez.com/christophetesti/ σ (X) ≈ 0,766 -8- C.TESTI Exercice 2 – Variable aléatoire associée à un tir sur cible associée à une loterie à roue Une cible est délimitée par des cercles concentriques de rayons respectifs (cm) 1, 2, 3, 4, 5. Le cercle central et les couronnes successives définissent des zones affectées respectivement d'un nombre de points égal à 5, 4, 3, 2, 1. L'extérieur de la cible est affecté de 0 point. On considère que la probabilité d'impact dans une zone est proportionnelle à l'aire de cette zone. Elle est expérimentalement de 0,2 pour l'extérieur de la cible. X est la variable aléatoire qui à chaque point d'impact fait correspondre le nombre de points affecté à la zone correspondant à ce point. Dresser le tableau de la loi de probabilité de X. Calculer E (x), V (X) et σ (X). Résolution Les aires des zones sont égales respectivement à π , 3 π , 5 π , 7 π et 9 π . Les probabilités correspondantes sont proportionnelles à 1, 3, 5, 7 et 9 et leur total est égal à 0,8 (0,2 pour l'extérieur). On obtient alors le tableau suivant : x P (X=x) E (X) = 1,76 0 1 0,2 0,288 ; V (X) = 1,8624 2 3 0,224 0,16 ; σ (X) - 1,36. 4 0,096 5 0,032 Exercice 3 – Calculs de probabilités à l’aide des lois les mieux adaptées. On considère un tirage de Bernoulli répété n fois, où le succès sur une épreuve a une probabilité p et où X est la variable aléatoire donnant le nombre de succès. Calculer les probabilités demandées en précisant les lois utilisées. 1. n = 20 p = 0,3 P (X = 7) ? Rép. B,0,1642. 2. n = 20 p = 0,1 P (X = 5) ? Rép. B,0,032. 3. n = 40 p = 0,4 P (X = 15) ? Rép. B,0,123. 4. n = 50 p = 0,08 P (X = 8) ? Rép. P, 0,030 ;(B,0,027). 5. n = 100 p = 0,05 P (X = 10) ? Rép. P, 0,018; (B, 0,017). 6. n = 200 p = 0,2 P (30 ≤ X ≤ 45) ? Rép. N, 0,773. 7. n = 200 p = 0,2 P (X = 42) ? Rép. N, 0,066; (B,0,065). 8. n = 200 p = 0,02 P (X = 6) ? Rép. P, 0,104. 9. n = 400 p = 0,4 P (130 < X < 150) ? Rép. N, 0,153. 10. n = 500 p = 0,8 P (400 < X < 410) ? Rép. N, 0,368. Exercice 4 - Articles défectueux dans une fabrication en série Dans une fabrication en série 8 % d'articles présentent des défauts. Calculer les probabilités : 1. pour que dans un contrôle portant sur 40 articles a) il y ait 4 articles défectueux ? b) il y ait 4 articles défectueux au plus ? 2. pour que dans un contrôle portant sur 1 00 articles a) il y ait 6 articles défectueux ? b) il y ait 9 articles défectueux ? http://www.chez.com/christophetesti/ -9- C.TESTI Résolution 1. a) La probabilité demandé est : 4 C 40 x0,08 4 x 0,9236 ≈ 0, 186. b) L'événement « 4 articles défectueux au plus » est constitué par l'union des événements indépendants « 0 ou 1 ou 2 ou 3 ou 4 articles défectueux». En notant que les conditions d'application de la loi de Poisson avec m= np= 3,2 sont remplies, la probabilité demandée est : 3 e -3,2 +e -3,2 x 3,2 + e x 3,2² + e-3,2 x 2 -3,2 3,2 6 4 +e -3,2 x 3,2 24 ≈ 0,781 2. On applique directement la loi de Poisson avec m = np = 8. 6 a) 8 e x ≈ 0,122 6! b) 8 e x ≈ 0,124 9! -8 9 -8 http://www.chez.com/christophetesti/ - 10 - C.TESTI TD 1 – APPLICATION DU COURS UTILISATION DES LOIS DE REFERENCE Exercice 1 Comparaison des résultats obtenus par la loi binomiale et par la loi de Poisson. Une machine produit en série des articles avec une proportion d'articles défectueux constatée sur une production élevée de cinq pour mille. Un contrôle est effectué sur un lot de 200 articles. Quelles sont les probabilités d'obtenir dans ce lot : 0, 1, 2, 3, 4 ou 5 articles défectueux ? On utilisera : 1. La loi binomiale B (200 ; 0,005) 2. La loi de Poisson P, avec m = 200 x 0,005 = 1. Exercice 2 - Utilisation de la loi normale La variable aléatoire X suit une loi normale N (18 ; 2,5). Calculer à 10 -3 près les probabilités P (X < 17) ; P (X < 19) ; P (X > 20) ; P (16 < X < 19,5). Indication : T = X−18 suit la loi normale centrée N(0,1) 2,5 Exercice 3 – Temps d'attente clans un centre de renseignements Dans un centre de renseignements téléphoniques, une étude statistique a été réalisée sur le temps d'attente, exprimé en secondes, subi par la clientèle avant d'amorcer la conversation avec un employé. Les résultats de cette étude conduisent à supposer que la variable aléatoire X qui associe à tout client le temps d'attente qu'il subit, suit la loi normale de moyenne 18 et d'écart type 7,2. 1. Calculer les probabilités que, lors d'un appel au centre, un client : Æ N'ait à subir aucune attente (c'est-à-dire P (X <, 0) Æ Ait à subir une attente de plus de vingt secondes. 2. On imagine qu'au cours d'une certaine semaine, un même client doit donner au centre cinq appels, indépendants les uns des autres. On note Y la variable aléatoire exprimant le nombre de fois où, lors de ces cinq appels, le temps d'attente est supérieur à vingt secondes. Préciser la loi de probabilité suivi par Y et donner ses paramètres. Calculer P (Y = 2) et P (Y ≥ 1). http://www.chez.com/christophetesti/ - 11 - C.TESTI TD 2 – APPLICATION DU COURS CHOIX D’UNE LOI DE REFERENCE ET APPLICATION Exercice 1 – Nombre de commandes suite à un envoi de documentation Une agence de vente propose aux personnes contactées de leur fournir une documentation complète sur le produit qui les intéresse. En moyenne une personne sur dix passe alors commande. Le nombre de demandes de documentation ayant été de 600, quelle est la probabilité : 1. Pour qu'il y ait au moins 70 commandes ? 2. Pour qu'il y ait plus de 50 commandes ? Exercice 2 – Problème lié à la gestion des charges dans un immeuble Un syndicat a relevé qu'en moyenne 6 % de personnes effectuent en retard le règlement de leurs charges. 1. Déterminer la loi de probabilité de la variable aléatoire X donnant le nombre retards de paiement pour un ensemble résidentiel comportant 21 0 appartements. 2. Peut-on approcher cette loi par une loi de Poisson ? Par une loi normale . 3. Déterminer la probabilité pour qu'il y ait plus de 15 règlements en retard ; pour qu'il y ait 9 règlements en retard. On pourra utiliser la loi de Poisson dans le 2ème cas (k = 9). Exercice 3 - Application de la loi de Poisson et de la loi de Gauss dans l'étude d'une fabrication 1. 2. 3. Dans une certaine fabrication en série on trouve en moyenne 0,3 % de pièces à rejeter sur une machine normalement réglée. Quelle loi de probabilité peut-on utiliser pour étudier la variable aléatoire X donnant le nombre de pièces à rejeter dans un échantillon de 1 200 pièces choisies au hasard. Un échantillon de 1 200 pièces prélevées sur une machine récemment mise en service, fournit 7 pièces défectueuses. Quelle conclusion peut-on tirer quant au réglage ? Même question avec n = 1 200, p = 0,015 et k = 20 pièces défectueuses, puis avec k = 30. http://www.chez.com/christophetesti/ - 12 - C.TESTI