3 Probabilité mathématique et distributions théoriques 3.1 Notion de probabilité 3.1.1 Définition classique de la probabilité Définitions • Une expérience ou une épreuve est dite aléatoire lorsqu’on ne peut en prévoir exactement le résultat, en raison du fait que tous les facteurs qui déterminent ce résultat ne sont pas maîtrisés ou contrôlés. • Un événement aléatoire est un événement qui peut se réaliser ou ne pas se réaliser au cours d’une expérience aléatoire. Citons comme exemples d’expériences et d’événements aléatoires : le tirage d’une carte d’un paquet de cartes à jouer et le fait d’extraire un cœur, la mise en germoir d’une graine et la germination de cette graine, la fécondation de deux individus l’un par l’autre et la naissance d’un individu mâle. Définition Si m résultats peuvent se produire avec des chances égales au cours d’une expérience aléatoire, et si k de ces résultats conduisent à la réalisation de l’événement A, on définit classiquement la probabilité de l’événement A comme étant le rapport du nombre de cas favorables au nombre de cas possibles ou également possibles : k P(A) = m ✍ MÉTHODE 27 Si un paquet de 52 cartes contient 13 cœurs, et si toutes les cartes ont des chances égales d’être tirées, quelle est la probabilité d’extraire un cœur en prélevant une carte ? Remarques Cette définition classique de la probabilité présente cependant divers inconvénients. Elle est tout d’abord incomplète, en ce sens qu’elle revient à définir la notion de probabilité à partir de la notion d’égale probabilité des différents cas. En outre, cette définition n’est pas suffisamment générale, car elle n’est utilisable que quand les différents cas envisagés sont également probables et dénombrables. Cette définition ne s’applique par exemple pas à l’étude du sexe observé à la naissance, car de nombreuses observations montrent que les deux événements « naissance mâle » et « naissance femelle » ne sont pas également probables : dans l’espèce humaine notamment, les naissances masculines sont plus fréquentes que les naissances féminines. De même, si on doit choisir au hasard une ou plusieurs parcelles cultivées dans une région donnée, en sélectionnant au hasard un ou plusieurs points de la carte cadastrale correspondante, la définition classique de la probabilité ne s’applique pas : on peut éventuellement admettre ici que tous les cas sont également possibles, c’est-à-dire que tous les points ont la même probabilité d’être choisis, mais ces différents cas ne sont évidemment pas BTSA 21 Cours dénombrables. Pour remédier à ces divers inconvénients, une définition plus générale de la probabilité peut être introduite par analogie avec la notion empirique de fréquence. 3.1.2 Définition fréquentielle de la probabilité Définition Lorsqu’une expérience aléatoire a été répétée un certain nombre de fois n, on peut déterminer le nombre de réalisations de l’événement A qui lui est associé, c’est-à-dire son effectif nA , et en calculer la fréquence : fA = nA n Si l’expérience est répétée un grand nombre de fois dans des conditions uniformes, on constate généralement que la fréquence a tendance à se stabiliser à la longue. Ce phénomène est connu sous le nom de phénomène de stabilité des fréquences ou de régularité statistique. On peut alors postuler, pour tout événement aléatoire qui satisfait à ces conditions, l’existence d’un nombre fixe dont la fréquence a tendance à s’approcher. Ce nombre est par définition la probabilité mathématique de l’événement considéré. Exemple de régularité statistique : dix mille jets d’une pièce de monnaie Le jet d’une pièce de monnaie est un exemple particulièrement simple d’expérience aléatoire, et l’apparition du côté « face » est un événement associé à cette expérience. La première idée qui vient à l’esprit est basée sur la définition classique de la probabilité : elle revient à admettre la valeur 12 comme probabilité de cet événement. Il faut remarquer cependant que cette valeur n’a aucune raison d’être rigoureusement exacte. En effet, puisque les deux faces de la pièce de monnaie considérée sont nécessairement distinctes, il n’y a pas de raison de supposer a priori que les événements « face » et « pile » possèdent des probabilités strictement égales. Pour une pièce donnée, la probabilité de l’événement « face » peut être déterminée par voie fréquentielle. Faisons l’expérience (ou une simulation sur ordinateur). Après chaque jet, on a pu déterminer l’effectif et la fréquence de l’événement considéré. Le tableau suivant en donne l’essentiel. La représentation graphique des valeurs observées (voir figure ??), en fonction du nombre total d’expériences, montre que la fréquence a bien tendance à se stabiliser aux environs de 0,5, mais sans garantir que cette valeur soit strictement exacte. n 1 2 3 4 5 6 7 8 9 10 12 14 nA 0 0 0 1 2 3 3 4 4 4 6 8 fA 0,000 0,000 0,000 0,250 0,400 0,500 0,429 0,500 0,444 0,400 0,500 0,571 n 16 18 20 25 30 35 40 45 50 60 70 80 nA 9 10 10 13 17 18 21 22 25 29 32 35 fA 0,562 0,556 0,500 0,520 0,567 0,514 0,525 0,489 0,500 0,483 0,457 0,438 n 90 100 120 140 160 180 200 250 300 350 400 450 nA 40 44 53 65 74 86 98 125 146 173 199 226 fA 0,444 0,440 0,442 0,464 0,462 0,478 0,490 0,500 0,487 0,494 0,498 0,502 n 500 600 700 800 900 1000 1200 1400 1600 1800 2000 2500 nA 255 312 368 413 458 502 596 704 810 918 1013 1272 fA 0,510 0,520 0,526 0,516 0,509 0,502 0,497 0,503 0,506 0,510 0,506 0,509 n 3000 3500 4000 4500 5000 6000 7000 8000 9000 10000 nA 1510 1772 2029 2293 2533 3009 3516 4034 4538 5067 fA 0,503 0,506 0,507 0,510 0,507 0,502 0,502 0,504 0,504 0,507 Cours 1 0 22 BTSA face pile 100 101 102 103 104 FIGURE 3.1 – fréquence d’apparition de face dans 10000 jets d’une pièce 3.2 Quelques propriétés de la probabilité mathématique 3.2.1 Définitions et axiomes de base Définitions • Lors d’une expérience aléatoire, un résultat possible est appelé événement élémentaire. • L’ensemble des résultats possibles est appelé univers. Définitions • Un événement est un sous-ensemble de l’univers. • Un événement est réalisé dès que l’un de ses événements élémentaires est réalisé. Définition Ω Deux événements A et B sont incompatibles (ou disjoints) lorsque A ∩ B = ;. A B Définition Ω L’événement contraire (ou complémentaire) de l’événement A est l’ensemble des éléments de l’univers qui n’appartiennent pas à A. On le note A. A A BTSA 23 Cours Axiomes L’univers lié à une expérience aléatoire étant Ω, la probabilité d’un événement A est noté P(A). P(A) est un nombre réel compris entre 0 et 1 tel que : • P(Ω) = 1 ; • si A et B sont deux événements incompatibles, P(A ∩ B) = P(A) + P(B). ✍ MÉTHODE 28 L’un des dés pour jeu de rôle comporte 20 faces numérotées de 1 à 20. Lorsqu’on lance ce dé une fois et que on note le nombre indiqué sur la face supérieure, on procède à une expérience aléatoire. Il y a 20 résultats possibles à cette expérience. Chacun de ces résultats s’appelle un événement élémentaire. L’ensemble de ces résultats se nomme univers de l’expérience aléatoire. Nous le noterons Ω. 1. L’ensemble A est l’événement : « le nombre obtenu est un multiple de 5 ». Décrire l’événement A. 2. L’ensemble B = {1, 3, 5, 7, 9, 11, 13, 15, 17, 19}. Quel est l’événement B ? 3. Décrire A ∩ B par une phrase et donner tous ses éléments. 4. Décrire A ∪ B par une phrase et donner tous ses éléments. 5. Considérons l’événement C : « le nombre obtenu est inférieur ou égal à 4 ». Autrement dit : C = {1, 2, 3, 4}. Que peut-on dire des événements A et C ? 6. Décrire A par une phrase et donner tous ses éléments. 3.2.2 Quelques autres propriétés Théorème Si l’univers contient n événements élémentaires équiprobables, 1 • la probabilité de chacun d’eux est ; n • la probabilité d’un événement A constitué de k événements élémentaires est P(A) = k n . Ce que l’on écrit aussi : nombre de résultats favorables à A nombres de résultats possibles Théorème A et B étant deux événements d’un univers Ω : • P(A) = 1 − P(A) • P(;) = 0 • P(A ∪ B) = P(A) + P(B) − P(A ∩ B) ✍ MÉTHODE 29 Dans l’expérience aléatoire qui consiste à jeter une fois un dé à 20 faces (méthode 28), on suppose que le dé est bien équilibré. 1. Quelle est la probabilité de sortir de chacun des 20 nombres ? 2. A, B et C sont les événements décrits dans la méthode précédente, calculer P(A), P(B), P(C), P(A), P(A ∩ C), P(A ∩ B), P(A ∪ B). Cours 3.3 24 BTSA Probabilité conditionnelle et indépendance 3.3.1 Probabilité conditionnelle Définition On considère une expérience aléatoire et l’ensemble des issues Ω muni d’une loi de probabilité P. A et B sont deux événements de Ω, A étant de probabilité non nulle. La probabilité de B sachant que A est réalisé est notée PA (B) et est définie par le quotient : PA (B) = P(A ∩ B) P(A) Théorème P(A ∩ B) = P(A) × PA (B) Définition Ω Dire que trois événements forment une partition de Ω signifie que, les événements pris deux à deux sont toujours disjoints et la réunion des trois est l’ensemble Ω. A3 A1 A2 Théorème Si les événements A1 , A2 , A3 , ... An forment une partition de Ω alors la probabilité de l’événement B de l’ensemble Ω est : P(B) = P(B ∩ A1 ) + P(B ∩ A2 ) + · · · + P(B ∩ An ) = PA1 (B) × P(A1 ) + PA2 (B) × P(A2 ) + · · · + PAn (B) × P(An ) Ω A1 B A3 A2 ✍ MÉTHODE 30 Pour fabriquer un objet, un artisan achète des pièces auprès de trois fournisseurs A1 , A2 et A3 . 25% des pièces proviennent du fournisseur A1 , 40% des pièces proviennent du fournisseur A2 et le reste provient du fournisseur A3 . 5% des pièces provenant du fournisseur A1 , 10% de celles provenant du fournisseur A2 et 0, 1% de celles provenant du fournisseur A3 ont un défaut. On prend au hasard une des pièces. 1. Construire un arbre de probabilité traduisant la situation. 2. Calculer la probabilité de l’événement B : « la pièce achetée par l’artisan présente un défaut ». 3.3.2 Indépendance Définition Les événements A et B sont indépendants lorsque la probabilité de l’un ne dépend pas de la réalisation de l’autre. Autrement dit : PA (B) = P(B) ou PB (A) = P(A). BTSA 25 Cours Autre définition Dire que les événements A et B sont indépendants signifie que la probabilité de l’événement « A et B » est égale au produit de leurs probabilités : P(A ∩ B) = P(A) × P(B). ✍ MÉTHODE 31 Ce tableau de contingence permet d’étudier la fréquence de consommation d’alcool selon le sexe d’une population de lycéens français. ``` ``` Sexe ``` Consommation `````` Garçon Fille Nulle moins d’une fois par semaine une fois par semaine plus d’une fois par semaine 50 22 14 5 56 33 8 2 Soient les événements suivants : G : « Le lycéen interrogé est un garçon » F : « Le lycéen interrogé est une fille » B : « Le lycéen interrogé est un buveur occasionnel (moins d’une fois par semaine) » 1. Calculer P(G), P(F), et P(B). 2. Calculer PG (B) et PF (B). 3. « consommer de l’alcool » est-il un phénomène indépendant du sexe du lycéen ? 4. Quelle aurait dû être la répartition des élèves pour avoir deux variables indépendantes ? ``` ``` Sexe ``` ` ` ` Consommation ``` Garçon Fille moins d’une fois par semaine 3.4 Notions de variable aléatoire et de distribution théorique 3.4.1 Approche Partie A : La loterie des couleurs Jouons à la loterie avec une roue « non truquée » divisée en 10 secteurs égaux : 1 rouge, 2 jaunes, 4 verts, 3 bleus. Quelles sont les probabilités des événements : « on a un rouge », « on a un jaune », « on a un vert », « on a un bleu » ? À chaque réalisation de l’expérience aléatoire consistant à faire tourner la roue, on peut associer la valeur de la variable « couleur », qui peut être l’un des éléments de l’ensemble { rouge, jaune, vert, bleu }, avec certaines probabilités. On dit que « couleur » est une variable aléatoire. L’ensemble { rouge, jaune, vert, bleu } n’étant pas numérique, la variable « couleur » est une variable aléatoire qualitative, dont les 4 modalités, ou catégories sont : rouge, vert, bleu, jaune. Partie B : Gain à la loterie Supposons maintenant que le rouge permette de gagner 100 et le jaune 50 , les autres couleurs ne rapportant rien. À chaque tour de roue, la variable X = « somme gagnée » peut prendre les valeurs numériques : { 0 , 50 , 100 } avec certaines probabilités : X est une variable aléatoire numérique. La probabilité de gagner 50 est P(X = 50) = ... Cours 26 BTSA La probabilité de gagner quelque chose est : P(X 6= 0) = 1 − P(X = 0) = 1 − ... = ... (puisque « X 6= 0 » est l’événement contraire de « X = 0 ») Définition Une variable aléatoire X est une variable associée à une expérience aléatoire et servant à caractériser le résultat de cette expérience. Par exemple, lors d’un jeu de dé, X est le numéro donné par le dé ou lors du choix d’une personne dans la population d’un pays, X est la taille de la personne. Définition Dans le premier exemple, on dit que la variable aléatoire est discrète ou discontinue car on peut compter tous les résultats possibles. Dans le second, on dit que la variable aléatoire est continue car on ne peut pas compter tous les résultats possibles, les résultats sont dans un intervalle de R. 3.4.2 Variables aléatoires et distributions discontinues Définition Soit Ω l’ensemble des n résultats provenant d’une expérience aléatoire : Ω = {x 1 ; x 2 ; . . . ; x i ; . . . ; x n }. Définir la loi de probabilité d’une variable aléatoire X sur Ω, c’est associer à chaque résultat x i un nombre pi positif, tel que la somme de tous les pi soit égale à 1. X P(X = x i ) x1 p1 x2 p2 x3 p3 X xn avec 0 ¶ pi ¶ 1 et pi = 1. pn n ··· ··· i=1 Le tableau de la loi de X est appelé distribution de probabilité. Définition La fonction définie sur R qui a x associe F(x) = P(X ¶ x) est appelée fonction de répartition de X. Il s’agit de la version théorique des fréquences cumulées croissantes en statistiques. Théorème • Pour tout x de R, 0 ¶ F(x) ¶ 1. • lim F(x) = 0 et lim F(x) = 1 x→−∞ x→+∞ ✍ MÉTHODE 32 Le résultat du jet d’un dé peut être caractérisé par une variable aléatoire dont une valeur est associé à chacune des faces du dé. Les différentes valeurs possibles de cette variable aléatoire X sont choisies le plus souvent comme suit : x = 1, 2, . . . , 6. Pour un dé supposé parfaitement homogène, une probabilité de 16 peut être associé à chacune de ces valeurs. 1. Compléter le tableau suivant : x P(X = x) F(x) 1 2 3 4 5 6 total − 2. Représenter la distribution de probabilité et la fonction de répartition de X. 3. On peut utiliser la fonction de répartition pour calculer des probabilité de la forme P(1 < X ¶ 4). Calculer P(1 < X ¶ 4) à l’aide de la distribution puis calculer F(4) − F(1). 4. Calculer P(X ¶ 4). BTSA 27 Cours 5. À toute expérience pouvant donner naissance à l’un ou l’autre de deux événements totalement exclusifs A et B (ou A et A), on peut toujours associer une variable aléatoire X telle que X = 1 si A se réalise et X = 0 si B (ou A) se réalise. Une telle variable est appelée variable de BERNOULLI. Reprendre les deux premières questions avec un jeu de pile ou face et une pièce truquée avec laquelle face tombe deux fois plus souvent que pile. Remarque Ce type de variable peut être utilisé également dans de nombreux autres cas : sexe mâle ou femelle observé lors d’une naissance, présence ou absence de pubescence sur une feuille, germination ou nongermination d’une graine, etc. 3.4.3 Variables aléatoires et distributions continues Considérons une variable aléatoire susceptible de prendre n’importe quelle valeur réelle appartenant à un intervalle donné. Cet intervalle peut être par exemple ] − ∞ ; +∞[, c’est-à-dire l’ensemble des valeurs réelles. Une telle variable aléatoire est dite continue Le poids d’un individu prélevé au hasard dans une population donnée est, par exemple, une variable aléatoire continue ne pouvant prendre que des valeurs positives. On peut, dans certains cas, déterminer la probabilité d’observer une valeur comprise dans un intervalle donné [x ; x + ∆x] : P(x ¶ X ¶ x + ∆x). Mais en général, cette probabilité tend vers zéro en même temps que ∆x : la probabilité d’obtenir exactement un résultat donné est généralement nulle, bien que cet événement ne soit pas strictement impossible. La notion de distribution de probabilité n’a donc plus de sens pour une variable continue. Par contre, la fonction de répartition : F(x) = P(X ¶ x), conserve toute sa signification, mais cette fonction est ici continue, sauf éventuellement en un nombre fini de points. De plus, la probabilité d’observer une valeur comprise dans un intervalle donné est : P(x ¶ X ¶ x + ∆x) = P(X ¶ x + ∆x) − P(X ¶ x) = F(x + ∆x) − F(x). Définition F(x + ∆x) − F(x) Si F(x) est dérivable, on peut écrire : lim = F0 (x) = f (x). ∆x→0 ∆x La fonction f (x) est est appelée fonction de densité de probabilité ou densité de probabilité. Elle constitue une forme idéalisée de l’effectif. Théorème On retrouve notamment la fonction de répartition en intégrant cette densité : Z x F(x) = f (t) dt. −∞ Tout comme on obtient la fonction de répartition d’une distribution discontinue en sommant les probabilités élémentaires. Théorème Les fonctions de densité de probabilité sont telles que : Z +∞ f (t) dt = 1 −∞ Remarques L’ensemble des valeurs admissibles pour la variable aléatoire et la fonction de densité de probabilité correspondante définissent une distribution théorique continue. Ces distributions théoriques constituent une forme idéalisée des distributions observées groupées en classes relatives à des variables continues. À la limite, lorsque l’effectif n augmente indéfiniment dans des conditions uniformes et lorsqu’on augmente indéfiniment le nombre de classes en les rendant de plus en Cours 28 BTSA plus étroites, le polygone de fréquences cumulées d’une telle distribution tend en effet à se rapprocher d’une ligne, courbe représentative de la fonction de répartition. De même, le sommet de l’histogramme tend à suivre la courbe de la fonction densité ✍ MÉTHODE 33 On cherche à construire une variable aléatoire X qui donne un nombre au hasard entre 0 et 1 tel qu’il n’y ait pas plus de chance d’avoir un nombre plutôt qu’un autre. Comme on ne peut compter le nombre de valeurs que peut prendre X, la variable est continue. On souhaite, par exemple que P(0, 1 ¶ X ¶ 0, 2) = P(0, 4 ¶ X ¶ 0, 5) = P(0, 9 ¶ X ¶ 1). C’est-à-dire que la densité de probabilité f soit constante. c si 0 ¶ x ¶ 1 f (x) = 0 si x < 0 ou x > 1 1. Trouver la valeur de c pour que f soit bien une densité de probabilité. 2. Exprimer la fonction de répartition. 3. Calculer la probabilité d’obtenir un nombre compris entre 0,12 et 0,37. Remarques Cette distribution est notamment celle du temps d’attente entre un instant quelconque et la première réalisation d’un événement qui, se produit de manière régulière, à intervalle constant. Il peut s’agir par exemple du temps d’attente d’un véhicule devant un signal de circulation du type « rouge et vert », si la périodicité du signal est régulière et si l’arrivée du véhicule est complètement aléatoire. Dans le cas d’un événement lui-même aléatoire (accident de la circulation, mort d’un individu, défaillance d’une lampe électrique, etc.), un autre modèle doit être utilisé. On peut alors supposer par exemple que, pour tout intervalle de temps suffisamment petit, la probabilité de réalisation de l’événement considéré (accident, mort, défaillance, etc.) est proportionnelle à la longueur de l’intervalle : P∆x (A) = a∆x. Après calculs hors programme (où apparaissent les équations différentielles vues en Terminale S), on obtient que la densité de probabilité du temps d’attente (ou de la durée de vie) est donc : −a x ae si 0 ¶ x f (x) = 0 si x < 0 ✍ MÉTHODE 34 1. Trouver la fonction de répartition correspondante. 2. Tracer les courbes représentatives des fonctions densité et de répartion dans le cas où a = 1. Remarque : cette distribution est aussi dite exponentielle de paramètre a. 3.5 Espérance et Variance 3.5.1 Approche Reprenons l’exemple de l’approche 4.4.1, celui de la loterie. La somme que l’on peut gagner est une variable aléatoire X de loi de probabilité : xi P(X = x i ) 0 0,7 50 0,2 100 0,1 Quelle somme peut-on espérer gagner, en moyenne ? Ce sera un nombre, noté E(X), appelé espérance (mathématique) de X. Pour cette loterie, 7 fois sur 10 on ne gagne rien, 2 fois sur 10 on gagne 50 , 1 fois sur 10 on en gagne 100. L’espérance du gain sera donc ... De même qu’en statistique descriptive, le calcul d’une valeur "moyenne", l’espérance, ne suffit pas pour bien rendre compte d’une distribution. BTSA 29 Cours Si on compare notre loterie aux deux suivantes : yi P(Y = yi ) 0 0,98 1000 0,02 zi P(Z = zi ) 20 1 La loterie Y a 50 secteurs égaux (un secteur valant 1000, 49 secteur valant 0). La loterie Z avec 10 secteurs égaux (tous les secteurs valant 20). Ainsi, les trois loteries représentées ci-dessus conduisent à la même espérance de gain : 20 . Mais ce gain est réalisé à coup sûr dans le cas n° 3, alors que 49 fois sur 50, on ne gagne rien pour le cas n°2 (mais 1000, 1 fois sur 50 !). Pour quantifier cette plus ou moins grande variabilité de X, on calculera sa variance, notée V(X) (ou la racine carrée : l’écart type). Calculer la variance et l’écart type de ces trois loteries. 3.5.2 Espérance Définition L’espérance mathématique, notée E(X), est la moyenne de la variable aléatoire X. C’est la valeur théorique vers laquelle tendra la moyenne de chaque tirage en répétant l’expérience un grand nombre de fois. E(X) = i=n X i=1 P(X = x i ) × x i Remarque L’espérance mathématique n’est pas forcément le résultat le plus probable, ni même un des résultats possibles. Définition Dans le cas d’une variable continue, la formule se transpose en : Z +∞ E(X) = x f (x) dx où f est la fonction densité de X. −∞ Théorème Soit X une variable aléatoire d’espérance E(X) et a et b deux réels quelconques. La variable aléatoire aX + b a pour espérance le réel aE(X) + b. 3.5.3 Variance et écart type Définition La variance, notée V(X), est une indication sur la dispersion des valeurs autour de la moyenne. On calcule la variance par : i=n X (x i − E(X))2 P(X = x i ). V(X) = i=1 L’écart type est la racine carré de la variance afin de retrouver l’unité de la variable aléatoire. p σ(X) = V(X) Cours 30 Définition Dans le cas d’une variable continue, la formule se transpose en : Z +∞ V(X) = −∞ (x − E(X))2 f (x) dx où f est la fonction densité de X. Théorème Soit X une variable aléatoire de variance V(X). La variable aléatoire aX + b où a et b sont deux réels donnés, a pour variance a2 V(X) BTSA