Weitere Files findest du auf www.semestra.ch/files DIE FILES DÜRFEN NUR FÜR DEN EIGENEN GEBRAUCH BENUTZT WERDEN. DAS COPYRIGHT LIEGT BEIM JEWEILIGEN AUTOR. 1 Introduction à la théorie des probabilités 1.1 Evénements et probabilités 1.1.1 Paradoxe de Monty Hall Il y a trois portes, derrière l’une d’elle se trouve une voiture, derrière les autres se trouve une chèvre. On veut gagner la voiture ; on choisi donc une porte. Ensuite on nous montre une des deux autres portes et on nous affirme que la voiture n’est pas derrière celle-ci. On nous demande si on veut changer notre choix. Faut-il changer de porte ou pas ? A premier abord on pourrait croire que ça ne change rien. Pourtant on double nos chances de gagner en changeant de porte. Si on ne change pas, la probabilité de gagner est de Si on change, la probabilité de gagner est de 1 . 3 2 . 3 1.2 Définition d’une probabilité 1.3 Expérience : lancé d’une punaise Deux positions possibles • Sur le dos ( 1) • Sur le côté ( 2) Comment déterminer la probabilité P( 1 )? On lance n fois la punaise et on compte le nombre de fois qu’elle tombe sur le dos. nombre d ' occurences de ω1 Fréquence relative : f (n) = n 1 2 2 866 f (1) = f (2) = f (3) = ... f (1000) = 1 2 3 1000 Plus n est grand, plus f(n) est précis. P(ω1 ) = lim f (n) n →∞ -1- Fehler! Formatvorlage nicht definiert. 1.4 Fehler! Formatvorlage nicht definiert. Exemple classique : dé de Laplace Dé à 6 face ; chaque face est un événement élémentaire 1 à L’ensemble fondamental est = { 1 2 3 4 5 6 }. 6 . On suppose : pi i 1 1/6 … … 2 1/6 6 1/6 Evénement : A1 = « le résultat est un nombre pair » A1 = { 2 4 6 } A2 = « le résultat est un nombre premier » A2 = { 2 3 5 } Définition : Un événement est un sous-ensemble de l’ensemble fondamental. 1.5 Un exemple historique : Le problème du Chevalier de Méré. En 1654 M. de Méré a posé la question suivante à Blaise Pascal : (a) On lance un dé 4 fois. On a succès si le 6 apparaît au moins une fois. (b) On lance deux dés 24 fois. On a succès si on a au moins une fois double-6. Quelle est la version la plus probable ? (a) 5 4 1 5 4 6 2 2 … ={ 1 2 = = 1 2 (échec) (succès) …} (nombre d’éléments) A = « au moins une fois 6 » = {6214, 1536, 6666, …} Le complément de A : = « pas de 6 » -2- Fehler! Formatvorlage nicht definiert. Fehler! Formatvorlage nicht definiert. (b) A = « au moins une fois double 6 » (a) est plus probable que (b). 1.6 Paradoxe des anniversaires Soit un groupe de n personnes. Quelle est la probabilité qu’il y ait au moins 2 personnes qui aient leur anniversaire le même jour ? p : probabilité que deux personnes aient leur anniversaire le même jour q = 1 – p : probabilité que tout le monde ait un anniversaire différent Cas favorables : 1ère personne 365 possibilités 2ème personne 364 possibilités 3ème personne 363 possibilités nème personne 366 – n possibilités Total : Cas possibles : 1ère personne 2ème personne 3ème personne nème personne 365 possibilités 365 possibilités 365 possibilités 365 possibilités Total : n p [%] 10 11.7 15 25.3 20 41.1 22 47.6 23 50.7 -3- 25 56.9 30 70.6 80 99.99 Fehler! Formatvorlage nicht definiert. Fehler! Formatvorlage nicht definiert. 1.6.1 Simulation MATLAB : 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. doubleAnni = 0; %nombre d'anniversaires doubles sur toutes les simul. n = 20; %nombre de personnes %boucle qui effectue 10000 fois la simulation for k = 1 : 10000 %Créer un vecteur de taille 365 rempli de 0 anni = zeros(1,365); for m = 1 : n %Choisir une date d'anniversaire au hasard randomnumber = ceil(365*rand); %Tester si l'anniversaire choisi existe déjà if anni(randomnumber)==1 doubleAnni = doubleAnni + 1; break end %Mémoriser l'anniversaire anni(randomnumber) = 1; end end doubleAnni/10000 %Afficher la probabilité 1.7 Un peu de théorie combinatoire 1.7.1 Echantillons ordonnés avec remise D’une urne qui contient n boules numérotées de 1 à n, on en tire une, note son numéro et la remet dans l’urne. On fait cette expérience 5 fois. Résultat possible avec 10 boules : 3 5 3 1 5 Nombre de résultats possibles : 1.7.2 Echantillons ordonnés sans remise Même expérience que précédemment mais sans remettre les boules dans l’urne. Nombre de résultats possibles : -4- Fehler! Formatvorlage nicht definiert. 1.8 Fehler! Formatvorlage nicht definiert. Problème des tours De combien de manières peut-on placer 8 tours sur un échiquier tel qu’aucune tours ne puisse en prendre une autre ? 1ère méthode Tour dans la 1ère colonne 8 possibilités Tour dans la 2ème colonne 7 possibilités ème Tour dans la 3 colonne 6 possibilités … Tour dans la 8ème colonne 1 possibilité Total : possibilités. 2ème méthode 1ère tour 2ème tour 3ème tour … 8ème tour cases possibles cases possibles cases possibles cases possibles Total : Bizarre, on n’obtient pas le même résultat ! C’est parce qu’on a supposé que les tours ne sont pas permutables. Chaque position à donc été compté 8! fois. Vrai total : -5- Fehler! Formatvorlage nicht definiert. 1.9 Fehler! Formatvorlage nicht definiert. Coefficient binomial « coefficient binomial » Une formule utile : Démonstration : Soit un ensemble de n éléments. Nombre de possibilités de k éléments a) qui contiennent « élément 1 » : b) qui ne contiennent pas « élément 1 » : c) total : 1.10 Théorème du binôme « Théorème du binôme » -6- Fehler! Formatvorlage nicht definiert. 1.11 Fehler! Formatvorlage nicht definiert. Variables aléatoires On lance une pièce de monnaie 3 fois (pile ou face). On gagne le nombre de « piles » en franc. FPP on gagne 2frs. L’ensemble fondamental : x = gain pi xi i xi qi FFF 1/8 0 FFP 1/8 1 FPF 1/8 1 PFF 1/8 1 0 1/8 1 3/8 2 3/8 3 1/8 PPF 1/8 2 PFP 1/8 2 FPP 1/8 2 Combien gagne-t-on en moyenne ? Supposons qu’on lance N = 8000 fois Gain total Gain moyen 1.11.1 1.12 « espérance mathématique » Définitions Variable aléatoire Une variable aléatoire (v.a.) x est une fonction x : IR. Si les valeurs prises par x sont x1, x2, x3, …, xn : qi = Prob(x = xi) -7- PPP 1/8 3 Fehler! Formatvorlage nicht definiert. 1.13 Fehler! Formatvorlage nicht definiert. Espérance mathématique L’espérance mathématique de x est : 1.13.1 1.14 Exemples d’applications Un test de syphilis Supposons que 1% d’une population est infectée par la syphilis. Un test permet de déterminer si le sang d’une personne est infecté ou non. Si on a N = 1000 personnes, il faut faire le test 1000 fois. Y a-t-il un moyen de réduire le nombre de tests ? Oui. On fait des groupes de r personnes auxquelles on effectue une prise de sang et on mélange le tout. A ce moment là, on peut savoir si au moins une personne du groupe est infectée et dans ce cas, on teste chaque personne du groupe. Quelle est la taille r optimale du groupe ? Soit, pour un groupe de r personnes, T = nombre de tests dans ce groupe. • Si mélange non infecté : T = 1 • Si mélange infecté : T = r + 1 Soit q = 1% (probabilité d’être infecté) et p = 1 – q = 99% (probabilité de ne pas être infecté). T P 1 r+1 La moyenne de T : Nombre de tests moyen par personne : -8- Fehler! Formatvorlage nicht definiert. Fehler! Formatvorlage nicht definiert. Problème d’optimisation : Si p est donné, comment choisir r tel que soit le plus grand possible ? cette équation n’est pas algébriquement résolvable. On peut s’approcher de la solutions par tâtonnements ou en utilisant une calculatrice numérique (Mathematica : FindRoot). 1.15 Le « run test » Un générateur crée aléatoirement une suite de 0 et 1. Il produit 0 avec une probabilité p et 1 avec une probabilité 1 – p. 01100111010110 … 0 (n bits) Une classe particulière de variables aléatoires sont les indicateurs. Définition : Un indicateur I est une variable aléatoire qui prend les valeurs 0 ou 1. I : {0, 1} p = Prob(I = 1) 1 – p = Prob(I = 0) Espérance mathématique : On divise la suite en “runs” : 0011100100110 00 111 00 1 00 11 0 Nombre de “runs” : R = 7 Si on a n bits, on a n – 1 indicateurs I qui indiquent pour chaque si deux bits adjacents n’ont pas la même valeur : R = nombre de runs = 1 + nombre de changements Calcul de E(Ik) : I P 00 0 p2 01 1 p(1 – p) 10 1 p(1 – p) 11 0 (1 – p)2 -9- Fehler! Formatvorlage nicht definiert. Fehler! Formatvorlage nicht definiert. Cas particulier : p = ½ (0 et 1 équiprobable) 1.16 La variance On lance un dé 100 fois. X = résultat (1, 2, 3, … 6) Espérance mathématique : X er 1 lancé 4 2ème lancé 1 ème 3 lancé … 100ème lancé 2 … 3 … Moyenne V(X) est la variance. Une formule utile : 1.16.1 Propriétés 1) 2) Si X, Y sont indépendants : 3) 4) Si X, Y sont indépendants : - 10 - Fehler! Formatvorlage nicht definiert. 1.16.2 Fehler! Formatvorlage nicht definiert. Inégalité de Chebychev (t > 1) 1.17 La distribution de Bernoulli Il y a 3 distributions importantes : • La distribution de Bernoulli • La distribution de Poisson • La distribution de Gauss Exemple : On lance un dé n=6 fois à la suite. Quelle est la probabilité d’obtenir exactement 2 fois le résultat 6 ? Probabilité d’avoir « 6 » : p = 1/6 Probabilité de ne pas avoir « 6 » : q = 1 – p = 5/6 6 6 6 6 6 6 p p q q q q 6 6 6 6 6 6 q p q p q q Total : Situation générale : On lance une roue de fortune n fois. La variable aléatoire X = nombre de succès. Probabilité d’avoir exactement k succès : On dit que X suit une loi de Bernoulli. Probabilité en fonction du nombre de succès souhaité pour l’exemple précédent : - 11 - Fehler! Formatvorlage nicht definiert. Fehler! Formatvorlage nicht definiert. Espérance mathématique : On lance la roue de fortune n = 20 fois, on a succès avec p = ¼. En moyenne on a succès. Si X est une variable aléatoire de Bernoulli avec n et p donnés : 1.18 1.18.1 La distribution de poisson Exemple Une centrale téléphonique reçoit en moyenne 20 appels entre 13h et 14h. Quelle est la probabilité qu’un jour donné la centrale reçoive exactement 15 appels ? Voici comment il ne faut pas résoudre le problème : Probabilité qu’il y ait un appel pendant une seconde donnée : X = nombre d’appels entre 13h et 14h Voici comment il faut le résoudre : Supposons que k = 0 : On peut montrer que 1.18.2 Définition Une variable aléatoire qui prends les valeurs k = 0, 1, 2, … avec la probabilité suit la loi de Poisson. On peut montrer que (moyenne) (variance) - 12 - Fehler! Formatvorlage nicht definiert. 1.18.3 Fehler! Formatvorlage nicht definiert. Exemple d’application Dans un journal on trouve en moyenne 1.7 fautes de frappe par page. La section sport comporte 3 pages de texte. Quelle est la probabilité de trouver moins de 4 fautes de frappe dans la section sport ? Moyenne de fautes de frappe dans la section sport : X = nombre de fautes dans la section sport 1.18.4 Approximation de Bernoulli par Poisson La distribution de Bernoulli peut être approximée par la distribution de Poisson : On tourne une roue de la fortune n fois. p : probabilité d’un succès X : nombre de succès dans n lancers (k = 0, 1, …, n) Si n est grand (en pratique n > 30) et p est petit (p < 10%) ou grand (p > 90%), alors : 1.19 La loi exponentielle Une centrale téléphonique reçoit en moyenne 4.7 appels téléphoniques entre 13h et 14h. Quelle est la probabilité que le premier appel arrive après 13h20 ? T = temps (à partir de 13h00 jusqu’au premier appel (« temps d’attente ») T est une variable aléatoire continue : elle prend des valeurs dans IR+. Par contre, Bernoulli et Poisson sont des variables aléatoire discrètes : elles ne prennent que des valeurs entière. - 13 -