C107_1 Rappels de probabilités 1 Rappels de probabilités Probabilités 1 Evénements et probabilités Propriétés des probabilités Probabilisation Probabilités composées Tests Avant-propos Les lignes qui suivent sont sans prétention. Elles ne visent pas à constituer un cours de probabilité exhaustif et rigoureux (surtout au plan mathématique). Notre objectif est tout autre et se veut essentiellement utilitaire. C’est pour cette raison que l’appel à l’intuition est souvent évoqué avec " masquage " plus ou moins réussi de notions mathématiques complexes qui ne feraient qu’alourdir l’exposé sans apporter de véritables outils pour le calcul effectif et concret des probabilités dont nous ferons un usage important mais à un niveau, somme toute, élémentaire dans la suite du cours. Le lecteur, suivant la formule consacrée, est renvoyé à des ouvrages de base pour un approfondissement plus important. Il convient de noter toutefois, que pour ce module, la partie "Probabilités 2" est fondamentale. Evénements et probabilité On considère un ensemble non vide E dont les éléments sont quelconques. Les parties de E sont les ensembles que l’on peut former à partir des éléments de E. C107_1 Rappels de probabilités 1 exemple 1 : E = {a,b,c,d} a, b, c, d sont les éléments de E {a,b}, {c,d}, {a,b,c}, {b},E, F ={} sont des parties de E Toutes les parties de E sont : Partie à 0 élément : ∅ ={} Parties à 1 élément : {a}, {b}, {c}, {d} Parties à 2 éléments : {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d} Parties à 3 éléments : {a,b,c}, {a,b,d}, {a,c,d}, {b,c,d} Partie à 4 éléments : E = {a,b,c,d} Il y a donc 16 parties pour E L’ensemble des parties d’un ensemble E est noté P(E). On notera que le nombre d’éléments de P (E) est 2n si E possède n éléments. exemple 2 : en reprenant l’exemple précédent, on a clairement : P(E) = { ∅ , {a}, {b}, {c}, {d}, {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}, {a,b,c}, {a,b,d}, {a,c,d}, {b,c,d}, E} et on constate bien que 16 = 24. Appelons maintenant événements les éléments de P(E) et définissons une application p de P(E) dans R (ensemble des nombres réels) satisfaisant les axiomes suivants : Axiome1 : Axiome 2 : Axiome 3 : ∀A ∈ P(E) p(A) >= 0 p(E) = 1 si A∩B=∅ alors p(A∪B)=p(A)+p(B) Cette application est appelée une probabilité sur P(E). Un peu de vocabulaire : E est l’événement certain. ∅ est l’événement impossible. {a}, {b}, {c}, {d} sont des événements élémentaires (on ne peut pas les fabriquer à partir d’éléments plus simples). Si A∩B=∅ , on dit que A et B sont des événements incompatibles. Si A* est le complémentaire de A, alors on dit que A et A* sont contraires. C107_1 Rappels de probabilités 1 exemple 3 : reprenons l’exemple précédent (rentabilisé). {a} et {b,c,d} sont contraires, de même que E et ∅ ou encore que {a,b} et {c,d}. {a} et {b,c} sont incompatibles, de même que {a} et {c} ou encore que {a,b} et {c,d} On notera d’ailleurs que des événements contraires sont incompatibles, mais que l’inverse n’est pas vrai : {a} et {b,c,d} sont contraires donc incompatibles, mais {a} et {b,c} sont incompatibles mais non contraires. exemple 4 : Désignons par {x} le tirage d’une carte x dans un jeu de cartes. Les éléments de E sont {as de cœur},{valet de carreau}, {6 de trèfle}, etc…L’événement " tirer un cœur " est défini par exemple par {cœur} = {as de cœur} ∪{2 de cœur}∪{3 de cœur}∪…….∪{10 de cœur}∪{valet de cœur}∪{dame de cœur}∪{roi de cœur} = {{as de cœur},{2 de cœur},{3 de cœur},…….,{10 de cœur) ,{valet de cœur},{dame de cœur},{roi de cœur}} et est une partie de E. " Tirer un cœur " et " tirer un trèfle " sont deux événements incompatibles car {cœur}∩{trèfle}=∅ . " Tirer un cœur " et " tirer un trèfle ou un carreau ou un pique " sont des événements contraires car {cœur}*={trèfle}∪{carreau}∪{pique} Propriétés des probabilités Des axiomes de définition, on peut assez aisément tirer les conséquences suivantes (que nous ne démontrons pas) Prop 1 : Prop 2 : Prop 3 : Prop 4 : Prop 5 : si A⊂ B alors p(A)<p(B) p(A)≤ 1 ∀A ∈ P(E) p(A*) = 1 – p(A) ∀A∈ P(E) p(∅ ) = 0 p(A∪B) = p(A) + p(B) – p(A∩B) C107_1 Rappels de probabilités 1 exemple 5 : Reprenons l’exemple 4. Comme {cœur }, {trèfle}, {carreau} et {pique} sont disjoints deux à deux, on a : p(tirer un cœur)=p({cœur})=1 – p({trèfle}∪{carreau}∪{pique})=1 – p({trèfle}) – p({carreau}) – p({pique}) p(tirer une carte quelconque) = 1 p(tirer un cœur ou un 10) = p({cœur})+p({10})-p({10}{cœur}) mais p({cœur})=p({as de cœur}∪{2 de cœur}∪{3 de cœur}∪…….∪{10 de cœur}∪{valet de cœur}∪{dame de cœur}∪{roi de cœur})=p({as de cœur})+p({2 de cœur})+p({3 de cœur})+…….+p({10 de cœur}) +p({valet de cœur})+p({dame de cœur})+p({roi de cœur}) et p({10})=p({10 de cœur}∪{10 de trèfle}∪{10 de carreau}∪{10 de pique})=p({10 de cœur})+p({10 de trèfle})+p({10 de carreau})+p({10 de pique}) de sorte que p(tirer un cœur ou un 10)= p({as de cœur})+p({2 de cœur})+p({3 de cœur})+……. +p({valet de cœur})+p({dame de cœur})+p({roi de cœur}) +p({10 de cœur})+p({10 de trèfle})+p({10 de carreau})+p({10 de pique}) Probabilisation Les définitions précédentes donnent la signification d’une probabilité mais elles ne donnent pas le moyen de définir concrètement une probabilité. En général, la notion d’équiprobabilité est d’une aide certaine. Des événements élémentaires sont considérés comme équiprobables s’ils ont des probabilités égales. exemple 6 : Jet d’un dé ; le dé n’étant pas considéré comme pipé , on admettra que : p({1}) = p({2}) = p({3}) = p({4}) = p({5}) = p({6}) C107_1 Rappels de probabilités 1 exemple 7 : tirage d’une carte ; les cartes étant physiquement identiques, on a : p({6 de trèfle})=p({3 de carreau})=p({valet de cœur})=p({dame de pique}) Dans le cas d’événements élémentaires équiprobables, ∀Xi, Xj événements élémentaires, p(Xi)=p(Xj) De sorte que p(X1)+p(X2)+……+p(Xn)=p(X1∪X2∪….∪Xn)=p(E)=1 d’où p(Xi) = 1/n On en déduit que ∀A∈ P(E), A = X1∪X2∪ ……∪Xk (puisque les Xi sont élémentaires) Donc p(A) = p(X1) + p(X2) + …..+ p(Xk) = k/n Cette relation, dans le langage courant, s’exprime ainsi : La probabilité d’un événement est le rapport du nombre de cas favorables au nombre de cas possibles. L’exemple suivant illustre cette dénomination (très usuelle). exemple 8 : Jet d’un dé. Les événements élémentaires sont équiprobables p({1}) = p({2}) = p({3}) = p({4}) = p({5}) = p({6}) = 1/6 par suite la probabilité d’obtenir un chiffre impair est p({impair})=p({1})+p({3})+p({5}) = 3/6 = ½ = 0,5 exemple 9 : Jeu de cartes ; tirage de cartes ; tous les tirages de cartes individuelles sont équiprobables ( pour un bon jeu de cartes). Donc p({cœur})=13xp({carte quelconque}) = 13x(1/52) =¼ Une conséquence importante du schéma équiprobabiliste est que la somme des probabilités relatives à une expérience est 1. En effet, soit A, B, …. les événements incompatibles, résultats de l’expérience et soit n(A), n(B),… leurs nombres de cas favorables (pas de double comptage). Alors, en posant n(A) + n(B) + …..= n C107_1 Rappels de probabilités 1 on a p(A) + p(B) + ….. = n(A)/n + n(B)/n + …… = n/n = 1 L’application du principe de base de l’équiprobabilité pour les événements élémentaires se fait, en fait de deux manières. 1) par dénombrement des cas possibles et des cas favorables. On utilise les formules combinatoires suivantes : Nombre de combinaisons : Cnp = n!/(p!(n-p)!) ● Nombre d’arrangements : Anp = n!/(n-p)! Nombre de permutations : Pn = n ! ● ● Une combinaison d’ordre p sur un ensemble E de cardinal n est une partie de E comportant p éléments (pris parmi les n évidemment et sans répétition). Un arrangement est un assemblage de p éléments pris parmi n éléments (sans répétition) dans un ordre donné. Une permutation d’ordre n est un arrangement des n éléments. exemple 10 : tiercé ; 20 chevaux au départ d’une course. Combien de tiercés différents dans l’ordre peut-on faire ? Réponse : A203 = 20!/(17!) = 6840. Combien de tiercés différents dans le désordre peuton faire ? Réponse : C203 = 20!/(17!3!) = 1140. Ces formules permettent un dénombrement (des cas favorables dans le cas de l’exemple 10). exemple 11 : en supposant tous les chevaux de même niveau (supposition hardie), la probabilité de toucher le tiercé dans l’ordre se calcule comme suit : ● ● ● Nombre de cas favorables : 1 arrangement Nombre de cas possibles : 6840 arrangements Probabilité : 1/6840 = 0,000146…. Et pour le tiercé dans le désordre : ● ● ● Nombre de cas favorables : 1 combinaison Nombre de cas possibles : 1140 combinaisons Probabilité : 1/1140 = 0,000877…. C107_1 Rappels de probabilités 1 exemple 12 : Une urne contient 5 boules identiques sauf la couleur : E ={a,b,c,d,e} où a,b,c sont des boules rouges et c,d des boules vertes. Le tirage d'une boule rouge correspond à l'événement R = {a,b,c} et le tirage d'une boule verte à l'événement V = {c,d}. En admettant que p({a})=p({b})=....=p({d}), on a p(R)=3/5 et p(V)=2/5 et on constate, bien sûr, que p(R) +p(V) =1 2) Pour des études de cas plus complexes, le dénombrement est impossible et on utilise alors à la fois la statistique et la loi des grands nombres qui dit (en simplifiant) que si le nombre d’individus testés est assez grand alors on peut confondre la fréquence statistique et la probabilité. exemple 13 : On constate que d'après un sondage effectué sur 2 000 000 de français, le pourcentage de ceux-ci qui ont un nez supérieur à 6 cm est de 34%. On en déduit une valeur approximative de la probabilité pour qu’un français ait un nez supérieur à 6 cm : p=0.34. exemple 14 : Dans une usine, sur 1200 pièces mécaniques, on constate que 60 sont défectueuses. On en déduit, par extension, que la probabilité d’avoir une pièce défectueuse est p=60/1200 = 0,05. Probabilités composées Etant donné un ensemble E et l'ensemble des événements P(E), soit A,B∈P(E) et supposons que p(A) soit non nul. Posons pA(B)=p(A∩B)/p(A) On définit ainsi une nouvelle probabilité et l'on peut en effet vérifier que pA satisfait les axiomes 1,2,3 de la définition d'une probabilité. On l'appelle probabilité conditionnée par A. On peut ré-écrire l'expression ci-dessus comme p(A∩B) = p(A).pA(B) ce qui exprime l'idée suivante : pour avoir simultanément A et B (événement A∩B), il faut d'abord avoir A C107_1 Rappels de probabilités 1 (probabilité p(A)), puis B sachant que A est déjà réalisé, ce qui peut changer le contexte de calcul (pA(B)). Les probabilités se multiplient donc ainsi. Notons que de l'on a aussi p(A∩B) = p(B).pB(A) exemple 15 : Reprenons l'exemple de l'urne avec des boules rouges et des boules vertes de l'exemple 12. Supposons que l'on tire une boule (que l'on ne remet pas dans l'urne) puis une seconde. Quelle est la probabilité de tirer deux boules rouges ? Appliquons la relation précédente : p(2 boules rouges) = p(R).pR(R) = (3/5).(2/4) =0,3 Supposons maintenant que l'on effectue le même type de tirage, mais en remettant à chaque étape la boule tirée dans l'urne. p(2 boules rouges) =p(R).pR(R) = (3/5).(3/5) =9/25 = 0,36 exemple 16 : Des études sur les accidents, on tire les résultats suivants : ● ● ● la probabilité d'avoir un accident si le conducteur est sobre est 0,001 ; soit psobre(accident)=0,001 la probabilité d'avoir un accident si le conducteur est ivre est 0,02 ; soit pivre(accident)=0,02 la probabilité d'avoir un conducteur ivre est 0,01; soit p(ivre)=0,01. Quelle est la probabilité d'avoir un accident avec un conducteur ivre , soit p(accident∩ivre) ? Réponse : p(accident∩ivre) = p(ivre).pivre(accident) = 0,01 . 0,02 = 0,0002 Quelle est la probabilité d'avoir un conducteur ivre si il y a accident , soit paccident(ivre) ? Réponse : paccident(ivre) = p(accident∩ivre)/p(accident) . Pour trouver la probabilité p(accident) il faut tracer un arbre des cas. En fait 4 cas sont à considérer : ● ● ● ● ivre ∩ accident ivre ∩ pas d'accident sobre ∩ accident sobre ∩ pas d'accident toutes les probabilités sont calculées avec les règles précédentes : C107_1 Rappels de probabilités 1 A partir des résultats sur les feuilles de l'arbre précédent, on peut construire un second arbre de racine "occurrence d'accident" : Par déduction, on obtient la probabilité cherchée. On définira l'indépendance de deux événements par la relation suivante : A et B sont indépendants si et seulement si pA(B) = p(B). On a dans ce cas p(A∩B) = p(B).p(A) (comme dans le cas de la seconde partie de l'exemple 15). C107_1 Rappels de probabilités 1 Tests Exercice 1 Dans une salle qui tient 40 personnes (4 rangs de 10) et où je suis placé au hasard, a) quelle chance ai-je d'être au premier rang ? b) d'être au 1er rang à la première place à droite ? NB : on suppose que j'ai autant de chances d'être placé à une place plutôt qu'à une autre. Exercice 2 Dans un jeu de 32 cartes, on tire au hasard 2 cartes. Quelle est la probabilité pour que parmi ces 2 cartes a) figure le 7 de carreau ? b) ne figure aucun 7 ? c) figure au moins un 7 ? Exercice 3 Un sac contient 10 jetons numérotés de 1 à 10. On en tire 3 au hasard simultanément. Quelle est la probabilité pour que, parmi les trois nombres obtenus, on ait a) 3 multiples de 3 b) exactement 2 multiples de 3 c) exactement 1 multiple de 3 d) aucun multiple de 3 e) au moins 1 multiple de 3 f) au moins 2 multiples de 3 C107_1 Rappels de probabilités 1 Exercice 4 Un bassin contient 30 poissons : 5 carpes, 10 tanches, 15 gardons. On pêche 4 poissons d'un coup de filet. Calculer les probabilités des événements suivants : a) les quatre poissons sont tous des gardons b) aucun des quatre poissons n'est un gardon c) il y a au moins 1 gardon dans le filet d) le filet contient 1 carpe, 1 tanche, 2 gardons e) parmi les quatre poissons, il y a au moins 2 carpes. Exercice 5 Un sac contient 20 champignons dont 12 sont comestibles et 8 vénéneux ; parmi ces derniers, 3 sont mortels. On tire au hasard et simultanément 5 champignons du sac. Chaque champignon ayant la même probabilité d'être tiré du sac, quelle est la probabilité pour que a) tous les champignons tirés soient comestibles b) l'on ait tiré au moins un champignon mortel c) l'on ait tiré 3 champignons comestibles et 2 champignons vénéneux. Exercice 6 C107_1 Rappels de probabilités 1 Trois messieurs, appelés A, B, C entrent au restaurant et déposent leurs chapeaux, notés a, b, c au vestiaire. Lorsqu'ils sortent, chacun des messieurs reprend l'un des 3 chapeaux sans vérifier si c'est le sien. a) combien y a-t-il de répartitions possibles des 3 chapeaux entre les 3 messieurs b) on suppose que chacune de ces répartitions a la même probabilité de survenir. Quelle est la probabilité pour que : p1 : aucun des messieurs n'ait son propre chapeau p2 : un seul ait son propre chapeau p3 : deux aient leurs propres chapeaux p4 : les trois aient leurs propres chapeaux Additionner p1, p2 et P3 et expliquer le résultat trouvé. Solution de l'exercice 1 a) Il y a 40 places et 10 sont convoitées. La probabilité est donc p1 = 10/40 = 0,25 b) Il y a 40 places et une seule est convoitée. La probabilité est donc p2 = 1/40 = 0,025 Solution de l'exercice 2 le nombre de cas possibles est C322 = 496 a) n(A) = 31 d'où p(A) = 0,0625 b) n(A) = C282 = 378 d'où p(A) = 0,762 c) n(A) = C41.C281 + C42 = 118 d'où p(A) = 0,238 = 1 - 0,762 file:///C|/IEM/gmC107/C107_1.htm (12 sur 14) [12/03/2003 05:37:48] C107_1 Rappels de probabilités 1 Solution de l'exercice 3 le nombre de cas possibles est N = C103 = 120 a) n(A) = 1 donc p(A) = 1/120 b) n(B) = C32.7 = 21 donc p(B) = 7/40 c) n(C) = 3.C72 = 63 donc p(C) = 21/40 d) n(D) = C73 = 35 donc p(D) = 7/24 A noter que p(D) = 1 - p(A) - p(B) - p(C) e) p(E) = p(A) + p(B) + p(C) = 17/24 ou bien p(E) = 1 - p(D) = 17/24 f) p(F) = p(A) + p(B) = 11/60 Solution de l'exercice 4 Le nombre de cas possibles est N = C304 = 27 405 a) n(A) = C154 = 1 365 donc p(A) = 0,05 b) p(B) = 0,05 c) p(C) = 1 - p(B) = 0,95 d) n(D) = 5.10.C152 = 5 250 donc p(D) = 0,19 e) Si on note (xC) l'événement où on a tiré x carpes, on peut noter que (0C) et (1C) sont des événements incompatibles : (0C)U(1C) est l'événement contraire de (2C)U(3C)U(4C). p(x>= 2) = 1 - p(0C) - p(1C) = 1 - n(0C)/N - n(1C)/N n(0C) = C254 = 12 650 n(1C) = C51.C253 = 11 500 donc p(x >= 2) = 0,119 C107_1 Rappels de probabilités 1 Solution de l'exercice 5 a) p(A) = C125 / C205 = 0,051 b) p(B) = [3.C174 + C32.C173 + C33.C172]/C205 = 0,6 c) p(C) = C123.C82/C205 = 0,397 Solution de l'exercice 6 a) le nombre de possibilités est égal au nombre de permutations : 3! = 6 b) ● ● ● ● les cas favorables sont (A-->c, B-->a, C-->b) et (A-->b, B-->c, C-->a) soit 2 cas d'où p1 = 1/3 les cas favorables sont (A-->a, B-->c, C-->b), (A-->c, B-->b, C-->a) et (A-->b, B-->a, C-->c) soit 3 cas d'où p2 = 1/2 il n'y a qu'un cas favorable (A-->a, B-->b, C-->c) d'où p3 = 1/6 Si deux messieurs ont leur chapeau, le 3ème a forcément le sien, donc p4 = p3 p1 + p2 = P3 = 1 ce qui est normal puisque tous les cas possibles ont été envisagés. C107 Rappels de probabilités 2 Rappels de probabilités Probabilités 2 Variables aléatoires Modèles probabilistes Programmes générateurs Tests Variables aléatoires Dans une expérience, on peut l'inventaire des résultats, c'est à dire des événements possibles : A, B, C,.....K. A ces événements, on peut faire correspondre les valeurs d'une variable X : pour l'événement A ,X = 1 pour l'événement B, X = 2 pour l'événement C, X = 3 ................................................... pour l'événement K, X = n Une telle variable, associée à un ensemble d'événements possibles, est appelée une variable aléatoire. La définition, pour toute valeur de X, de la probabilité correspondante est une loi de probabilité. C107 Rappels de probabilités 2 exemple 17 : Une urne contient 10 boules rouges, 25 boules vertes et 15 boules bleues ; ces boules sont identiques sauf la couleur. L'expérience consiste en le tirage d'une boule. Il y a trois résultats possibles : ● ● ● tirage d'une boule rouge : X = 1, p(X = 1)=10/50 = 0,2 tirage d'une boule verte : X = 2, p(X = 2) = 25/50 = 0,5 tirage d'une boule bleue : X = 3, p(X = 3) = 15/50 = 0,3 et on a, bien sûr, p(X = 1) + p(X = 2) + p(X = 3) = 1. La loi de probabilité p(X) est définie ci-dessus. Elle peut s'exprimer par le graphe suivant : exemple 18 : Un candidat se présente à un examen où il doit tirer 3 sujets au hasard parmi 20 sujets. Ce candidat n'a révisé que 12 sujets. On désigne par X le nombre de sujets révisés parmi les sujets tirés. Les valeurs possibles de X sont : X=0 (pauvre candidat), X = 1, X = 2, X = 3 (candidat chanceux). Pour déterminer la loi de probabilité, dénombrons le nombre de cas possibles et le nombre de cas favorables :nombre de cas possibles : C203 = 1140 ● ● ● ● nombre de cas favorables pour X=0 : C83 = 56 nombre de cas favorables pour X=1 : C121.C82 = 336 nombre de cas favorables pour X=2 : C122.C81 = 528 nombre de cas favorables pour X=3 : C123 = 220 On en déduit p(X = 0) = 0,05 , p(X = 1) = 0,30, p(X = 2) = 0,46, p(X = 3) = 0,19. Modèles probabilistes C107 Rappels de probabilités 2 L'étude de divers phénomènes a permis de définir des modèles probabilistes, c'est à dire de donner des lois de probabilité. Donnons-en quelques exemples. Le modèle probabiliste de Bernouilli ou loi de Bernouilli (ou loi binomiale) est bien adapté aux expériences de "tirages successifs". Cette loi s'exprime par : p(X = k) = Cnkpkqn-k où p est la probabilité d'avoir l'événement attendu A et q=1-p la probabilité d'avoir l'événement contraire A*. Cnp est le coefficient binômial défini plus haut. exemple 19 : on détermine que la probabilité d'arriver à un croisement donné avec feux verts est p=3/5 (donc q=2/5). On effectue n passages successifs à ce carrefour et on désigne par X le nombre d'événements "feux verts". Si n=2, on a ● ● ● p(X=0) = C20p0q2= 4/25 = 0,16 p(X=1) = C21p1q1 = 12/25 = 0,48 p(X=2) = C22p2q0 = 9/25 = 0,36 Si n=5, on a ● ● ● ● ● ● p(X=0) = C50p0q5 =0,01 p(X=1) = C51p1q4 = 0,07 p(X=2) = C52p2q3 = 0,23 p(X=3) = C53p3q2 = 0,35 p(X=4) = C54p4q1 = 0,26 p(X=5) = C55p5q0 = 0,08 Le modèle de Poisson correspond à la tendance de la loi de Bernouilli quand p est faible et quand n est grand (infini). Son expression est p(X = k) = e-m. mk/k! où m est un paramètre qui correspond à la valeur moyenne de X. Des tables permettent de donner les valeurs de p(X = k). On peut aussi utiliser une calculette. C107 Rappels de probabilités 2 exemple 20 : un phénomène suit une loi de Poisson de moyenne 4 ; soit A l'évènement attendu. Quelle est la probabilité d'obtenir A 8 fois, moins de 8 fois ? p(X = 8) = 0,0298 p(X < 8) = p(X = 0) + p(X = 1) + p(X = 2) + p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + p(X = 7) = 0,9489 Ce dernier résultat montre que la probabilité pour que X > 8 est faible : p(X > 8)=1-p(X < 8)-p(X = 8)=0,0213 La loi de Gauss (ou Laplace-Gauss ou loi normale) est bien connue . Elle est utilisée pour une variable aléatoire continue (et non pas discrète comme dans les modèles précédents). Elle est définie à partir de la densité de probabilité où m représente la moyenne et σ l'écart-type. La probabilité pour que X < x0 est donnée par l'expression Les tables donnent les valeurs de p pour la loi réduite (m = 0 et σ = 1). On passe de la loi réduite à la loi normale avec les formules de transformation : exemple 21 : Sur un effectif de 2500 personnes, on mesure la taille en cm. La moyenne est 169 cm et on admet que la taille suit une loi de Gauss d'écart-type σ = 5,6. Quelle est la probabilité pour que la taille d'un individu soit inférieure à 155 cm ? Réponse : en utilisant les tables, on a t = (155-169)/5,6 = -2,5, puis p(T < -2,5) = 1-p(T < 2,5) = 1-0,9938 = 0,0062 Quelle est la probabilité pour que la taille d'un individu soit supérieure à 172 cm ? Réponse : p(X > 172) = 1-p(X < 172) = 1-p(T < t) avec t = (172-169)/5,6 = 0,53 donc, avec l'aide des tables, p(X > 172) = 1-0,7019 = 0,2981 C107 Rappels de probabilités 2 Programmes générateurs Le problème que l'on se pose maintenant est le suivant. On désire simuler des expériences dont les phénomènes obéissent à des lois de probabilité définies. Plus précisément, comment générer des nombres aléatoires obéissant à une loi de probabilité donnée ? Pour répondre à cette question, il faut introduire la fonction de répartition F(x) dont la définition est : F(x) = p(X < x) Il s'agit donc d'une fonction cumulative qui donne la somme de toutes les probabilités depuis la valeur la plus petite de X jusqu'à la valeur x. Bien entendu, F(x) est comprise entre 0 et 1 exemple 22 : Reprenons l'exemple 17 et déterminons la fonction F(x) dans le cas de cet exemple : ● ● ● ● pour x < 1, F(x) = 0 pour x∈[1,2[, F(x) = p(X = 1) = 0,2 pour x∈[2,3[, F(x) = p(X = 1) + p(X = 2) = 0,5 pour x >= 3, F(x) = p(X = 1) + p(X = 2) + p(X =3 ) = 1 La représentation graphique de la courbe correspondante est donnée ci-dessous : D'une manière générale, F(x) a toujours l'allure d'une courbe croissante, partant de 0 et allant vers 1. Pour C107 Rappels de probabilités 2 une variable aléatoire continue, l'allure de F(x) est donnée ci-dessous : En examinant cette courbe, on voit que la solution à notre problème consiste en deux étapes : 1ère étape : Tirer au hasard (loi uniforme) un nombre z compris entre 0 et 1 2ème étape : En utilisant la fonction inverse de F(x), déterminer un nombre aléatoire a suivant la loi de probabilité fixée. Pour tirer un nombre au hasard de manière uniforme entre 0 et 1, plusieurs procédés, plus ou moins performants, sont utilisés. Donnons en un exemple à titre d'illustration. Considérons la récurrence yi = k.yi-1 + C (modulo T) Prenons y0 = 2357, k=515, C=0, T=10000. On obtient successivement : ● ● ● ● ● ● ● y1=3855 d'où z1 = 0,3855 y2 = 5325 d'où z2 = 0,5325 y3 = 2375 d'où z3 = 0,2375 y4= 3125 d'où z4 = 0,3125 y5 = 9375 d'où z5 = 0,9375 y6 = 8125 d'où z6 = 0,8125 etc .... Les ordinateurs sont pourvus de générateurs de nombres aléatoires (en fait pseudo-aléatoires) ce qui permet l'utilisation aisée de la simulation avec des programmes informatiques. La seconde étape est plus délicate et dépend de la loi de probabilité utilisée car la fonction inverse de F(x) n'est pas en général aisée à trouver. Examinons quelques exemples : a) loi uniforme Trouver un nombre aléatoire compris entre a et b : α = (b-a)z+a b) loi de Poisson Trouver un nombre aléatoire suivant la loi de Poisson. On détermine un nombre entier α tel que C107 Rappels de probabilités 2 c) loi normale de Gauss Trouver un nombre aléatoire suivant la loi de Gauss. Plusieurs algorithmes existent. Nous en donnons un cidessous très simple : β=0 Pour k=1 à 12 par valeurs entières β=β+z Fin Pour β=β−6 α = β∗σ + m On pourra, pour plus de précision, utiliser le programme gen2 qui génère des nombres aléatoires suivant plusieurs lois de probabilités avec comparaison avec les distributions théoriques. Tests Exercice 1 Soit f la fonction définie sur R par f(x)=kexp(-|x|). a) déterminer k pour que f soit la densité de probabilité d'une variable aléatoire réelle X. b) déterminer la fonction de répartition de la variable aléatoire réelle X admettant f comme densité de probabilité. c) soit Y=X*X. Déterminer la fonction de répartition et la densité de Y. Exercice 2 C107 Rappels de probabilités 2 Pour X suivant une loi de Poisson de paramètre 4, quelle est la probabilité pour que X soit inférieur à 8 ? pour que X soit égal à 8 ? Exercice 3 On a constaté que la répartition du taux de cholestérol pour un grand nombre de personnes est la suivante : ● ● ● taux inférieur à 165 cg : 58% taux compris entre 165 et 180 cg : 38% taux supérieur à 150 cg : 4% a) sachant que la répartition suit une loi normale, calculer la valeur moyenne du taux de cholestérol et l'écarttype. b) on admet que les personnes dont le taux est supérieur à 183 cg doivent subir un traitement. Quel est le nombre de personnes à soigner dans une population de 100 000 personnes ? Exercice 4 On mesure la taille en centimètres de 2500 hommes. La distribution obtenue suit une loi de Laplace-Gauss de moyenne 169 cm et d'écart-type 5,6 cm. a) indiquer sous forme de pourcentage les proportions d'hommes dont la taille est : ● ● inférieure à 155 cm supérieure à 172 cm. b) de part et d'autre de la valeur moyenne, quelles sont les tailles qui limitent un effectif représentant 60% de la population ? C107 Rappels de probabilités 2 Exercice 5 Un lot contient 3% de pièces défectueuses. a) on prélève au hasard un échantillon de 10 pièces. Les pièces étant très nombreuses, on admet que le tirage peut être considéré comme fait au hasard et avec remise. Soit X la variable aléatoire "nombre de pièces défectueuses dans l'échantillon".` ● ● ● quelle est la loi de probabilité de X ? quelles sont les valeurs de l'espérance mathématique et de l'écart-type ? Quelle est leur signification ? calculer p(X=0) et p(X>=1). b) on contrôle toutes les pièces mais le mécanisme de contrôle est aléatoire. Une pièce bonne est acceptée avec une probabilité de 0,98, une pièce défectueuse est refusée avec une probabilité de 0,99. Calculer la probabilité des événements suivants : ● ● une pièce refusée l'est à tort une pièce acceptée l'est à tort. Exercice 6 Les distributeurs automatiques de timbres poste émettent une fois sur dix un timbre portant un numéro au verso ; les timbres numérotés sont cotés à part dans le catalogue. Un collectionneur reçoit dans son courrier cinq lettres de provenances différentes, chacune d'elles étant affranchie à l'aide d'un timbre émis par un distributeur automatique. Avant de décoller les timbres, considérant que le nombre de timbres numérotés est une variable aléatoire X, il se pose différentes questions : a) quel est l'ensemble des valeurs que peut prendre X ? b) quelle est la loi de probabilité de X ? c) quelle est l'espérance mathématique de X ? d) quelle est la probabilité pour qu'au moins deux des timbres soient numérotés ? Solution de l'exercice 1 C107 Rappels de probabilités 2 f(x)=kexp(-|x|). a) détermination de k b) fonction de répartition c) Y=X2 Soit G la fonction de répartition de Y : Solution de l'exercice 2 En utilisant les tables pour la loi de Poisson, on a : p(X < 8) = 0,9489 et p(X = 8) = 0,0298 C107 Rappels de probabilités 2 Solution de l'exercice 3 a) 0,58 est la fréquence cumulée relative à p(T < 0,21) et 0,96 est la fréquence cumulée relative à p(T < 1,75). Donc X = 165 correspond à t = 0,21 et X = 180 correspond à t = 1,75. Comme t = (X-m)/σ, on a le système : 0,21σ + m = 165 et 1,75σ + m = 180 ce qui conduit à σ = 9,74 et m = 163 b) Pour X = 183, on t = (183-163)/9,74 = 2,053 p(T< 2,05) = 0,9798 donc p(T > 2,05) = 1 - 0,9798 = 0,0202 = 2020/100000 ce qui signifie que 2020 personnes sont concernées. Solution de l'exercice 4 effectif : 2500 ; loi de Laplace-Gauss (normale) de moyenne m = 169 et d'écart-type σ = 5,6 a) -proportion d'hommes dont la taille est inférieure à 155 cm p(X<155) = p(T<(155-169)/5,6) = p(T<-2,5) = 1 - p(T<2,5) = 1 - 0,9938 = 0,0062 d'où N = 2500 x 0,0062 = 16 personnes environ - proportion d'hommes dont la taille est supérieure à 172 cm p(X>172) = 1 - p(X<172) = 1 - p(T<(172-169)/5,6) = 1 - p(T<0,53) = 1 - 0,7019 = 0,2981 d'où N = 2500 x 0,2981 = 745 personnes environ b) tailles limitant un effectif représentant 60% de la population ; on a p(|T|>t) = 0,40 La table donne t = 0,8416 = (x - 169)/5,6 d'où x1 = 173,71 cm x2 = 169 - (173,71 - 169) = 164,29 cm C107 Rappels de probabilités 2 Solution de l'exercice 5 La probabilité pour qu'une pièce soit défectueuse est p = 0,03 a) La loi de probabilité de X est la loi binomiale de moyenne <X> = np = 10 x 0,03 = 0,3 et d'écart-type σ =(npq)0,5 = 0,54. donc p(X=k) = C10k(0,03)k(0,97)10-k En particulier p(X=0) = (0,97)10 = 0,737 et p(X>=1) = 1 - p(X=0) = 0,263 - quelles sont les valeurs de l'espérance mathématique et de l'écart-type ? Quelle est leur signification ? - calculer p(X=0) et p(X>=1). b) contrôle des pièces La probabilité de refuser une pièce à tort est p(bonne si refusée ) = p(refusée et bonne)/p(refusée) = 0,4 La probabilité d'accepter une pièce à tort est p(mauvaise si acceptée) = p(acceptée et mauvaise)/p(acceptée) = 0,0003 C107 Rappels de probabilités 2 Solution de l'exercice 6 a) X peut prendre les valeurs 0, 1, 2, 3, 4, 5 b) la loi de probabilité est la loi binomiale p(X=k) = C5k(0,1)k(0,9)5-k. c) L'espérance mathématique est <X> = np = 5 x 0,1 = 0,5 d) P = 1 - p(X=0) - p(X=1) = 0,08146 poisson gauss gauss file:///C|/IEM/gmC106/docu/gauss.htm (2 sur 2) [12/03/2003 05:32:30] Principes de simulation Principes de simulation Introduction Tirage de nombres aléatoires Confection d'échantillons Simulation suivant une loi de probabilité Tests Introduction Imaginons de calculer le nombre π en choisissant des points au hasard dans un carré de côté 2a. Dans ce carré est inscrit le cercle de rayon a. On compte le nombre total N de points et le nombre n de points situés dans le disque. Si l'on admet que tous les points du carré ont la même probabilité d'être choisis, la probabilité de choisir un point dans le cercle sera approchée par le rapport n/N. Par ailleurs, la répartition des points étant supposée homogène, le nombre de points situés dans le carré est proportionnel à l'aire du carré 4a2. De la même façon, le nombre de points situés dans le disque est proportionnel à l'aire du disque πa2. On en déduit Il suffit donc de faire un grand nombre d'expériences en utilisant, pour la commodité, un ordinateur qui tirera au hasard les coordonnées (x,y) d'un point ( l'origine des coordonnées étant prise au centre du cercle) en suivant la loi uniforme et en vérifiant si x2 + y2 <= a2. Entrer un nombre de tirages et lancer la simulation Principes de simulation Ce petit exemple illustre le principe d'une simulation : 1) On ne fait pas une expérience réelle (cela prendrait beaucoup de temps), mais on utilise l'ordinateur pour effectuer les tirages (constitution d'échantillons aléatoires ) et comptabiliser les cas favorables et les cas possibles. Il s'agit donc d'une expérience "virtuelle". 2) On se rend vite compte que si on veut un résultat significatif, il faut un nombre de tirages assez élevé. C'est d'ailleurs une bonne raison d'utiliser un ordinateur. Normalement, on s'attend à ce que le résultat converge vers la "bonne valeur". On peut alors se fixer un seuil de précision si l'on admet que le résultat converge ; par exemple on peut arrêter le tirage lorsque la différence entre deux valeurs successives est inférieure à 0,001. Voici une nouvelle version de l'application précédente : Entrer la valeur de la différence entre deux résultats successifs (avec un point décimal) et lancer la simulation.(pour arrêter utiliser la barre d'espace) NB : la simulation utilise des tirages de points sur une surface donnée ; ce type de simulation est appelé "Monte-Carlo". Autre simulation possible : toujours le calcul de π, mais avec la méthode de Buffon (1717). Il s'agit de jeter une aiguille de longueur L sur un parquet composé de lattes parallèles de même largeur d. On compte le nombre de fois N où l'on lance l'aiguille et le nombre de fois n où elle coupe une séparation de deux lattes. Buffon a montré que la probabilité de couper une séparation de lattes est (dans le cas où d > L) : 2L/πd Autrement dit, pour N grand , le rapport n/N doit tendre vers cette valeur ce qui permet d'en déduire une valeur approchée de π : Principes de simulation Tirage de nombres aléatoires Comme on le voit dans les exemples précédents, la simulation est basée sur l'utilisation de nombres aléatoires pour la fabrication d'échantillons artificiels. Lorsque les ordinateurs n'existaient pas encore (ou étaient rares), il était possible (il est d'ailleurs toujours possible) d'utiliser des tables de nombres aléatoires obtenus par l'observation de phénomènes physiques obéissant au hasard. Une table bien connue de cette époque reculée était celle de la RAND Corporation qui avait été établie par observation du débit des tubes électroniques. L'utilisation de telles tables consistait à extraire une suite de nombres aléatoires, par exemple 58360937587312385305968851265431298745609854325789043268721095010285730265742892 On peut ensuite effectuer des groupements de deux chiffres par exemple pour obtenir des nombres au hasard entre 00 et 99 : 58 36 09 37 58 73 12 38 53 05 96 88 51 26 54 31 29 87 45 60 98 54 32 57 89 04 32 68 72 10 95 01 02 85 73 02 65 74 28 92 Évidemment, de nos jours, c'est l'ordinateur qui fournit directement ces nombres au hasard. Mais comme ils sont calculés, on ne peut pas dire qu'ils sont aléatoires, mais pseudo-aléatoires. Examinons quelques procédés de génération de nombres pseudo-aléatoires. procédé du mid-square On choisit un nombre initial u0 de 2m chiffres. On l'élève au carré ce qui donne un nombre à 4m chiffres et on prend comme résultat le nombre u1 formé des 2m chiffres centraux. On recommence le procédé sur u1 ce qui conduit à u2, etc... exemple : u0 = 7367 u02 = 54272689 u1 = 2726 u12 = 07431076 u2 = 4310 u22 = 18576100 u3 = 5761 u32 = 33189121 u4 = 1891 u42 = 03575881 u5 = 5758 etc... ce qui donne la suite 73672726431057611891..... procédé de Lehmer Principes de simulation On part de deux nombres au hasard u0 de m chiffres et k de n chiffres. On les multiplie ce qui donne un nombre à m + n chiffres. On sépare les n chiffres de gauche ce qui constitue un nombre d0 que l'on retranche nombre f0 constitué des m chiffres de droite ; on obtient ainsi u1. On réitère le processus avec u1, etc... exemple : u0 = 483215 k = 678 ui x k ui i di fi 0 483215 327619770 327 619770 1 619443 419982354 419 982354 2 981935 665751930 665 751930 3 751265 509357670 509 357670 4 357161 etc... on obtient ainsi une suite 483215619443981935751265357161... procédé de Fibonacci On part avec trois nombres u0, u1 et k, ce dernier étant plus grand que les deux premiers. On génère une suite de nombres aléatoires avec l'algorithme suivant : un+2 = un+1 + un + ak exemple : u0 = 05673 u1 = 09251 avec a = 0 si un+1 + un <= k k = 12654. et a = -1 si un+1 + un > k On obtient successivement u2 = 9251 + 5673 - 12654 = 02270 u3 = 2270 + 9251 = 11521 u4 = 11521 + 2270 - 12654 = 01137 u5 = 1137 + 11521 - 12654 = 00004 u6 = 4 + 1137 = 01141 u7 = 1141 +4 = 01145 u8 = 1145 + 1141 = 02286 etc... Ensuite, on élimine le premier et le dernier chiffre de chaque nombre obtenu, d'où la suite : 567925227152113000114114228...... Validité des procédés Principes de simulation Il existe bien d'autres procédés, mais il faut qu'ils soient acceptables, c'est à dire fournir des nombres équiprobables, ce que l'on peut vérifier en faisant, par exemple le test du Chi2. Confection d'échantillons Prenons un exemple pour être très concret. Imaginons un guichet devant lequel arrive des clients. On mesure tous les 15 minutes le nombre de clients qui arrivent et on obtient après 100 mesures les résultats statistiques suivants : nombre d'arrivées fréquence 0 1 0,00 0,01 2 3 4 5 6 7 8 9 10 11 12 13 0,12 0,23 0,22 0,11 0,08 0,08 0,07 0,03 0,03 0,01 0,01 0,00 On peut considérer que cette statistique approche la loi de probabilité des arrivées supposée inconnue. La moyenne est λ = 4,77 (en prenant comme unité le quart d'heure). On mesure aussi, de la même manière le nombre de clients servis par quart d'heure. 100 mesures fournissent le tableau statistique suivant : nombre de clients servis 0 1 2 3 4 5 6 7 8 9 fréquence 0,00 0,04 0,08 0,10 0,15 0,20 0,24 0,15 0,04 0,00 Comme précédemment, cette statistique approche la loi de probabilité des départs. On constate que la moyenne est µ = 4,91 On souhaite étudier ce système d'attente et obtenir par simulation la longueur moyenne de la file d'attente des clients attendant d'être servis. On commencera par compléter les deux tableaux ci-dessus en faisant correspondre à chaque fréquence une plage de nombres de 2 chiffres : nombre d'arrivées fréquence 0 1 0,00 0,01 2 3 0,12 0,23 4 5 6 7 8 9 10 11 12 13 0,22 0,11 0,08 0,08 0,07 0,03 0,03 0,01 0,01 0,00 Principes de simulation nombres - 0112 00 1335 3657 5868 6976 7784 8591 9294 9597 98 99 - nombre de clients servis 0 1 2 3 4 5 6 7 8 9 fréquence 0,00 0,04 0,08 0,10 0,15 0,20 0,24 0,15 0,04 0,00 nombres - 00-03 04-11 12-21 22-36 37-56 57-80 81-95 96-99 - La signification de ces nombres est la suivante. Imaginons que l'on possède deux suites de nombres aléatoires (ou pseudo aléatoires fournis par un ordinateur) : S1 : 90 27 14 39 52 29 24 79 ..... S2 : 72 71 67 53 43 97 30 98 60 .... Pour le 1er quart d'heure, on tire 90 pour les arrivées et 72 pour les départs ; avec les tableaux cela signifie que 8 clients arrivent et que 6 clients partent pendant ce quart d'heure. Pour le second quart d'heure, on tire 27 pour les arrivées et 71 pour les départs ; ces nombres correspondant à 4 arrivées et 6 départs. On continue ainsi pour une journée entière supposée de 6 heures (24 périodes d'un quart d'heure) et on obtient le tableau suivant dans lequel figurent le nombre d'arrivées et le nombre théorique de services qui pourraient être rendus s'il y avait suffisamment de clients : période S1 S2 nombre d'arrivées nombre de services longueur de la file 1 90 72 8 6 2 2 27 71 4 6 0 3 14 67 3 6 0 4 39 53 4 5 0 5 52 43 5 5 0 6 29 97 4 8 0 7 24 30 4 4 0 8 79 98 7 8 0 9 90 60 8 6 2 10 23 27 4 4 2 11 13 17 3 3 2 12 17 73 3 6 0 Principes de simulation 13 43 97 5 8 0 14 62 81 6 7 0 15 02 13 1 3 0 16 73 10 6 2 4 17 70 03 6 1 9 18 58 92 5 7 7 19 14 54 3 5 5 20 06 57 2 6 1 21 18 28 3 4 0 22 16 81 3 7 0 23 63 60 6 6 0 24 15 39 3 5 0 On constate que la file est en moyenne de 1,33 individus ce qui peut sembler assez satisfaisant. Un autre résultat qui peut être intéressant est le taux "d'oisiveté" du guichetier ; en effet, comme on le constate, à certaine période, il pourrait rendre plus de services qu'il n'y a de clients et on peut donc considérer qu'il est inactif une partie du temps. On constate que le guichetier a effectué 99 services et il aurait pu en effectuer 128, d'où un taux d'oisiveté de 33 % environ. Une simulation de ce genre est à interpréter avec précaution 1) le nombre d'événements n'est pas très important et on a intérêt à effectuer plusieurs simulations (qui donneront des résultats différents) et à faire des moyenne sur l'ensemble des simulations. Une moyenne sur 100 simulations a donné la valeur 7,74 comme moyenne de la longueur de la file d'attente (donc bien différente de la valeur trouvée à partir du tableau ci-dessus). 2) le système est fermé puisque le service ne s'effectue que sur une durée de 6 heures (supposées ici continues) ; il est bien évident qu'il existe des phénomènes de "bord" : il faut attendre le premier client pour le servir et la fermeture du service peut limiter le nombre des dernières entrées. Par suite, il est quelquefois convenable d'effectuer les calculs seulement en période de "croisière". Principes de simulation Simulation suivant une loi de probabilité Il arrive que l'on connaisse les lois de probabilité régissant les phénomènes. Dans ce cas, il est possible, en utilisant l'ordinateur, de générer des nombres dont la distribution suit une loi de probabilité. Par exemple, supposons dans l'exemple ci-dessus que la loi des arrivées et celle des services soient des lois de Poisson : la probabilité d'avoir n arrivées de clients est : avec λ= 4,77 la probabilité d'avoir n services effectués est : avec µ = 4,91 Il faudra donc utiliser un programme générateur de nombres aléatoires suivant la distribution de Poisson. Rappelons que pour trouver un nombre aléatoire suivant la loi de Poisson, on détermine un nombre entier α tel que où z est un nombre aléatoire compris entre 0 et 1 suivant la loi uniforme. On génère les nombres suivant la loi de Poisson de la manière suivante (en langage algorithmique). La fonction gpoiss() utilise les fonctions gunif0() et fac(). fonction int gpoiss(float m) { int α = -1 ; float s = -1 ; float v = 0 ; float q = exp(-m) ; -- m est la moyenne de la loi de Poisson float u = gunif0() ; -- tirage d'un nombre compris entre 0 et 1 suivant la loi uniforme Tant que s <= u Faire α=α+1; v = v + m^α/fac(α) ; -- m^α signifie m à la puissance α et fac(α) est la factorielle de α s = v*q ; FinTantque return α ; } fonction float gunif0() { --tirage d'un nombre aléatoire compris entre 0 et 1 suivant une distribution uniforme -- utilisation de la fonction random() de l'ordinateur qui retourne un nombre a compris entre 0 et 1 return a ; } Principes de simulation fonction int fac(int x) { --calcul d'une factorielle int f = 0 ; int res = 1 ; int z ; Si x>0 alors Pour z=1 à x Faire res=res*z ; FinPour FinSi return res ; } ou bien si votre langage de programmation accepte la récursivité : fonction int fac(int x) { -- calcul d'une factorielle int res ; Si (x>1) alors res = (fac(x-1)*x) ; sinon res = 1 ; FinSi return res ; } En voici une réalisation qui restitue l'équivalent du tableau du paragraphe précédent. Principes de simulation En effectuant une centaine de simulations, on obtient la valeur 6,99 comme longueur moyenne de la file d'attente (vous pouvez trouver une autre valeur évidemment !).. Principes de simulation Tests Exercice 1 Réaliser un programme permettant de calculer p suivant la méthode de Buffon (une visualisation graphique serait appréciée). Exercice 2 Réaliser le programme qui permet de trouver la longueur d'une file d'attente dans les conditions du paragraphe sur la simulation d'une loi de probabilité. Exercice 3 On considère la courbe y = sin x pour x variant de 0 à π. Par simulation Monte-Carlo, déterminer l'aire comprise entre la courbe et l'axe des abscisses. Gestion de stocks Introduction Modèle de Wilson Stock d'alerte, délai de livraison, qualité de service, stock de sécurité Simulation Outils d'étude Tests Introduction Un stock est l'entreposition d'éléments (personnes, marchandises,...) dans un entrepôt soumis à un flux d'entrée ou d'alimentation et un flux de sortie ou d'écoulement. En général, le problème se pose de la manière suivante : le flux d'écoulement étant imposé, comment déterminer le flux d'alimentation ? En fait trois questions sont primordiales : ● ● ● Quand faut-il déclencher le réapprovisionnement ? De combien faut-il réapprovisionner ? Quel est le coût optimal de stockage ? La dernière question est, usuellement, décisive. On peut considérer que le coût total de stockage dépend de trois facteurs : CT =CE + CR + CP où CT est le coût total, CE est le coût d'entretien du stock (gardiennage, assurance, immobilisation, inventaire, usure, obsolescence) que l'on peut considérer proportionnel au nombre d'articles entreposés, CR est le coût de réapprovisionnement (frais discontinus en général), CP est le coût de pénurie (manque à gagner). Pour résoudre les problèmes posés, deux catégories de méthodes sont utilisées : ● ● les méthodes analytiques : utilisation des résultats d'un modèle mathématique les méthodes de simulation Modèle de Wilson Le modèle de Wilson, sous sa forme la plus élémentaire, repose sur les hypothèses A suivantes : Hypothèses A : ● ● ● ● demande permanente (∆ par unité de temps) pas de pénurie approvisionnement cyclique (à des dates régulières) pas de délai de réapprovisionnement (le réapprovisionnement est instantané) Le graphique ci-dessous illustre ces hypothèses en montrant les variations de stock au cours du temps. Pendant une période, le stock moyen est Q/2. On en déduit aisément le coût total (le coût de pénurie est nul) : où cE est le coût d'entretien par unité stockée. Pour une longue période T = nθ : Le coût total est fonction de l'unique variable Q et est la superposition de deux termes, l'un en 1/Q et l'autre en Q. Leur superposition montre qu'il existe une valeur Q optimale pour laquelle le coût total est minimum. Modifions le modèle de Wilson en changeant légèrement les hypothèses : on considère qu'il peut y avoir rupture de stock Hypothèses B ● ● demande permanente (∆ par unité de temps) rupture de stock prévisible pendant une durée fixée θ2(on peut considérer que cela est dû à un délai constant de ● réapprovisionnement) approvisionnement cyclique En désignant par cE et cP les coûts unitaires d'entretien et de pénurie, on a, pour une période θ : Pour une durée T = nθ, on en déduit ce qui montre que le coût total dépend des deux variables Q et γ . Le minimum est obtenu par dérivation partielle par rapport à Q et à γ, en posant On obtient alors les résultats suivants : Modifions encore le modèle de Wilson pour se rapprocher d'une situation plus réaliste : Hypothèses C : ● demande aléatoire γ avec une loi de probabilité donnée par p(γ) ● ● rupture de stock possible coût de réapprovisionnement négligé Au bout d'une période θ, on peut aboutir à deux situations différentes : pas de rupture de stock rupture de stock La demande γ peut varier de 0 à l'infini (en réalité elle reste finie). En sommant sur toutes ces valeurs, le coût total moyen est où le premier terme correspond à la probabilité p(γ <= Q). S'il existe une valeur Q0 telle que CT(Q0-1) > CT(Q0) et CT(Q0+1) > CT(Q0), Q0 sera la valeur optimale du stock. On montre que si l'on pose la valeur Q0 est donnée par l'expression L(Q0-1) < ρ < L(Q0) où ρ est le taux de pénurie et λ représente le pas avec lequel varie γ : de 1en 1, de 10 en 10, etc.... Stock d'alerte, délai de livraison, qualité de service, stock de sécurité Les demandes de réapprovisionnement n'ont pas dans la réalité un effet immédiat et il faut donc tenir compte des délais de livraison. Une façon de prendre en compte le délai de livraison est l'utilisation d'un stock d'alerte (ou niveau d'alerte). Il s'agit d'une valeur du stock Qa qui permet le déclenchement d'une commande ; celle-ci arrivera dans un délai τ. Le problème à résoudre dans ce cas est la fixation de Qa ; or cette valeur dépend évidemment du délai τ ce qui rend difficile une résolution analytique du problème. Souvent, on définit une qualité de service ν qui est le rapport du nombre moyen d'articles offerts au nombre moyen d'articles demandés. En supposant une demande constante de ∆ par unité de temps, soit γ la demande au cours d'une période θ et désignons par N(Qa) le nombre d'articles indisponibles au cours de la période θ. Par unité de temps, ● ● ● le nombre moyen d'articles demandés est ∆ le nombre moyen d'articles indisponibles est N(Qa)/θ = N(Qa)∆/γ le nombre moyen d'articles offerts est ∆ - N(Qa)∆/γ et la qualité de service est définie par : ν = 1 - N(Qa)/γ Une technique permettant d'éviter la pénurie est celle dite des "deux magasins". On définit un stock d'alerte Qa et un stock de sécurité Qs inférieur à Qa. Quand le stock diminue et atteint Qa, une demande de réapprovisionnement est effectuée. Le stock continuant de diminuer suite à la demande, lorsque sa valeur atteint Qs et que le réapprovisionnement n'a toujours pas eu lieu, la politique de gestion des stocks change de manière à ralentir la diminution des stocks ; par exemple, on peut ne servir que les clients prioritaires et faire attendre les autres. Simulation On comprendra que plus on se rapprochera d'une situation réaliste, plus les modèles analytiques deviendront complexes et la résolution des problèmes quasiment impossible. L'utilisation de méthodes de simulation, par contre, peut fournir des résultats plus simplement. Donnons sur un exemple (inspiré de celui proposé dans l'ouvrage de R. Faure), l'application d'une simulation. Un stock étant constitué par des objets identiques, on effectue une étude statistique sur la demande quotidienne ce qui permet d'approcher la probabilité de chaque type de demande : 0 1 n p(n) 0,03 0,04 2 3 4 5 6 7 8 9 10 0,12 0,18 0,30 0,10 0,10 0,04 0,04 0,03 0,02 de moyenne <n> = 4,19. Comparons deux politiques différentes : politique P1 : utilisation d'un stock d'alerte s = 30 . La quantité commandée pour le réapprovisionnement est la demande cumulée de la semaine précédente (5 jours ouvrables). Le délai de livraison n'est pas garanti et une étude permet d'obtenir les résultats suivants sur le délai en jours : d p(d) 2 3 4 5 6 7 0,08 0,12 0,24 0,26 0,18 0,12 politique P2 : réapprovisionnement cyclique : le dernier jour ouvrable de chaque semaine, on commande une quantité égale à la consommation moyenne d'une semaine soit 21. La livraison est garantie le dernier jour ouvrable de la semaine suivante. Pour effectuer une simulation, on se procure des nombres aléatoires de 00 à 99 que l'on répartit suivant les probabilités p(n) et p(d) : n p(n) N1 0 1 2 0,03 0,04 0,12 00 à 02 03 à 06 d p(d) N2 07 à 18 2 3 4 5 6 7 8 9 10 0,18 0,30 0,10 0,10 0,04 0,04 0,03 0,02 19 à 36 37 à 66 67 à 76 77 à 86 87 à 90 91 à 94 95 à 97 98 à 99 3 4 5 6 7 0,08 0,12 0,24 0,26 0,18 0,12 00 à 07 08 à 19 20 à 43 44 à 69 70 à 87 88 à 99 En utilisant 2 suites indépendantes de nombres aléatoires : S1 : 07 72 32 55 10 38 16 97 61 29 98 33 96 77 94 76 19 12 34 52 76 14 99 96 37 84 23 19 27 45 S2 : 67 53 23 14 09 69 46 35 24 78 90 12 34 25 08 09 56 89 67 34 29 17 47 03 45 67 84 48 82 33 on obtient les résultats suivants (les colonnes 2 et 3 correspondent au tirage de nombres aléatoires - en fait pris dans les deux suites ci-dessus) : jour 0 données générales N1 N2 dem 07 67 2 stock 21 politique P1 comm délai 21 5 pénurie commentaire stock < 30 politique P2 commentaire stock pénurie 21 commande 1 72 5 19 19 2 32 3 14 14 3 55 4 11 11 4 10 2 7 7 5 38 4 26 6 16 3 22 22 7 97 9 19 19 8 61 4 10 10 9 29 3 6 6 10 98 10 24 11 33 3 14 14 12 96 9 11 11 13 77 14 94 15 53 23 21 18 5 stock < 30 4 stock < 30 commande 24 commande 6 2 8 14 76 5 6 16 19 3 1 17 12 2 27 18 34 3 25 0 1 19 52 4 22 0 3 20 76 5 49 21 4 21 14 2 44 8 22 99 10 42 6 23 96 9 32 0 4 24 37 4 23 0 9 25 84 6 19 21 4 14 09 69 4 26 29 3 2 stock < 30 . 2 31 17 3 5 0 4 21 8 commande 4 stock < 30 stock < 30 1 commande commande etc...... Supposons que pour la politique P1, après un nombre de semaines suffisantes (52 par exemple), on obtienne un stockage de 3728 articles x jours, le lancement de 70 commandes de réapprovisionnement (correspondant à 1 050 articles) et une pénurie totale de 32 articles x jours. Si les coûts unitaires d'entretien et de pénurie sont respectivement de 0,15 et 15 , et si le lancement d'une commande correspond à un coût de réapprovisionnement de 0,40 par article, alors le coût total est C1 = 3728 x 0,15 + 32 x 15 + 1050 x 0,40 = 1 459,20 Supposons de même que pour la politique P2, on obtienne un stockage de 3244 articles x jours et une pénurie de 21 articles x jours. En reprenant les coûts analytiques précédents, le coût total est ici : C2 = 3244 x 0,15 + 21 x 15 + 52 x 21x0,40 = 1 238,40 La meilleure des deux politiques est la politique P2, mais il faut bien comprendre que l'on peut faire varier des paramètres, en particulier la valeur du stock d'alerte de la politique P1 et il n'est pas sûr que, dans ce cas, le résultat obtenu soit encore valable pour un stock d'alerte de 25 articles par exemple au lieu de 30. L'intérêt de la simulation est justement de pouvoir changer à volonté les hypothèses afin d'en examiner les conséquences. Outils d'études 1) Modèle de Wilson Le programme Wilson.exe permet de visualiser les résultats du modèle de Wilson en avenir incertain (hypothèses C) 2) Simulation Le programme Simustoc.exe permet sous diverses hypothèses de simuler une gestion de stock. Tests Exercice 1 Une usine dispose d'un parc important de machines d'un même modèle. Ces machines sont sujettes à des avaries nécessitant la mise au rebut et le remplacement complet d'un sous-ensemble mécanique. On a remarqué que le nombre de sous-ensembles à changer mensuellement est distribué suivant une loi de Poisson de moyenne 3,5. Le service entretien de l'usine dispose d'un stock de rechanges réapprovisionné tous les mois. Le prix d'un sous-ensemble neuf chez le fournisseur habituel est de 3 000 . Le coût de transport par camion est le même quelle que soit la quantité transportée. Le coût de stockage est pris égal à l'intérêt de l'argent immobilisé (taux d'intérêt 8% par an). 1. Lorsqu'il se produit une avarie sur une machine et qu'il n'y a pas de rechange possible, on décide de reporter la production sur une autre machine en heures supplémentaires. Le coût de pénurie est ainsi évalué à 300 par mois et par machine. Déterminer le niveau optimal de stockage de manière à minimiser le coût global de gestion sur une année. Quel est alors ce coût ? 2. Est-il plus intéressant en cas de pénurie de commander le sous-ensemble à une entreprise locale de mécanique qui s'engage à le livrer dans un délai très rapide moyennant un supplément de 15% sur le prix habituel. Exercice 2 On cherche à définir une politique de gestion de stocks sachant que la capacité maximale de l'entrepôt utilisé est de 700 articles (tous les articles sont supposés identiques). Le nombre de jours ouvrables dans une semaine est de 5. On considère qu'il est justifié d'effectuer une simulation sur 8 semaines. Les coûts sont les suivants : coût unitaire d'entretien :0,15 ; coût unitaire de pénurie : 15 ; coût unitaire de réapprovisionnement : 0,40 . On désire comparer les politiques suivantes : ● Politique P1 : délai de livraison aléatoire ■ approvisionnement fonction de la capacité de stockage actuelle ● commande sur niveau d'alerte ● valeur du niveau d'alerte : 190 ● Politique P2 : ■ délai de livraison aléatoire ● approvisionnement fonction de la capacité de stockage actuelle ● commande sur niveau d'alerte ; valeur du niveau d'alerte : 170 ● Politique P3 : ■ ■ ■ ● livraison à date fixe le jeudi approvisionnement fonction de la capacité de stockage actuelle commande à jour fixe le mercredi Politique P4 : ■ ■ délai de livraison fixe : 1 jour approvisionnement fonction de la demande de la semaine précédente ■ commande sur niveau d'alerte ; valeur du niveau d'alerte : 120 On pourra utiliser le programme simstock.exe. Processus Stochastiques Processus Stochastiques Définitions de base Usage de graphes Ergodicité Programme de simulation Tests Définitions de base Considérons un système S en évolution. Ce système est supposé passer d'état en état, le nombre d'états étant fini : E1, E2, E3,..., Em (suite finie d'états discrets). Le changement d'états est aléatoire et on dit alors que le processus d'évolution du système est stochastique : On suppose que le système est "à mémoire courte", c'est à dire que l'occurrence d'un état ne dépend que de l'état de l'étape précédente. Le processus est alors appelé chaîne de Markov. Pour décrire un tel processus, on utilise 2 types de probabilités : ● qk(n) : probabilité de trouver le système dans l'état Ek à l'instant (ou étape) n. Comme il y a m états, il y a donc m probabilités qk(n) que l'on range dans un vecteur de probabilité : Q(n) = {q1(n) q2(n) q3(n) .........qm(n)} Bien entendu, la somme de toutes ces probabilités est 1 : ● pjk(n) : probabilité de transition d'un état Ej vers un état Ek entre les dates (étapes) n-1 et n . Ces probabilités sont rangées dans une matrice appelée matrice de transition. On supposera ici que ces probabilités sont indépendantes de n (donc du temps) :pjk(n)=pjk Processus Stochastiques En partant d'un état donné Ej, et en faisant la somme de toutes les probabilités de transitions de Ej vers les autres états, on a évidemment ce qui signifie que la somme des éléments d'une ligne de la matrice T est 1. Une telle matrice est quelquefois appelée matrice stochastique. Les matrices de transition possède une propriété remarquable : Propriété : Le produit de deux matrices de transition est une matrice de transition. En particulier, si T est une matrice de transition, Tn est aussi une matrice de transition. exemple 1 : Considérons les matrices suivantes On peut vérifier la propriété précédente : Processus Stochastiques exemple 2 : Soit un système évoluant sur 5 états. La matrice de transition et le graphe des transitions sont : Cherchons la relation entre le vecteur de probabilité et la matrice de transition. Pour trouver le système dans l'état Ek, sachant qu'il était dans l'état Ej à l'étape précédente, on applique le résultat sur les probabilités composée : p(système en Ek à l'étape n) = p(système en Ej à l'étape n-1).pjk ou qk(n)= qj(n-1).pjk Si maintenant, on considère un état quelconque à l'étape n-1, il faut faire la somme de toutes les possibilités : soit Q(n) = Q(n-1).T exemple 3 : reprenons l'exemple 2 et considérons que le système est dans l'état E1 (certain). Le vecteur de probabilité est alors Q(0) = {1 0 0 0 0} Pour chercher les vecteurs de probabilité dans les étapes ultérieures, on applique la relation précédente : Processus Stochastiques Donc Q(1) = Q(0).T Q(2)=Q(1).T = Q(0).T2 Q(3) = Q(2).T = Q(0).T3 ......................................... Par récurrence, on en déduit que Q(n) = Q(0). Tn Un problème se pose : dans quel état va se trouver le système quand n tend vers l'infini (c'est à dire très longtemps après le début du processus) ? Si Tn tend vers une limite Tl, alors on dit que T est ergodique et dans ce cas Q(n) tend vers Ql. Usage de graphes Les transitions, dans les considérations précédentes, ont été représentées par des graphes. Approfondissons cette notion de graphe. Un graphe orienté est une représentation graphique d'une relation définie sur un ensemble. exemple 4 : Soit l'ensemble E ={a, b, c, d, e, f}. Le graphe ci-dessous exprime des relations entre les éléments de E. Processus Stochastiques Donnons d'autres définitions utiles : ● ● ● ● Un chemin est une suite d'arcs permettant de connecter un sommet i à un sommet j. Un circuit est un chemin fermé (i=j) La longueur d'un chemin est le nombre d'arcs du chemin. Une boucle est un circuit de longueur 1. A tout graphe on peut faire correspondre une matrice d'adjacence, matrice booléenne A dont les éléments sont Aij = 1 si un arc va de i vers j, 0 sinon. exemple 5 : dans l'exemple 4, on a 2 boucles et 1 circuit (de longueur 3). La matrice d'adjacence du graphe est : La matrice d'adjacence A indique les chemins de longueur 1. Recherchons les chemins de longueur 2. S'il existe un chemin allant de i à j, il doit exister au moins un sommet k tel que Aik=1 et Akj=1, donc Aik• Akj=1 où le signe • indique un ET logique. Par suite, on aura ⊕ Aik• Akj =1 où le signe ⊕ indique la somme logique (OU) sur toutes les valeurs de k., ce qui , finalement, s'exprime par A2=1. La matrice A2 indique les chemins de longueur 2. Processus Stochastiques En généralisant, An indiquera les chemins de longueur n. exemple 6 : reprenons l'exemple 4 et calculons les matrices d'adjacence A2, A3, A4, ..... A6 = A3 donc A7 = A4 , A8 = A5, A9 = A3, etc ... Une autre utilité de la matrice d'adjacence est l'étude de la connexité du graphe. On peut former la matrice à = A ⊕ A2 ⊕ A3 ⊕ A4 ⊕.... qui indique s'il existe un chemin allant de i vers j (de longueur quelconque). exemple 7 : pour l'exemple 4, la matrice à est : Processus Stochastiques On désigne par Γ(i) la fermeture transitive du sommet i, c'est à dire l'ensemble des sommets que l'on peut atteindre à partir de i (qui contient i lui-même). exemple 8 : pour l'exemple 4, on a les fermetures transitives suivantes : Γ(1) = {1, 2, 3} Γ(4) = {1, 2, 3, 4} Γ(2) = {2, 3, 1} Γ(5) = {5, 6} Γ(3) = {3, 1, 2} Γ(6) = {6} On démontre que les lignes de la matrice 1⊕ à , où 1 est la matrice identité, définissent toutes les fermetures transitives. exemple 9 : vérifions sur l'exemple 4 : La forme de la matrice permet de déterminer les composantes connexes du graphes (c'est à dire les "morceaux disjoints"). exemple 10 : sur l'exemple 4, on voit que le graphe est bien composé de deux composantes connexes : Processus Stochastiques On dit que deux sommets i et j sont communicants si ces sommets sont mutuellement accessibles : on peut aller de i à j et on peut aller de j à i. La relation "est communicant avec" est une relation d'équivalence car elle est réflexive, symétrique et transitive. Ceci signifie que l'on peut décomposer un graphe en classes d'équivalence. Ces classes d'équivalence se répartissent en classes d'états transitoires quand on quitte ces états, on n'y revient pas) et en classes d'états récurrents (quand on arrive sur ces états, on y reste). exemple 11 : reprenons encore l'exemple 4. L'étude de la matrice 1⊕ à montre que le graphe est composé de 4 classes d'équivalence. Les classes {4} et {5} sont des classes d'états transitoires, les classes {1, 2, 3} et {6} sont des classes d'états récurrents. On dit que le sommet 6 est absorbant (changement d'état impossible) et que la classe {1, 2, 3} est périodique. Ergodicité T étant une matrice de transition, T est dite régulière (ou fortement ergodique) si, à partir d'une certaine puissance n, tous les éléments de Tn sont strictement positifs. exemple 12 : Processus Stochastiques On pourra éventuellement s'appuyer sur les propriétés de certaines matrices. Un point fixe d'une matrice carrée M est défini comme le vecteur Q0 tel que Q0.T = Q0 exemple 13 : x = 2 et y = -1 donc Q0 = {2 -1} est un point fixe de M Les définitions précédentes permettent alors d'énoncer le théorème fondamental sur l'ergodicité (non démontré ici) : Théorème : Si T est une matrice de transition régulière ● ● ● T admet un point fixe unique Q0 qui est un vecteur de probabilité à composantes strictement positives Tl=limTn pour n tendant vers l'infini a pour lignes les éléments de Q0 Q étant un vecteur de probabilité quelconque, quand n tend vers l'infini, limQ.Tn = Q0 exemple 14 : Un automobiliste change de voiture tous les ans : ● ● ● quand il possède une Citroën, il achète une Renault quand il possède une Renault, il achète une Ford quand il possède une Ford, il achète une Ford dans 50% des cas, une Citroën dans 25% des cas, une Renault dans 25% des cas. Processus Stochastiques On voit que T est régulière. Recherchons alors son point fixe Q0 = {x y z} avec x+y+z=1. En 1987, l'automobiliste avait un Renault, qu'aura-t-il en 2007 ? 1987 correspond à l'étape 0 : Q(0) = {0 1 0} ; 2007 correspond à l'étape Q(20) : On voit donc que l'automobiliste, en 2007, aura 1 chance sur 7 de posséder une Citroën, 2 chances sur 7 de posséder une Renault, 4 chances sur 7 de posséder une Ford. Processus Stochastiques Programme de simulation Un programme de simulation de processus stochastiques peut être téléchargé. Tests Exercice 1 On considère un fort polygonal à 5 sommets. Une sentinelle se déplace d'un sommet à l'autre de telle sorte que si elle quitte un sommet il y a une probabilité p qu'elle se décide à aller au sommet adjacent dans le sens des aiguilles d'une montre et 1-p à l'autre sommet adjacent. a) On suppose qu'à l'état initial, la sentinelle est en 1. Au bout de 3 déplacements, quelles sont les probabilités de trouver la sentinelle aux sommets 1,2,3,4,5 ? (on prendra p=0,33 pour l'application numérique). b) Après de multiples déplacements, quelles sont ces probabilités ? Exercice 2 Un rat est enfermé dans un labyrinthe formé de 6 cases comme indiqué sur la figure ci-dessous. On constate statistiquement les faits suivants en faisant des observations de minute en minute : ● ● ● si le rat est en 1, dans 20% des cas il passe en 2 ; dans 30% des cas il reste en 1. si le rat est en 2, dans 50% des cas il passe en 3 ; dans 20% des cas il passe en 5 ; dans 10% des cas il passe en 1. si le rat est en 3, dans 30% des cas il passe en 6 ; dans 20% des cas il reste en 3. Processus Stochastiques ● ● ● si le rat est en 4, dans 30% des cas il passe en 1 ; dans 30% des cas il passe en 5. si le rat est en 5, dans 20% des cas il passe en 4 ; dans 20% des cas il passe en 2 ; dans 20% des cas il passe en 6. si le rat est en 6, dans 50% des cas il passe en 3 ; dans 30% des cas il reste en 6. a) Déterminer où le rat a le plus de chances de se trouver au bout de 10 minutes. b) Au bout d'un temps infini, où le rat a-t-il le plus de chances de se trouver ? Exercice 3 Une étude de marché dans un magasin fait apparaître les faits suivants concernant l'achat de trois produits A,B,C : ● ● ● après l'achat d'un produit A, l'achat suivant concerne 10 fois sur 100 le produit A, 20 fois sur 100 le produit B. après l'achat d'un produit B, l'achat suivant concerne 50 fois sur 100 le produit B et 50 fois sur 100 le produit C. après l'achat d'un produit C, l'achat suivant concerne 100 fois sur 100 le produit A. a) En considérant comme états "l'achat d'un produit A", "l'achat d'un produit B", "l'achat d'un produit C", déterminer la matrice de transition. b) Si, dans l'état initial, un produit A vient d'être acheté, avec quelles probabilités verra-t-on l'achat d'un produit A, B, C deux achats successifs plus tard ? c) Au bout d'un grand nombre d'achats successifs, quelles sont les probabilités d'achat de A, B, C ? Exercice 4 Une escadrille composée de 4 avions est chargée de missions quotidiennes au dessus du territoire ennemi et y subit des pertes éventuelles. Elle n'effectue toutefois sa mission journalière que si son effectif en début de journée s'élève au moins à 3 appareils. Si d'autre part, son effectif au soir de la journée précédente est Processus Stochastiques réduit à 2 ou moins de 2 appareils, elle reçoit au cours de la nuit un appareil de renfort. Sachant que la probabilité de destruction d'un appareil au cours d'une mission est p=0,33 définir l'évolution du système. Exercice 5 Un atelier de réparation s'occupe de deux types de moteurs. La réparation d'un moteur M1 demande 2 jours, celle d'un moteur M2 une seule journée. La probabilité de panne des moteurs M1 est p1=0,33, celle des moteurs M2 est P2=0,50 pour chaque journée. Les travaux non effectués à l'atelier sont confiés à l'extérieur. Sachant que, si une journée de réparation a déjà été accomplie sur un moteur de type M1, on refuse tout travail pouvant se présenter le jour suivant, mais qu'on accepte n'importe quelle tâche chaque autre jour où il ne s'en présente qu'une, on hésite entre deux politiques dans le cas où il s'en présenterait deux différentes : ● ● accorder la préférence à la réparation de M1 préférer au contraire la réparation de M2 Quelle est la meilleure des deux politiques ? Solution de l'exercice 1 Le graphe "états-transitions" et la matrice de transition T sont donnés ci-dessous (on pose q=1-p) a) L'état initial est Q(0) = {1, 0, 0, 0, 0} Q(1) = Q(0).T = {0, q, 0, 0, p} Processus Stochastiques Q(2) = Q(1).T = {2pq, 0, q2, p2, 0} Q(3) = Q(2).T = {0, 3pq2 ,p3 ,q3 ,3p2q} Q(4) = Q(3).T = {6p2q2 ,p4 ,4q3 ,4p3q ,q4} Q(5) = Q(4).T = {p5+q5, 10p2q3 ,5p4q ,5pq4 ,10p3q2} On notera que q+p = 1 et que 2pq + q2 + p2 = (p+q)2 = 1, 3pq2 + p3 + q3 +3p2q = (p+q)3 = 1, 6p2q2 + p4 + 4pq3 + 4p3q + q4 = (p+q)4 = 1, p5 + q5 + 10p2q3 + p4q + 5pq4 + 10p3q2 = (p+q)5 =1 b) Recherchons si la matrice T est régulière T4 ne contient pas d'élément nul, donc T est régulière. Recherchons alors le point fixe Q0 de T : Q0.T = Q0 Posons Q0 = {x ,y ,z ,u ,v} avec x+y+z+u+v = 1 Q0.T = {yp+qv, xq+pz, yq+pu, zq+pv, px+qu} d'où yp+qv=x, xq+pz=y, yq+pu=z, zq+pv=u, px+qu=v On constate qu'une permutation circulaire x->y->z->u->v ne change pas les équations précédentes ce qui indique que : x = y = z = u = v = 1/5 Donc Q0 = {1/5, 1/5, 1/5, 1/5, 1/5} est l'état limite. Solution de l'exercice 2 L'étude des transitions conduit au résultat suivant : Processus Stochastiques a) On part d'états initiaux : Q(0)={1, 0, 0, 0, 0, 0},ou Q(0)={0, 1, 0, 0, 0, 0} ou etc... En utilisant le programme stocha.exe on en déduit sans difficulté Q(10). On peut aussi calculer T10 et en déduire Q(10)=Q(0).T10 (évidemment calcul très fastidieux !) : si Q(0)={1, 0, 0, 0, 0, 0} alors Q(10)={0,10 ; 0,20 ; 0,20 ; 0,15 ; 0,20 ; 0,14} si Q(0)={0, 1, 0, 0, 0, 0} alors Q(10)={0,08 ; 0,21 ; 0,23 ; 0,13 ; 0,19 ; 0,15} si Q(0)={0, 0, 1, 0, 0, 0} alors Q(10)={0,08 ; 0,21 ; 0,23 ; 0,12 ; 0,18 ; 0,15} si Q(0)={0, 0, 0, 1, 0, 0} alors Q(10)={0,10 ; 0,20 ; 0,20 ; 0,16 ; 0,19 ; 0,14} si Q(0)={0, 0, 0, 0, 1, 0} alors Q(10)={0,09 ; 0,21 ; 0,22 ; 0,14 ; 0,19 ; 0,15} si Q(0)={0, 0, 0, 0, 0, 1} alors Q(10)={0,08 ; 0,22 ; 0,23 ; 0,12 ; 0,18 ; 0,15} b) examinons si la matrice T est régulière. Le calcul (non fait ici) de T3 montre que cette matrice ne contient pas de zéros ce qui indique que la matrice T est régulière. Il faut ensuite calculer le point fixe Q0={x, y, z, u, v, w} (x+y+z+u+v+w=1). ce qui conduit au système linéaire Processus Stochastiques dont la solution est d'où Q0={0,0886 ; 0,2102 ;0,2254 ; 0,1367 ; 0,1885 ; 0,1504} Cette solution peut être vérifiée avec le programme stocha.exe pour un nombre d'étapes assez grand. Solution de l'exercice 3 a) b) Q(0)={1, 0, 0} Q(1)=Q(0).T={0,1 ; 0,2 ; 0,7} c) T est régulière puisque Soit Q0={x, Y, z}, le point fixe, avec x+y+z=1 Q(2)=Q(1).T={0,71 ; 0,12 ; 0,17} Processus Stochastiques Q0.T=Q0 entraîne 0,1x+z=x 0,2x+0,5y=y 0,7x+0,5y=z soit x=0,434 y=0,174 z=0,31 Solution de l'exercice 4 On définit comme état le nombre d'appareils avant une mission journalière. Le résultat d'une mission peut être analysé comme suit : 0 appareil détruit : 4 appareils 1 appareil détruit : 3 appareils avec 4 avions au départ 2 appareils détruits : 2+1 appareils 3 appareils détruits : 1+1 appareils prob =(1-p)4 prob = 4p(1-p)3 prob =6p2(1-p)2 prob =4p3(1-p) prob =p4 4 appareils détruits : 0+1 appareil 0 appareil détruit : 3 appareils 1 appareil détruit: 2+1 appareils avec 3 avions au départ 2 appareils détruits : 1+1 appareils 3 appareils détruits : 0+1 appareil avec 2 avions au départ avec 1 avion au départ pas de mission : 2+1 appareils pas de mission : 1+1 appareils prob =(1-p)3 prob =3p(1-p)2 prob =3p2(1-p) prob =p3 prob =1 prob =1 d'où les résultats ci-dessous pour le graphe des transitions et la matrice T de transition : Processus Stochastiques avec q=1p Avec p=0,33, le programme stocha.exe conduit au résultat suivant : Q(0)={0, 0, 0, 1} Q(∞ )=0,02857 ; 0,20000 ; 0,77143 ; 0,0000} Solution de l'exercice 5 définition des états : 1 2 3 4 pas de réparation réparation de M1, 1er jour réparation de M1, 2ème jour réparation de M2 hypothèse a hypothèse b Processus Stochastiques Avec l'application du programme stocha.exe, à partir de l'état initial Q(0)={1, 0, 0, 0}, on obtient Qa(∞)={0,25188 ; 0,24812 ; 0,24812 ; 0,25188} Qb(∞)={0,28755 ; 0,14163 ; 0,14165 ; 0,42918} Processus Stochastiques Phénomènes d'attente Introduction Processus de Poisson File d'attente à une station File d'attente à S stations Simulation Tests Introduction Les phénomènes d'attente sont des phénomènes courants : attente à un guichet, formation d'embouteillages ou de bouchons, etc... Pour maîtriser ces phénomènes on est conduit à les modéliser. On appellera système d'attente un ensemble composé d'une file d'attente et d'une ou plusieurs stations. Les individus arrivent dans la file d'attente en provenance d'une source qui peut être infinie (systèmes ouverts) ou finie (systèmes fermés). Ils avancent dans la file suivant une certaine priorité, puis, à une station, sont "servis" individuellement . Ils quittent ensuite le système. 2 paramètres importants, généralement stochastiques, déterminent le comportement du système au cours du temps : ● ● la fréquence d'arrivée des individus la durée du service Historiquement, les phénomènes d'attente ont été étudiés depuis le début du XXème siècle, souvent à l'occasion de la mise en oeuvre de systèmes de télécommunications (travaux d'Erlang sur les centraux téléphoniques). De nombreux mathématiciens ont apporté des contributions à ce problèmes : Engset, Borel, Khintchine, Pollarczek, Feller,... Dans ce qui suit, on ne considérera que des problèmes simples avec les hypothèses générales suivantes : ● ● on ne considérera que les systèmes ouverts, les systèmes fermés conduisant à des complexités mathématiques importantes. on prendra comme priorité de placement des individus dans la file la priorité FIFO (First Input, First Output) : les individus se placent dans la file dans l'ordre de leur arrivée. On considérera une modélisation mathématique des files d'attente :dans un premier temps la loi de probabilité des arrivées et des départs, puis le cas d'une file avec une station, enfin le cas d'une file à plusieurs stations. On considérera ensuite la simulation de la formulation d'une file d'attente. Processus de Poisson Intéressons-nous aux arrivées dans une file d'attente. On considérera que les arrivées obéissent aux hypothèses suivantes : ● ● hypothèse 1 : λ étant le nombre moyen d'arrivées par unité de temps, la probabilité d'une arrivée pendant la durée ∆t est λ∆t (où ∆t est aussi petit que l'on veut). hypothèse 2 : Pendant la durée ∆t, il ne peut y avoir au maximum qu'une seule arrivée dans la file (d'où la petitesse de ∆t). Cherchons à résoudre le problème suivant : Quelle est la probabilité pn(t) pour qu'il se produise n arrivées pendant l'intervalle de temps [0,t[ ? Supposons que n arrivées se soient produites pendant l'intervalle de temps [0,t+∆t[. En tenant compte des hypothèses 1 et 2, on ne peut avoir que deux possibilités : ● ● ou bien on a eu n arrivées jusqu'au temps t et pas d'arrivée entre t et t+∆t : la probabilité correspondante est pn(t).(1-λ∆t) ou bien on a eu n-1 arrivées jusqu'au temps t et 1 arrivée entre t et t+∆t : la probabilité correspondante est pn-1(t).λ∆t. Donc, en définitive, la probabilité pn(t+λ∆t) est donnée par la somme : pn(t+λ∆t) = (1-λ∆t).pn(t) + λ∆t.pn-1(t) ou encore, en divisant par ∆t : Quand ∆t tend vers 0, on obtient (passage à la dérivée) : La seconde équation est facile à résoudre : La première équation se résout par récurrence : d'où la loi de Poisson : Cette loi de Poisson est, compte tenu du phénomène, quelquefois appelée loi des naissances. Il existe une autre façon de l'exprimer en considérant, non pas le nombre d'individus présents à la date t, mais l'intervalle de temps θ entre deux arrivées consécutives. Le système étant ouvert, il est clair que cet intervalle peut être calculé à n'importe quelle date, en particulier, en partant de la date t=0 pour laquelle l'effectif est n0 (effectif de départ). Plaçons-nous à un instant t ultérieur à la date t=0. La probabilité pour que θ soit inférieur à t est p(θ <= t) = 1 - p(θ > t) = 1 - p(n(t) = n0) = 1 -p0(t) = 1 - e-λt ce qui montre que la fonction de répartition F(t) = p(θ <= t) de la variable aléatoire θ a une allure exponentielle. On dit que θ suit la loi exponentielle (loi continue de densité de probabilité f(x)=λe-λt). On peut d'ailleurs calculer la valeur moyenne de ). On peut d'ailleurs calculer la valeur moyenne de θ et on trouve que <θ>=1/λ (l'inverse du taux moyen d'arrivées est l'intervalle moyen de temps entre deux arrivées consécutives). Dire que le nombre n d'arrivées au temps t suit la loi de Poisson est équivalent à dire que l'intervalle de temps entre deux arrivées consécutives suit la loi exponentielle. Tout ce qui vient d'être dit pour les arrivées est également valable pour les départs avec des hypothèses analogues (la probabilité d'un départ dans un intervalle ∆t est µ∆t et pendant ∆t, il ne peut y avoir au maximum qu'un seul départ). Le paramètre correspondant à λ est ici µ, taux moyen des départs et le nombre de départs à une date t suivra la loi de Poisson. De même , on pourra dire que le temps de service suit la loi exponentielle et que le temps moyen de service est 1/µ. File d'attente à une station On considère le cas le plus simple, celui d'une file d'attente conduisant à une station unique. Les paramètres descriptifs de ce système sont : ● ● le nombre moyen d'arrivées par unité de temps : λ le nombre moyen de départs par unité de temps : µ Pour des raisons évidentes, on suppose que λ < µ et on formule les hypothèses suivantes : ● hypothèse 1 : la probabilité d'une arrivée pendant l'intervalle de temps ∆t est λ∆t ● hypothèse 2 : la probabilité d'un départ pendant l'intervalle de temps ∆t est µ∆t ● hypothèse 3 : ∆t est suffisamment petit pour qu'il ne puisse se produire au maximum qu'une seule arrivée et qu'un seule départ pendant ∆t. Soit pn(t) la probabilité pour que le système contienne n éléments à l'instant t. Recherchons l'expression de la probabilité pn(t+∆t). Il y a quatre cas possibles : ● ● ● ● arrivée de n-1 éléments jusqu'à la date t et 1 arrivée dans l'intervalle ∆t suivant. La probabilité est pn-1(t).λ∆t.(1-µ∆t) arrivée de n éléments jusqu'à la date t et rien ne se passe dans l'intervalle ∆t suivant. La probabilité est pn(t).(1-λ∆t).(1-µ∆t). arrivée de n+1 éléments jusqu'à la date t et 1 départ pendant l'intervalle ∆t suivant. La probabilité est pn+1(t).µ∆t.(1-λ∆t). arrivée de n éléments jusqu'à la date t et 1 arrivée et 1 départ pendant l'intervalle ∆t suivant. La probabilité est pn(t).λ∆t.µ∆t. d'où la probabilité de l'événement : pn(t+∆t) = pn-1(t).λ∆t.(1-µ∆t) + pn(t).[λ∆tµ∆t + (1-λ∆t).(1-µ∆t)] + pn+1(t).µ∆t.(1-λ∆t) soit, en négligeant les termes du second ordre (du fait de la petitesse de ∆t) : pn(t+∆t) =pn-1(t).λ∆t-pn(t)[(λ+µ)∆t- 1] + pn+1(t)µ∆t En définitive : Si on fait tendre ∆t vers 0 p'n(t) = λpn-1(t) - (λ+ µ)pn(t) + µpn+1(t) p'0(t) = -λp0(t) + µp1(t) n>0 n=0 En régime permanent, il n'y a pas de dépendance du temps, donc : 0 = λpn-1 - (λ+ µ)pn + µpn+1 0 = -λp0 + µp1 n>0 n=0 Le calcul s'effectue alors par récurrence : en posant Ψ=λ/µ (Ψ est inférieur à 1) p1 = Ψp0 p2 = Ψ2p0 .......................... pn = Ψnp0 et puisque la somme de toutes les probabilités est égale à 1 : Du résultat précédent, on en déduit des conséquences qui s'expriment en termes de lois simples : ● nombre moyen d'éléments dans le système : ● temps moyen d'attente dans la file ; chaque élément étant servi en un temps 1/µ, ● temps moyen d'attente dans le système ; c'est la somme du temps moyen d'attente dans la file et du temps moyen de service nombre moyen d'éléments dans la file ; à partir du moment t1 où un élément arrive et où il commence à être servi t2, il arrive λ(t2 - t1) dans la file et comme la durée moyenne de (t2 - t1) est le temps moyen d'attente dans la file, on a : ● exemple : Une petite banque de province possède un guichet unique ouvert 6 h par jour. Une étude statistique fait apparaître un nombre moyen de 54 clients par jour et le temps moyen de service est de 5 minutes par client. En prenant l'heure comme unité de temps, on a, en appliquant les résultats précédents : 1/µ = 5/60 = 1/12 d'où µ = 12 services par heure ετ λ = 54/6 = 9 clients par heure d'où Ψ = 9/12 = 0,75 Par suite : ● ● ● ● ns = 0,75/(1-0,75) = 3 clients tf = 3.(1/12) = 0,25 heure ts = 1/(12-9) = 0,33 heure nf = 9.0,25 = 2,25 clients File d'attente à S stations On supposera que l'on a une seule file d'attente, mais plusieurs stations identiques, au total S. En reprenant les notations précédentes : λ (nombre moyen d'arrivées par unité de temps), µ (nombre moyen de services par unité de temps et par station), Ψ = λ/µ, n (nombre d'individus dans le système au temps t), on a trois cas à considérer : n=0 1<=n<S (pas de file) n>=S (file) La condition de non engorgement est, bien évidemment, Ψ/S < 1. En raisonnant comme précédemment, on aboutit aux équations suivantes : dont la résolution, par récurrence, conduit à : Le paramètre p0 se calcule en exprimant que la somme de toutes les probabilités est 1 soit d'où Applications : du résultat précédent, on déduit les caractéristiques suivantes : ● nombre moyen d'éléments dans le système : ns = nf + Ψ ● nombre moyen d'éléments dans la file : ● temps moyen d'attente dans la file : ● ● temps moyen d'attente dans le système : ts = ns/λ nombre moyen de stations inoccupées ni = S-Ψ. exemple : Dans un garage réparant des véhicules automobiles, un comptoir est chargé de distribuer aux ouvriers des pièces détachées. Le chef du personnel remarque une affluence à ce comptoir muni d'un guichet unique. Il analyse alors le phénomène en effectuant des statistiques : ● paramètre caractéristique des arrivées : sur 100 intervalles de 5 minutes, il compte le nombre d'employés qui arrivent dans chaque intervalle ; à partir du tableau ci-dessous, on ajuste par une loi de Poisson de paramètre λt = 1,26, moyenne du nombre d'employés qui arrivent : nb d'employés nb d'intervalles 0 29 1 34 2 24 3 9 4 3 5 1 100 ● paramètre caractéristique des départs : 100 observations sont effectuées sur les durées des services ; le résultat de ces observations est qu'en moyenne un service dure 3,27 minutes. On ajuste alors par une loi exponentielle : durée nb d'observations 0-1 min 23 1-2 min 20 2-3 min 14 3-4 min 12 4-5 min 9 5-6 min 5 6-7 min 4 7-8 min 5 8-9 min 9-10 min 10-11 min 11-12 min 3 >12 min 0 2 µ = 1/3.27 = 0.30 service par minute la loi est p(t) = 0.30e-0.30t 2 1 100 ● hypothèse A : un seul guichet au service des pièces détachées Ψ = λ/µ = 0,83. Les formules pour une file aboutissant à une seule station conduisent aux résultats suivants : Le nombre d'ouvriers dans le système est ns = Ψ/(1-Ψ) = 5. Le temps moyen s'attente dans la file est tf=ns/µ = 16.66 minutes. Le temps perdu par les ouvriers est : 8H/jour . 0,25 ouvrier/min . tf = 33,33 H Le temps d'occupation effective de l'agent des pièces détachées est 8H/jour . 0,25 ouvriers/min . (1/µ) = 6,5 H La dépense en salaire "inutile" (due à l'inactivité) CA peut être calculée en supposant que l'heure d'ouvrier est de 150 F20 (en incluant la perte de production due à l'inactivité de ces ouvriers) et que le salaire horaire de l'agent des pièces détachées est 7 : CA = 33,33 H . 20 + (8H-6,5H). 7 = 677,1 ● hypothèse B : 2 guichets (donc deux agents ) Le calcul de la dépense CB est effectué sur les bases précédentes et en utilisant les formules pour une file aboutissant à S=2 stations : p0 = 0,413 ● tf=0,69 min ni=1.17 CB=93,12 hypothèse C : 3 guichets (donc trois agents) Le calcul de la dépense CC est effectué de la même manière que précédemment : p0 = 0,433 tf=0,087 min ni=2.17 CC=125 La conclusion est que l'utilisation de 2 employés au service des pièces détachées est optimale. Simulation Les résultats précédents sont issus de la théorie et d'hypothèses mathématiques. On peut traiter le problème d'une autre façon : en effectuant une simulation. L'ordinateur est l'outil idéal pour effectuer des simulations significatives, c'est à dire avec des itérations très nombreuses. Toutefois, on présentera cidessous une simulation "à la main" afin de faire comprendre le mécanisme employé. Considérons l'exemple concret d'une gare possédant S guichets de vente de billets. Le temps qui s'écoule entre deux arrivées consécutives de clients est donné dans la distribution ci-dessous. temps d'interarrivée en min probabilité 0 1 2 3 0,04 0,13 0,45 0,38 moyenne 2,17 Par ailleurs, la durée d'un service possède répartition suivante : durée de service en min probabilité 1 ou 2 3,4 ou 5 0,36 0,42 6,7,8 ou moyenne 9 3,87 0,22 On en déduit les paramètres caractéristiques du phénomène d'attente : λ =1/2,17 = 0,46 µ = 1/3,87 = 0,26 Ψ = λ/µ = 1,769 La valeur de Ψ, supérieure à 1, montre qu'il faut considérer au moins 2 guichets car pour 1 guichet il y aura avec certitude un engorgement non réductible. Pour effectuer la simulation, on tirera des nombres aléatoires allant de 00 à 99 et répartis suivant les tableaux ci-dessous de manière à représenter les lois de probabilité : temps d'inter-arrivée en 0 1 2 3 min probabilité 0,04 0,13 0,45 0,38 répartition 00-03 04-16 17-61 62-99 durée de service en 1 2 3 4 5 6 7 8 9 min probabilité 0,18 0,18 0,14 0,14 0,14 0,05 0,06 0,06 0,05 répartition 00-17 18-35 36-49 50-63 64-77 78-82 83-88 89-94 95-99 On remarquera que l'on a "interprété" le probabilités pour les valeurs entières du second tableau. Les nombres sont tirés dans une table de nombres aléatoires (il en faut deux séries) ou bien avec un ordinateur. Supposons que les deux séries soient : série 1 : 17 30 55 31 21 70 18 41 46 82 15 23 24 40 09 27 53 75 07 38 46 56 90 15 53 51 55 23 58 64 86 36 22 04 86 61 75 71 51 98 98 79 65 44 80 série 2 : 45 43 88 52 97 15 94 95 98 78 83 44 07 91 69 99 68 78 93 02 26 30 92 15 62 49 11 50 80 79 44 95 72 96 78 83 25 76 42 65 24 85 82 70 75 En utilisant les tableaux et les séries ci-dessus , on en déduit les temps d'arrivée et les temps de service successifs clients série 1 temps interarrivée chronologie des arrivées série 2 temps de service A 0 B C D E 17 30 55 31 F G H 21 70 18 I 41 ... ... 2 2 2 2 2 3 2 2 ... 2 4 6 8 10 13 15 17 45 43 88 52 97 15 94 95 98 3 3 7 4 9 1 8 9 9 ... ... On peut alors procéder à une simulation avec, par exemple 2 guichets : dates file 0 guichet guichet longueur inactivité 1 2 file A 1 0 1 A 2 A 3 2 0 B 2 0 B 3 0 B 3 0 4 0 4 C 5 C 6 C D 4 0 7 8 9 10 11 C C C C F D D D E E 4 4 4 4 4 0 1 1 1 0 E 5 0 E E F 12 13 G E 5 0 14 15 16 17 18 19 ... G G G G G G ... E E E E E H ... 5 5 5 5 5 5 ... 0 1 1 2 2 1 ... H H H,I H,I I ... L'étude de ce tableau (très long) permet l'étude du comportement du système d'attente. On peut, en outre, calculer des moyennes et des cumuls pour obtenir des données quantitatives : temps passé, longueur de la file, inoccupation des guichets, etc;.. Tests Exercice 1 A un poste de contrôle automobile des douanes, le nombre de voyageurs se présentant par heure est de 22 ; le temps nécessaire à l'accomplissement des formalités est de 6 minutes par voyageur. On admet que les arrivées constituent un phénomène de Poisson et que les services sont du type exponentiel. Etudier cette situation et proposer des solutions. Exercice 2 Les employés d'une station-service de distribution de carburant sont payés 50 F par heure et travaillent 8 heures par jour. On a remarqué qu'en dehors des jours de pointe, les arrivées des automobiles sont distribuées suivant une loi de Poisson dont le taux moyen est de 4 voitures toutes les 10 minutes. Chaque automobile est servie par un seul employé et la recette réalisée pour chaque voiture est estimée, en moyenne, à 150 F. La durée du service est distribuée suivant une loi exponentielle de moyenne 8 minutes. Sachant que le litre d'essence est acheté 80% de son prix de vente, déterminer le nombre d'employés à embaucher (et donc le nombre de pompes à mettre en service) de façon à maximiser le revenu brut de la station-service. Exercice 3 A une station de taxis, clients et taxis viennent se présenter et s'attendre mutuellement. Les arrivées de clients et de taxis obéissant indépendamment à deux processus stationnaires de Poisson, les cadences moyennes sont les suivantes : ● ● 1,5 client par minute 1 taxi par minute On demande d'étudier le processus d'attente (de taxis ou de clients) en régime stationnaire.