École des Mines de Douai — FI1A Mathématiques Année 2008-2009 Correction du DM pour le 5 mai 2009 Définition On appelle processus de Poisson d’intensité λ la donnée d’une famille (Nt )t∈R+ de variables aléatoires toutes à valeurs dans N et vérifiant les conditions suivantes : (1) pour toute famille strictement croissante (t0 , t1 , . . . , tn ) de réels, les variables aléatoires (Nt1 − Nt0 ), (Nt2 − Nt1 ), . . . , (Ntn − Ntn−1 ) sont mutuellement indépendantes ; (2) pour tout k ∈ N, tout t ∈ R+ et tout h > 0, le nombre Nt+h − Nt ne dépend pas de t mais seulement de h ; (3) pour tout t ∈ R+ , P (Nt+h − Nt > 1) = λh + o(h) ; (4) pour tout t ∈ R+ , P (Nt+h − Nt > 2) = o(h). 1. Interprétation des hypothèses. On suppose que Nt est la variable aléatoire qui indique le nombre d’occurrences d’un événement donné (entrée d’un client dans une boutique, par exemple) dans l’intervalle de temps [0, t]. 1.1 La première hypothèse signifie que les nombres d’occurrences dans des intervalles de temps disjoints sont mutuellement indépendants. 1.2 Pour un intervalle de temps très court, la probabilité qu’exactement un événement survienne est quasiment proportionnelle à la longueur de l’intervalle. La probabilité d’au moins deux occurrences est négligeable. 1.3 En remarquant que l’événement contraire de {Nt+h − Nt = 0} est {Nt+h − Nt > 1}, on a P (Nt+h − Nt = 0) = 1 − P (Nt+h − Nt > 1) = 1 − [λh + o(h)] = 1 − λh + o(h). 2. Loi de Nt . On se donne un processus de Poisson (Nt )t>0 d’intensité λ. 2.1 On pose f0 (t) = P (Nt = 0) ; soient t > 0 et h > 0. Comme N0 = 0, Nt+h compte le nombre d’occurrences de l’événement attendu entre les dates 0 et t + h. Ce nombre est nul si et seulement si Nt − N0 et Nt+h − Nt = 0 : les nombres d’occurences entre les dates 0 et t et entre t et t + h doivent être nuls. Une autre façon de le dire consiste à écrire que Nt+h = (Nt −N0 )+(Nt+h −Nt ) sachant que les deux termes entre parenthèses sont des entiers naturels. On a donc {Nt+h = 0} = {Nt − N0 = 0} ∩ {Nt+h − Nt = 0}. Par conséquent, f0 (t + h) = P ({Nt − N0 = 0} ∩ {Nt+h − Nt = 0}) = P (Nt − N0 = 0)P (Nt+h − Nt = 0), 1 Année 2008-2009 Mathématiques École des Mines de Douai — FI1A la dernière égalité ayant lieu d’après l’hypothèse d’indépendance (1) de la définition d’un processus de Poisson. On a donc, en tenant compte de la question 1.3 : f0 (t + h) = f0 (t)P (Nt+h − Nt = 0) = f0 (t) [1 − λh + o(h)] soit encore, t étant fixé, f0 (t + h) = f0 (t) − λf0 (t)h + o(h). On reconnaît là une approximation linéaire affine de la fonction f0 au point t, c’est-àdire un développement limité d’ordre 1 en t, qui montre que f0 est dérivable en t et f00 (t) = −λf0 (t). Comme ceci est vrai quel que soit t ∈ R∗+ et que f0 (0) = P (N0 = 0) = 1, on en déduit que f0 est solution du problème de Cauchy ( y 0 = −λy y(0) = 1. L’équation différentielle y 0 = −λy est une équation différentielle linéaire homogène du premier ordre à coefficient constant, et l’unique solution bien connue de ce problème de Cauchy est P (Nt = 0) = f0 (t) = e−λt . 2.2 Pour tout t > 0 et tout k ∈ N, on pose fk (t) = P (Nt = k). On a toujours Nt+h = (Nt − N0 ) + (Nt+h − Nt ), les deux termes entre parenthèses étant des entiers naturels. Si on note ` la valeur prise par Nt+h − Nt , l’événement {Nt+h = k} sera satisfait si et seulement si Nt − N0 prend la valeur k − `. Pour que ` et k − ` soient bien des entiers naturels, il faut et il suffit que ` ∈ {0, . . . , k}. Par conséquent, {Nt+h = k} = k [ ({Nt − N0 = k − `} ∩ {Nt+h − Nt = `}) . `=0 On peut remarquer que les événements délimités par les parenthèses dans l’expression ci-dessus sont deux à deux incompatibles. Autrement dit, cette écriture est une partition de l’événement {Nt+h = k}. On a donc fk (t + h) = P (Nt+h = k) = k X P ({Nt − N0 = k − `} ∩ {Nt+h − Nt = `}) `=0 = k X P (Nt − N0 = k − `)P (Nt+h − Nt = `) en vertu de (1). `=0 Supposons k > 1 et isolons les deux premiers termes de cette somme : fk (t + h) = P (Nt = k)P (Nt+h − Nt = 0) + P (Nt = k − 1)P (Nt+h − Nt = 1) + k X `=2 2 P (Nt = k − `)P (Nt+h − Nt = `). École des Mines de Douai — FI1A Mathématiques Année 2008-2009 Or on sait que ∀` > 2, P (Nt+h − Nt = 0) = 1 − λh + o(h) P (Nt+h − Nt = 1) = λh + o(h) P (Nt+h − Nt = `) 6 P (Nt+h − Nt > 2) = o(h). Par conséquent, l’expression précédente devient fk (t + h) = fk (t) [1 − λh + o(h)] + fk−1 (t) [λh + o(h)] + o(h) k X fk−` (t) `=2 d’où l’on tire k X fk (t + h) − fk (t) = fk (t) [−λ + o(1)] + fk−1 (t) [λ + o(1)] + o(1) fk−` (t). h `=2 Ceci étant vrai, à t fixé, quel que soit h > 0, passons à la limite lorsque h → 0 : fk0 (t) = −λfk (t) + λfk−1 (t). D’autre part, fk (0) = P (N0 = k) = P (∅) = 0 puisque k > 1 et que {N0 = 0} est l’événement certain. Finalement, on en déduit que la fonction fk est solution du problème de Cauchy ( y 0 = −λy + λfk−1 (t) y(0) = 0 dans lequel l’équation différentielle est linéaire du premier ordre à coefficient constant. 2.3 Pour calculer f1 , utilisons le fait que cette fonction f1 est solution du problème de Cauchy précédent, dans lequel intervient la fonction f0 calculée à la question 2.1 : ( y 0 = −λy + λe−λt y(0) = 0 (E1 ) L’équation homogène y 0 = −λy a pour solution générale y(t) = C e−λt où C ∈ R. Si l’on cherche une solution de (E1 ) sous la forme y(t) = (a t + b)e−λt (avec a, b ∈ R), on a y 0 (t) = (−aλt + a − λb)e−λt et donc y solution de (E1 ) ⇐⇒ e−λt (−aλt + a − λb) = λe−λt (−a t − b + 1) ⇐⇒ a = λ. Les solutions de (E1 ) sont donc les fonctions y définies par y(t) = (λt + C)e−λt où C est un réel arbitraire, que l’on détermine par la condition initiale : C = y(0). De tout ceci on tire que la fonction f1 est donnée par f1 (t) = λt e−λt . De même, f2 est la solution du problème de Cauchy suivant : ( y 0 = −λy + λ2 t e−λt y(0) = 0. (E2 ) 3 Année 2008-2009 Mathématiques École des Mines de Douai — FI1A Les solutions homogènes de (E2 ) étant toujours les fonctions y définies par y(t) = C e−λt où C ∈ R, cherchons une solution particulière de (E2 ) sous la forme y(t) = (at2 +bt+c)e−λt avec a, b, c ∈ R. On a alors y 0 (t) = e−λt [−aλt2 + (2a − λb)t + (b − λc)], de sorte que y h i h solution de (E2 ) ⇐⇒ e−λt −aλt2 + (2a − λb)t + (b − λc) = λe−λt −at2 + (λ − b)t − c 2a − λb = λ2 − λb b − λc = −λc λ2 ⇐⇒ a = et b = 0. 2 ( ⇐⇒ (par identification des polynômes) 2 Les solutions de (E2 ) sont donc les fonctions y définies par y(t) = y2 t2 + C e−λt où C est un réel arbitraire, que l’on détermine par la condition initiale : C = y(0). De tout ceci on tire que la fonction f2 est donnée par λ2 t2 −λt e . 2 f2 (t) = Plus généralement, on conjecture que ∀k ∈ N, ∀t ∈ R∗+ , fk (t) = λk tk −λt e . k! Vérifions cette formule à l’aide d’un raisonnement par récurrence sur l’entier k. On a déjà vérifié cette assertion pour k ∈ {0, 1, 2}. Supposons-la vraie pour un k ∈ N fixé. On a alors λk tk −λt ∗ e . ∀t ∈ R+ , fk (t) = k! On sait d’autre part, d’après la question précédente, que fk+1 est solution du problème de Cauchy ( y 0 = −λy + λfk (t) y(0) = 0 soit y 0 = −λy + λk+1 tk −λt e k! (Ek+1 ) y(0) = 0. Comme l’équation (Ek+1 ) est une équation différentielle linéaire du premier ordre (à coefficient constant), le théorème de Cauchy linéaire assure l’existence et l’unicité d’une solution maximale à ce problème de Cauchy. Ainsi, pour prouver l’assertion concernant la fonction fk+1 il suffit de vérifier que la fonction g : t7−−−→ λk+1 tk+1 −λt e (k + 1)! est elle-même solution de ce problème de Cauchy. Via l’unicité, on aura fk+1 = g. Calculons : (k + 1)λk+1 tk λk+1 tk+1 −λt λk tk −λt g (t) = −λ e =λ e − λfk+1 (t) (k + 1)! (k + 1)! k! = λfk (t) − λfk+1 (t). ! 0 4 i École des Mines de Douai — FI1A Mathématiques Année 2008-2009 Ceci montre que la fonction g est bien solution de (Ek+1 ). En outre elle vérifie bien g(0) = 0 donc elle est solution du problème de Cauchy, ce qui montre bien ce qu’on voulait. Finalement, pour tout entier naturel k et tout réel t > 0, fk (t) = e−λt (λt)k . k! 2.4 La formule précédente s’écrit ∀k ∈ N, P (Nt = k) = e k −λt (λt) k! . On y reconnait la définition de la loi de Poisson de paramètre λt : Nt ∼ P(λt). En particulier, E[Nt ] = λt et Var(Nt ) = λ2 t2 . 3. Loi du temps d’attente. Soit à nouveau (Nt )t>0 un processus de Poisson d’intensité λ. Pour tout n ∈ N∗ , on note Tn la variable aléatoire égale au plus petit indice t pour lequel Nt = n. Autrement dit, si le processus de Poisson correspond au comptage d’occurrences d’un événement particulier, Tn représente l’instant auquel la nème occurrence de cet événement survient. 3.1 On a tout simplement {T1 > t} = {Nt = 0} car réaliser {T1 > t} signifie que la première occurrence intervient à une date supérieure à t, c’est équivalent à dire que le nombre d’occurrences entre les dates 0 et t est nul. On en déduit donc que la fonction de répartition de la variable aléatoire T1 est donnée (pour t > 0) par FT1 (t) = P (T1 6 t) = 1 − P (T1 > t) = 1 − P (Nt = 0) = 1 − e−λt avec également FT1 (t) = 0 de façon triviale pour t 6 0. On reconnaît la fonction de répartition de la loi exponentielle : T1 ∼ E(λ). Plus généralement et de la même façon, pour n ∈ N et t > 0, {Tn+1 − Tn > t} = {NTn +t − NTn = 0} donc FTn+1 −Tn (t) = P (Tn+1 − Tn 6 t) = 1 − P (Tn+1 − Tn > t) = 1 − P (NTn +t − NTn = 0). D’après l’hypothèse (2) de la définition d’un processus de Poisson, cette probabilité est invariante par «translation dans le temps» : P (NTn +t − NTn = 0) = P (Nt − N0 = 0). Il reste donc FTn+1 −Tn (t) = 1 − P (Nt − N0 = 0) = 1 − P (Nt = 0) = 1 − e−λt avec à nouveau FTn+1 −Tn (t) = 0 si t 6 0. La variable aléatoire Tn+1 − Tn , qui désigne le temps d’attente entre deux occurrences consécutives, suit donc toujours la loi exponentielle E(λ). 3.2 Pour t > 0, on a de la même façon que précédemment : {Tn > t} = {Nt 6 n − 1} = n−1 [ {Nt = k}. k=0 5 Année 2008-2009 Mathématiques École des Mines de Douai — FI1A Comme cette dernière réunion est formée d’événement deux à deux incompatibles, on a FTn (t) = 1 − n−1 X P (Nt = k) = 1 − k=0 = 1 − e−λt n−1 X λk tk −λt e k=0 k! n−1 X λk tk . k=0 k! Dérivons cette expression pour obtenir la densité de Tn : fTn (t) = FT0 n (t) = λe−λt n−1 X n−1 X λk k tk−1 λk tk − e−λt k! k=0 k! k=1 (en effet, dans la seconde, somme le terme obtenu à k = 0 est nul) fTn (t) = e −λt "n−1 X X λk tk−1 λk+1 tk n−1 − . k! k=0 k=1 (k − 1)! # On effectue un décalage d’indice dans la seconde somme : fTn (t) = e −λt "n−1 X X λk+1 tk λk+1 tk n−2 − . k! k! k=0 k=0 # Tous les termes pour lesquels k < n − 1 se simplifient. Il reste : fTn (t) = λe−λt (λt)n−1 λn−1 tn−1 = λe−λt . (n − 1)! Γ(n) On en déduit donc que la variable aléatoire Tn suit la loi Γ de paramètres (n, λ). 4. Application. On considère un magasin de vente de chaussures ouvert de 10h à 18h dans lequel le comptage des clients correspond à un processus de Poisson d’intensité λ constante : à chaque instant t (en heures), Nt désigne le nombre de clients entrés depuis le début de la journée. 4.1 On suppose ici que E[Tn+1 − Tn ], moyenne théorique de l’intervalle de temps séparant l’entrée de deux clients, vaut 12min, soit, exprimé en heures, 51 . D’après l’étude précédente, Tn+1 − Tn suit la loi E(λ) dont l’espérance vaut λ1 . Par conséquent, λ = 5. 4.2 Avec les notations du problème, on cherche 1 1 1 P T2 − T1 > = 1 − P T2 − T1 6 = 1 − FT2 −T1 . 12 12 12 Comme la variable aléatoire suit la loi E(λ) d’après la question 3.1, on a FT2 −T1 (t) = 1 − e−λt pour t > 0. Ainsi, P T2 − T1 > 5 5 1 = 1 − 1 − e− 12 = e− 12 ' 0, 66. 12 4.3 Par définition, le nombre de clients «vus» par la vendeuse est N8 − N4 et le temps qu’elle passe à les servir est donc X = 5(N8 − N4 ) (exprimé en minutes). 6 École des Mines de Douai — FI1A Mathématiques Année 2008-2009 D’après l’hypothèse (2) de la définition du processus de Poisson, la loi de N8 − N4 est la même que celle de N4 − N0 = N4 , c’est-à-dire la loi de Poisson P(4λ) d’après la question 2.4. Par conséquent, E[X] = 5 E[N8 − N4 ] = 5 × 4λ = 5 × 4 × 5 = 100min = 1h40. De même, Var(X) = Var[5(N8 − N4 )] = 25 Var(N8 − N4 ) = 25 × 4λ = 25 × 4 × 5 = 500min2 et donc √ σ(X) = 10 5 ' 22, 86min. 5. Simulation. On va dans cette question simuler (heures d’arrivée, nombre de clients) l’entrée des clients dans un magasin. 5.1 Déterminons la fonction de répartition de T = − λ1 ln(1−U ) lorsque U est uniforme sur ]0, 1]. Pour t ∈ R, 1 FT (t) = P (T 6 t) = P − ln(1 − U ) 6 t = P (ln(1 − U ) 6 λt) . λ On applique la fonction exponentielle, qui est une bijection strictement croissante de R sur R∗+ : FT (t) = P 1 − U 6 e−λt = P U > 1 − e−λt = FU 1 − e−λt avec la fonction de répartition de U qui est donnée par ∀u ∈ uR, 0 si u 6 0 FU (u) = u si 0 < u 6 1 1 si u > 1. 1er cas : t 6 0. Alors 1 − e−λt 6 0 et donc FT (t) = 0. 2ème cas : t > 0. Alors 1 − e−λt ∈]0, 1[ et donc FT (t) = 1 − e−λt . On reconnaît la fonction de répartition de la loi exponentielle de paramètre λ : T ∼ E(λ). 5.2 Les 1600 réalisation de la variable aléatoire U suivant la loi U([0, 1]) se fait par autant d’appels à la fonction ALEA() du tableur, que l’on recopie donc telle quelle dans les cellules A3 : AN 42 à l’aide d’un copier coller géant. 5.3 En vertu de la question 5.1, il suffit pour obtenir les réalisations de T , d’appliquer à celles de U la fonction u 7→ − λ1 ln(1 − u). Dans le tableur, cela se traduit à la première case A3 de l’onglet «Variable T» par la formule = −LN (1 −0 V ariableU 0 .A3)/ $B$1en supposant que le paramètre λ ait bien été introduit dans la cellule B1. Cette formule est alors recopiée dans les autres cellules. 7 Année 2008-2009 Mathématiques École des Mines de Douai — FI1A Ce paramètre λ s’interprète alors simplement comme l’inverse de la moyenne des durées séparant l’entrée de deux clients consécutifs. 5.4 L’heure d’entrée du nème client apparaît comme la somme des intervalles de temps séparant chacun des clients précédents. On obtient donc la simulation voulue en tapant dans la cellule A3 de l’onglet «Variable S» la formule = SOM M E(0 V ariableT 0 .A$3 : A3) et en la recopiant dans les cellules suivantes de la plage. 5.5 N est déterminé à partir de S en comptant, pour chacune des colonnes intitulées S1 à S40 de l’onglet «Variable S», le nombre de valeurs inférieures à la durée d’ouverture du magasin. Celle-ci étant placée en cellule B1 de l’onglet «Variable N», ce comptage se fait à l’aide de la fonction N B.SI() du tableur : en cellule A3 on tape = N B.SI(0 V ariableS 0 .A$3 : A$42; ” <= ”&$B$1) et on recopie cette formule jusqu’en cellule AN 3. 5.6 Au vu des valeurs prises par la simulation de N , les valeurs très petites ou très grandes de k ne peuvent être qualifiées de pertinentes (même si en théorie tous les entiers naturels sont des valeurs possibles de N ). La première valeur pertinente étant par exemple choisie égale à 8 (en cellule A8), la suivante s’obtient par une fomule = A8 + 1 en cellule A9, recopiée dans les cellules en-dessous. La valeur 30 semble être un maximum pertinent. On compte à nouveau le nombre de réalisations de N prenant cette valeur à l’aide de N B.SI(). Ainsi, dans la cellule B8 : = N B.SI(A$3 : AN $3; A8) cette formule étant recopiée dans les cellules en-dessous. Enfin, les fréquences s’obtiennent en divisant cet effectif par le nombre de réalisations faites, à savoir 40, ce qui donne dans la cellule C8 (et suivantes) la formule = B8/40 L’ensemble de ces fréquences est finalement représenté sous forme d’un histogramme à l’aide de l’assistant graphique de Calc, en n’oubliant pas d’inclure des intitulés compréhensibles. En théorie on devrait trouver un graphe s’approchant de l’histogramme de la loi de Poisson. En pratique le nombre de simulations est trop faible pour que ce soit le cas à coup sûr. . . 8