Corrigé

publicité
École des Mines de Douai — FI1A Mathématiques
Année 2008-2009
Correction du DM pour le 5 mai 2009
Définition
On appelle processus de Poisson d’intensité λ la donnée d’une famille (Nt )t∈R+
de variables aléatoires toutes à valeurs dans N et vérifiant les conditions suivantes :
(1) pour toute famille strictement croissante (t0 , t1 , . . . , tn ) de réels, les variables aléatoires
(Nt1 − Nt0 ), (Nt2 − Nt1 ), . . . , (Ntn − Ntn−1 )
sont mutuellement indépendantes ;
(2) pour tout k ∈ N, tout t ∈ R+ et tout h > 0, le nombre
Nt+h − Nt
ne dépend pas de t mais seulement de h ;
(3) pour tout t ∈ R+ ,
P (Nt+h − Nt > 1) = λh + o(h)
;
(4) pour tout t ∈ R+ ,
P (Nt+h − Nt > 2) = o(h).
1. Interprétation des hypothèses. On suppose que Nt est la variable aléatoire qui
indique le nombre d’occurrences d’un événement donné (entrée d’un client dans une boutique, par exemple) dans l’intervalle de temps [0, t].
1.1 La première hypothèse signifie que les nombres d’occurrences dans des intervalles
de temps disjoints sont mutuellement indépendants.
1.2 Pour un intervalle de temps très court, la probabilité qu’exactement un événement
survienne est quasiment proportionnelle à la longueur de l’intervalle. La probabilité d’au
moins deux occurrences est négligeable.
1.3 En remarquant que l’événement contraire de {Nt+h − Nt = 0} est {Nt+h − Nt > 1},
on a
P (Nt+h − Nt = 0) = 1 − P (Nt+h − Nt > 1) = 1 − [λh + o(h)] = 1 − λh + o(h).
2. Loi de Nt . On se donne un processus de Poisson (Nt )t>0 d’intensité λ.
2.1 On pose f0 (t) = P (Nt = 0) ; soient t > 0 et h > 0. Comme N0 = 0, Nt+h compte
le nombre d’occurrences de l’événement attendu entre les dates 0 et t + h. Ce nombre est
nul si et seulement si Nt − N0 et Nt+h − Nt = 0 : les nombres d’occurences entre les dates
0 et t et entre t et t + h doivent être nuls.
Une autre façon de le dire consiste à écrire que Nt+h = (Nt −N0 )+(Nt+h −Nt ) sachant
que les deux termes entre parenthèses sont des entiers naturels. On a donc
{Nt+h = 0} = {Nt − N0 = 0} ∩ {Nt+h − Nt = 0}.
Par conséquent,
f0 (t + h) = P ({Nt − N0 = 0} ∩ {Nt+h − Nt = 0}) = P (Nt − N0 = 0)P (Nt+h − Nt = 0),
1
Année 2008-2009
Mathématiques École des Mines de Douai — FI1A
la dernière égalité ayant lieu d’après l’hypothèse d’indépendance (1) de la définition d’un
processus de Poisson. On a donc, en tenant compte de la question 1.3 :
f0 (t + h) = f0 (t)P (Nt+h − Nt = 0) = f0 (t) [1 − λh + o(h)]
soit encore, t étant fixé,
f0 (t + h) = f0 (t) − λf0 (t)h + o(h).
On reconnaît là une approximation linéaire affine de la fonction f0 au point t, c’est-àdire un développement limité d’ordre 1 en t, qui montre que f0 est dérivable en t et
f00 (t) = −λf0 (t).
Comme ceci est vrai quel que soit t ∈ R∗+ et que f0 (0) = P (N0 = 0) = 1, on en déduit
que f0 est solution du problème de Cauchy
(
y 0 = −λy
y(0) = 1.
L’équation différentielle y 0 = −λy est une équation différentielle linéaire homogène du
premier ordre à coefficient constant, et l’unique solution bien connue de ce problème de
Cauchy est
P (Nt = 0) = f0 (t) = e−λt .
2.2 Pour tout t > 0 et tout k ∈ N, on pose
fk (t) = P (Nt = k).
On a toujours Nt+h = (Nt − N0 ) + (Nt+h − Nt ), les deux termes entre parenthèses étant
des entiers naturels. Si on note ` la valeur prise par Nt+h − Nt , l’événement {Nt+h = k}
sera satisfait si et seulement si Nt − N0 prend la valeur k − `. Pour que ` et k − ` soient
bien des entiers naturels, il faut et il suffit que ` ∈ {0, . . . , k}. Par conséquent,
{Nt+h = k} =
k
[
({Nt − N0 = k − `} ∩ {Nt+h − Nt = `}) .
`=0
On peut remarquer que les événements délimités par les parenthèses dans l’expression
ci-dessus sont deux à deux incompatibles. Autrement dit, cette écriture est une partition
de l’événement {Nt+h = k}. On a donc
fk (t + h) = P (Nt+h = k) =
k
X
P ({Nt − N0 = k − `} ∩ {Nt+h − Nt = `})
`=0
=
k
X
P (Nt − N0 = k − `)P (Nt+h − Nt = `) en vertu de (1).
`=0
Supposons k > 1 et isolons les deux premiers termes de cette somme :
fk (t + h) = P (Nt = k)P (Nt+h − Nt = 0) + P (Nt = k − 1)P (Nt+h − Nt = 1)
+
k
X
`=2
2
P (Nt = k − `)P (Nt+h − Nt = `).
École des Mines de Douai — FI1A Mathématiques
Année 2008-2009
Or on sait que







∀` > 2,
P (Nt+h − Nt = 0) = 1 − λh + o(h)
P (Nt+h − Nt = 1) = λh + o(h)
P (Nt+h − Nt = `) 6 P (Nt+h − Nt > 2) = o(h).
Par conséquent, l’expression précédente devient
fk (t + h) = fk (t) [1 − λh + o(h)] + fk−1 (t) [λh + o(h)] + o(h)
k
X
fk−` (t)
`=2
d’où l’on tire
k
X
fk (t + h) − fk (t)
= fk (t) [−λ + o(1)] + fk−1 (t) [λ + o(1)] + o(1)
fk−` (t).
h
`=2
Ceci étant vrai, à t fixé, quel que soit h > 0, passons à la limite lorsque h → 0 :
fk0 (t) = −λfk (t) + λfk−1 (t).
D’autre part, fk (0) = P (N0 = k) = P (∅) = 0 puisque k > 1 et que {N0 = 0} est
l’événement certain.
Finalement, on en déduit que la fonction fk est solution du problème de Cauchy
(
y 0 = −λy + λfk−1 (t)
y(0) = 0
dans lequel l’équation différentielle est linéaire du premier ordre à coefficient constant.
2.3 Pour calculer f1 , utilisons le fait que cette fonction f1 est solution du problème de
Cauchy précédent, dans lequel intervient la fonction f0 calculée à la question 2.1 :
(
y 0 = −λy + λe−λt
y(0) = 0
(E1 )
L’équation homogène y 0 = −λy a pour solution générale y(t) = C e−λt où C ∈ R. Si
l’on cherche une solution de (E1 ) sous la forme y(t) = (a t + b)e−λt (avec a, b ∈ R), on a
y 0 (t) = (−aλt + a − λb)e−λt et donc
y
solution de (E1 ) ⇐⇒ e−λt (−aλt + a − λb) = λe−λt (−a t − b + 1)
⇐⇒ a = λ.
Les solutions de (E1 ) sont donc les fonctions y définies par y(t) = (λt + C)e−λt où C est
un réel arbitraire, que l’on détermine par la condition initiale : C = y(0).
De tout ceci on tire que la fonction f1 est donnée par
f1 (t) = λt e−λt .
De même, f2 est la solution du problème de Cauchy suivant :
(
y 0 = −λy + λ2 t e−λt
y(0) = 0.
(E2 )
3
Année 2008-2009
Mathématiques École des Mines de Douai — FI1A
Les solutions homogènes de (E2 ) étant toujours les fonctions y définies par y(t) = C e−λt
où C ∈ R, cherchons une solution particulière de (E2 ) sous la forme y(t) = (at2 +bt+c)e−λt
avec a, b, c ∈ R. On a alors y 0 (t) = e−λt [−aλt2 + (2a − λb)t + (b − λc)], de sorte que
y
h
i
h
solution de (E2 ) ⇐⇒ e−λt −aλt2 + (2a − λb)t + (b − λc) = λe−λt −at2 + (λ − b)t − c
2a − λb = λ2 − λb
b − λc = −λc
λ2
⇐⇒ a =
et b = 0.
2
(
⇐⇒
(par identification des polynômes)
2
Les solutions de (E2 ) sont donc les fonctions y définies par y(t) = y2 t2 + C e−λt où C
est un réel arbitraire, que l’on détermine par la condition initiale : C = y(0).
De tout ceci on tire que la fonction f2 est donnée par
λ2 t2 −λt
e .
2
f2 (t) =
Plus généralement, on conjecture que
∀k ∈ N, ∀t ∈ R∗+ ,
fk (t) =
λk tk −λt
e .
k!
Vérifions cette formule à l’aide d’un raisonnement par récurrence sur l’entier k. On a
déjà vérifié cette assertion pour k ∈ {0, 1, 2}. Supposons-la vraie pour un k ∈ N fixé. On
a alors
λk tk −λt
∗
e .
∀t ∈ R+ , fk (t) =
k!
On sait d’autre part, d’après la question précédente, que fk+1 est solution du problème
de Cauchy
(
y 0 = −λy + λfk (t)
y(0) = 0
soit





y 0 = −λy + λk+1
tk −λt
e
k!
(Ek+1 )
y(0) = 0.
Comme l’équation (Ek+1 ) est une équation différentielle linéaire du premier ordre (à coefficient constant), le théorème de Cauchy linéaire assure l’existence et l’unicité d’une
solution maximale à ce problème de Cauchy. Ainsi, pour prouver l’assertion concernant
la fonction fk+1 il suffit de vérifier que la fonction
g : t7−−−→
λk+1 tk+1 −λt
e
(k + 1)!
est elle-même solution de ce problème de Cauchy. Via l’unicité, on aura fk+1 = g. Calculons :
(k + 1)λk+1 tk
λk+1 tk+1 −λt
λk tk −λt
g (t) =
−λ
e
=λ
e − λfk+1 (t)
(k + 1)!
(k + 1)!
k!
= λfk (t) − λfk+1 (t).
!
0
4
i
École des Mines de Douai — FI1A Mathématiques
Année 2008-2009
Ceci montre que la fonction g est bien solution de (Ek+1 ). En outre elle vérifie bien g(0) = 0
donc elle est solution du problème de Cauchy, ce qui montre bien ce qu’on voulait.
Finalement, pour tout entier naturel k et tout réel t > 0,
fk (t) = e−λt
(λt)k
.
k!
2.4 La formule précédente s’écrit
∀k ∈ N,
P (Nt = k) = e
k
−λt (λt)
k!
.
On y reconnait la définition de la loi de Poisson de paramètre λt : Nt ∼ P(λt).
En particulier, E[Nt ] = λt et Var(Nt ) = λ2 t2 .
3. Loi du temps d’attente. Soit à nouveau (Nt )t>0 un processus de Poisson d’intensité
λ. Pour tout n ∈ N∗ , on note Tn la variable aléatoire égale au plus petit indice t pour
lequel Nt = n. Autrement dit, si le processus de Poisson correspond au comptage d’occurrences d’un événement particulier, Tn représente l’instant auquel la nème occurrence de
cet événement survient.
3.1 On a tout simplement
{T1 > t} = {Nt = 0}
car réaliser {T1 > t} signifie que la première occurrence intervient à une date supérieure
à t, c’est équivalent à dire que le nombre d’occurrences entre les dates 0 et t est nul.
On en déduit donc que la fonction de répartition de la variable aléatoire T1 est donnée
(pour t > 0) par
FT1 (t) = P (T1 6 t) = 1 − P (T1 > t) = 1 − P (Nt = 0) = 1 − e−λt
avec également FT1 (t) = 0 de façon triviale pour t 6 0. On reconnaît la fonction de
répartition de la loi exponentielle : T1 ∼ E(λ).
Plus généralement et de la même façon, pour n ∈ N et t > 0,
{Tn+1 − Tn > t} = {NTn +t − NTn = 0}
donc
FTn+1 −Tn (t) = P (Tn+1 − Tn 6 t) = 1 − P (Tn+1 − Tn > t) = 1 − P (NTn +t − NTn = 0).
D’après l’hypothèse (2) de la définition d’un processus de Poisson, cette probabilité est
invariante par «translation dans le temps» : P (NTn +t − NTn = 0) = P (Nt − N0 = 0). Il
reste donc
FTn+1 −Tn (t) = 1 − P (Nt − N0 = 0) = 1 − P (Nt = 0) = 1 − e−λt
avec à nouveau FTn+1 −Tn (t) = 0 si t 6 0.
La variable aléatoire Tn+1 − Tn , qui désigne le temps d’attente entre deux occurrences
consécutives, suit donc toujours la loi exponentielle E(λ).
3.2 Pour t > 0, on a de la même façon que précédemment :
{Tn > t} = {Nt 6 n − 1} =
n−1
[
{Nt = k}.
k=0
5
Année 2008-2009
Mathématiques École des Mines de Douai — FI1A
Comme cette dernière réunion est formée d’événement deux à deux incompatibles, on a
FTn (t) = 1 −
n−1
X
P (Nt = k) = 1 −
k=0
= 1 − e−λt
n−1
X
λk tk −λt
e
k=0 k!
n−1
X
λk tk
.
k=0 k!
Dérivons cette expression pour obtenir la densité de Tn :
fTn (t) = FT0 n (t) = λe−λt
n−1
X
n−1
X λk k tk−1
λk tk
− e−λt
k!
k=0 k!
k=1
(en effet, dans la seconde, somme le terme obtenu à k = 0 est nul)
fTn (t) = e
−λt
"n−1
X
X λk tk−1
λk+1 tk n−1
−
.
k!
k=0
k=1 (k − 1)!
#
On effectue un décalage d’indice dans la seconde somme :
fTn (t) = e
−λt
"n−1
X
X λk+1 tk
λk+1 tk n−2
−
.
k!
k!
k=0
k=0
#
Tous les termes pour lesquels k < n − 1 se simplifient. Il reste :
fTn (t) = λe−λt
(λt)n−1
λn−1 tn−1
= λe−λt
.
(n − 1)!
Γ(n)
On en déduit donc que la variable aléatoire Tn suit la loi Γ de paramètres (n, λ).
4. Application. On considère un magasin de vente de chaussures ouvert de 10h à 18h
dans lequel le comptage des clients correspond à un processus de Poisson d’intensité λ
constante : à chaque instant t (en heures), Nt désigne le nombre de clients entrés depuis
le début de la journée.
4.1 On suppose ici que E[Tn+1 − Tn ], moyenne théorique de l’intervalle de temps
séparant l’entrée de deux clients, vaut 12min, soit, exprimé en heures, 51 . D’après l’étude
précédente, Tn+1 − Tn suit la loi E(λ) dont l’espérance vaut λ1 .
Par conséquent, λ = 5.
4.2 Avec les notations du problème, on cherche
1
1
1
P T2 − T1 >
= 1 − P T2 − T1 6
= 1 − FT2 −T1
.
12
12
12
Comme la variable aléatoire suit la loi E(λ) d’après la question 3.1, on a FT2 −T1 (t) =
1 − e−λt pour t > 0. Ainsi,
P T2 − T1 >
5
5
1
= 1 − 1 − e− 12 = e− 12 ' 0, 66.
12
4.3 Par définition, le nombre de clients «vus» par la vendeuse est N8 − N4 et le temps
qu’elle passe à les servir est donc X = 5(N8 − N4 ) (exprimé en minutes).
6
École des Mines de Douai — FI1A Mathématiques
Année 2008-2009
D’après l’hypothèse (2) de la définition du processus de Poisson, la loi de N8 − N4
est la même que celle de N4 − N0 = N4 , c’est-à-dire la loi de Poisson P(4λ) d’après la
question 2.4. Par conséquent,
E[X] = 5 E[N8 − N4 ] = 5 × 4λ = 5 × 4 × 5 = 100min = 1h40.
De même,
Var(X) = Var[5(N8 − N4 )] = 25 Var(N8 − N4 ) = 25 × 4λ = 25 × 4 × 5 = 500min2
et donc
√
σ(X) = 10 5 ' 22, 86min.
5. Simulation. On va dans cette question simuler (heures d’arrivée, nombre de clients)
l’entrée des clients dans un magasin.
5.1 Déterminons la fonction de répartition de T = − λ1 ln(1−U ) lorsque U est uniforme
sur ]0, 1]. Pour t ∈ R,
1
FT (t) = P (T 6 t) = P − ln(1 − U ) 6 t = P (ln(1 − U ) 6 λt) .
λ
On applique la fonction exponentielle, qui est une bijection strictement croissante de R
sur R∗+ :
FT (t) = P 1 − U 6 e−λt = P U > 1 − e−λt = FU 1 − e−λt
avec la fonction de répartition de U qui est donnée par
∀u ∈ uR,



0
si u 6 0
FU (u) = u si 0 < u 6 1



1 si u > 1.
1er cas : t 6 0. Alors 1 − e−λt 6 0 et donc FT (t) = 0.
2ème cas : t > 0. Alors 1 − e−λt ∈]0, 1[ et donc FT (t) = 1 − e−λt .
On reconnaît la fonction de répartition de la loi exponentielle de paramètre λ : T ∼
E(λ).
5.2 Les 1600 réalisation de la variable aléatoire U suivant la loi U([0, 1]) se fait par
autant d’appels à la fonction ALEA() du tableur, que l’on recopie donc telle quelle dans
les cellules A3 : AN 42 à l’aide d’un copier coller géant.
5.3 En vertu de la question 5.1, il suffit pour obtenir les réalisations de T , d’appliquer
à celles de U la fonction u 7→ − λ1 ln(1 − u).
Dans le tableur, cela se traduit à la première case A3 de l’onglet «Variable T» par la
formule
= −LN (1 −0 V ariableU 0 .A3)/
$B$1en supposant que le paramètre λ ait bien été introduit dans la cellule B1. Cette
formule est alors recopiée dans les autres cellules.
7
Année 2008-2009
Mathématiques École des Mines de Douai — FI1A
Ce paramètre λ s’interprète alors simplement comme l’inverse de la moyenne des durées
séparant l’entrée de deux clients consécutifs.
5.4 L’heure d’entrée du nème client apparaît comme la somme des intervalles de temps
séparant chacun des clients précédents. On obtient donc la simulation voulue en tapant
dans la cellule A3 de l’onglet «Variable S» la formule
= SOM M E(0 V ariableT 0 .A$3 : A3)
et en la recopiant dans les cellules suivantes de la plage.
5.5 N est déterminé à partir de S en comptant, pour chacune des colonnes intitulées
S1 à S40 de l’onglet «Variable S», le nombre de valeurs inférieures à la durée d’ouverture
du magasin. Celle-ci étant placée en cellule B1 de l’onglet «Variable N», ce comptage se
fait à l’aide de la fonction N B.SI() du tableur : en cellule A3 on tape
= N B.SI(0 V ariableS 0 .A$3 : A$42; ” <= ”&$B$1)
et on recopie cette formule jusqu’en cellule AN 3.
5.6 Au vu des valeurs prises par la simulation de N , les valeurs très petites ou très
grandes de k ne peuvent être qualifiées de pertinentes (même si en théorie tous les entiers
naturels sont des valeurs possibles de N ). La première valeur pertinente étant par exemple
choisie égale à 8 (en cellule A8), la suivante s’obtient par une fomule = A8 + 1 en cellule
A9, recopiée dans les cellules en-dessous. La valeur 30 semble être un maximum pertinent.
On compte à nouveau le nombre de réalisations de N prenant cette valeur à l’aide de
N B.SI(). Ainsi, dans la cellule B8 :
= N B.SI(A$3 : AN $3; A8)
cette formule étant recopiée dans les cellules en-dessous. Enfin, les fréquences s’obtiennent
en divisant cet effectif par le nombre de réalisations faites, à savoir 40, ce qui donne dans
la cellule C8 (et suivantes) la formule
= B8/40
L’ensemble de ces fréquences est finalement représenté sous forme d’un histogramme
à l’aide de l’assistant graphique de Calc, en n’oubliant pas d’inclure des intitulés compréhensibles.
En théorie on devrait trouver un graphe s’approchant de l’histogramme de la loi de
Poisson. En pratique le nombre de simulations est trop faible pour que ce soit le cas à
coup sûr. . .
8
Téléchargement