Rappels sur les probabilités, les processus aléatoires et les chaînes

publicité
Rappels sur les probabilités, les processus aléatoires et
les chaînes de Markov
Amélie Lambert
Cnam
MPRO 2016-2017
Amélie Lambert (Cnam)
MPRO 2016-2017
1 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
2 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
3 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
4 / 91
Quelques rappels
Lors d’une expérience aléatoire, c’est-à-dire soumise au hasard, on définit :
L’univers Ω qui est l’ensemble de tous les résultats possibles de
l’expérience aléatoire.
Un événement E qui est un ensemble de résultats possibles à
l’intérieur de l’univers.
Le dénombrement d’un événement qui est le calcul du nombre de
cas où l’événement considéré peut se produire.
La probabilité d’un évènement P qui correspond à la fréquence
d’un événement par rapport à l’ensemble des cas possibles.
(nombre de cas où l’évènement considéré peut se produire sur le
nombre total de cas)
Amélie Lambert (Cnam)
MPRO 2016-2017
5 / 91
Quelques exemples
Amélie Lambert (Cnam)
MPRO 2016-2017
6 / 91
Exemple 1
Soit une classe composée de 2 groupes :
Filles
Garçons
Total
Groupe 1
3
25
28
Groupe 2
10
19
29
Total
13
44
57
Expérience aléatoire : Tirer au hasard 2 étudiants.
Question : Quelle est la probabilité de l’évènement E : { tirages avec 1
étudiant (e) de chaque genre et 1 étudiant (e) de chaque groupe } ?
Amélie Lambert (Cnam)
MPRO 2016-2017
7 / 91
Exemple 1 : solution
E = H ∪ I , où H ={la fille tirée est du groupe 1 } et I ={la fille tirée est
du groupe 2 }
Amélie Lambert (Cnam)
MPRO 2016-2017
8 / 91
Exemple 1 : solution
E = H ∪ I , où H ={la fille tirée est du groupe 1 } et I ={la fille tirée est
du groupe 2 }
Il y a deux ordres possibles (fille en premier ou garçon en premier) :
Ordre 1 : Le nombre d’évènements qui commencent avec la fille en
premier est 3 ∗ 19 = 357 dans H et 10 ∗ 25 = 250 dans I .
Ordre 2 : Le nombre d’évènements qui commencent avec le garçon en
premier est 19 ∗ 3 = 357 dans H et 25 ∗ 10 = 250 dans I .
Amélie Lambert (Cnam)
MPRO 2016-2017
8 / 91
Exemple 1 : solution
E = H ∪ I , où H ={la fille tirée est du groupe 1 } et I ={la fille tirée est
du groupe 2 }
Il y a deux ordres possibles (fille en premier ou garçon en premier) :
Ordre 1 : Le nombre d’évènements qui commencent avec la fille en
premier est 3 ∗ 19 = 357 dans H et 10 ∗ 25 = 250 dans I .
Ordre 2 : Le nombre d’évènements qui commencent avec le garçon en
premier est 19 ∗ 3 = 357 dans H et 25 ∗ 10 = 250 dans I .
cardE = cardH + cardI = 2 ∗ 357 + 2 ∗ 250 = 1214
P(E ) =
Amélie Lambert (Cnam)
nombres de cas favorables
nombres de cas possibles
=
1214
56∗57
=
1214
3192
= 0.38
MPRO 2016-2017
8 / 91
Exemple 2
Filles
Garçons
Total
Groupe 1
3
25
28
Groupe 2
10
19
29
Total
13
44
57
Expérience aléatoire : Tirer au hasard 3 étudiants.
Question : Quelle est la probabilité de l’évènement E = { tirages avec
exactement 1 fille et exactement 1 étudiant(e) du groupe 1 } ?
Amélie Lambert (Cnam)
MPRO 2016-2017
9 / 91
Exemple 2 : solution (1/3)
Soient :
E = { tirages avec exactement 1 fille et exactement 1 étudiant(e) du
groupe 1 }
H est le sous-ensemble de E formé des tirages dans lesquels la fille est
du groupe 1.
I est le sous-ensemble de E formé des tirages dans lesquels la fille est
du groupe 2.
Amélie Lambert (Cnam)
MPRO 2016-2017
10 / 91
Exemple 2 : solution (2/3)
Former un élément de H : sous-ensemble de E formé des
tirages dans lesquels la fille est du groupe 1.
1
2
3
4
Choisir d’abord la fille dans le groupe 1
Choisir un garçon dans le groupe 2
Choisir un autre garçon (distinct du premier) dans le groupe 2
Choisir l’ordre dans lequel ils vont sortir (il y en a autant que de
permutations de 3 personnes, soit 6)
Amélie Lambert (Cnam)
MPRO 2016-2017
11 / 91
Exemple 2 : solution (2/3)
Former un élément de H : sous-ensemble de E formé des
tirages dans lesquels la fille est du groupe 1.
1
2
3
4
Choisir d’abord la fille dans le groupe 1
Choisir un garçon dans le groupe 2
Choisir un autre garçon (distinct du premier) dans le groupe 2
Choisir l’ordre dans lequel ils vont sortir (il y en a autant que de
permutations de 3 personnes, soit 6)
Former un élément de I : sous-ensemble de E formé des tirages
dans lesquels la fille est du groupe 2.
1
2
3
4
Choisir d’abord la fille dans le groupe 2
Choisir un garçon dans le groupe 1
Choisir un garçon dans le groupe 2
Choisir l’ordre dans lequel ils vont sortir (il y en a autant que de
permutations de 3 personnes, soit 6)
Amélie Lambert (Cnam)
MPRO 2016-2017
11 / 91
Exemple 2 : solution (3/3)
Donc
cardH = 3 ∗ 19 ∗ 18 ∗ 6 = 6156
cardI = 10 ∗ 25 ∗ 19 ∗ 6 = 28500
Amélie Lambert (Cnam)
MPRO 2016-2017
12 / 91
Exemple 2 : solution (3/3)
Donc
cardH = 3 ∗ 19 ∗ 18 ∗ 6 = 6156
cardI = 10 ∗ 25 ∗ 19 ∗ 6 = 28500
Comme H et I sont disjoints et E = H ∪ I ,
cardE = cardH + cardI = 6156 + 28500 = 34656
Amélie Lambert (Cnam)
MPRO 2016-2017
12 / 91
Exemple 2 : solution (3/3)
Donc
cardH = 3 ∗ 19 ∗ 18 ∗ 6 = 6156
cardI = 10 ∗ 25 ∗ 19 ∗ 6 = 28500
Comme H et I sont disjoints et E = H ∪ I ,
cardE = cardH + cardI = 6156 + 28500 = 34656
D’où
P(E ) =
nombres de cas favorables
34656
34656
=
=
= 0.197
nombres de cas possibles
57 ∗ 56 ∗ 55
175560
Amélie Lambert (Cnam)
MPRO 2016-2017
12 / 91
Techniques de dénombrement
Amélie Lambert (Cnam)
MPRO 2016-2017
13 / 91
Les arbres
Exemple : On considère une urne qui contient deux boules rouges, deux
noires et une verte. On tire deux boules sans remise.
Expérience à deux étapes où les différentes possibilités qui peuvent survenir
sont représentées par un arbre horizontal :
Problème : trop complexe si trop de possibilités !
Amélie Lambert (Cnam)
MPRO 2016-2017
14 / 91
Les arrangements
Définition : Une disposition ordonnée de r objets distincts pris parmi n est
appelée arrangement de r objets pris parmi n (on a obligatoirement r ≤ n).
Considérons les r positions comme fixées. Pour la première étape, on a n
choix possibles, pour la deuxième, n − 1 choix possibles, . . ., pour la r ème ,
n − r + 1 choix possibles.
Proposition : Un arrangement de r objets pris parmi n, noté Anr est :
Anr = n(n − 1)(n − 2) . . . (n − r + 1) =
Amélie Lambert (Cnam)
n!
(n − r )!
MPRO 2016-2017
15 / 91
Les permutations
Définition : Une permutation de n éléments est une disposition ordonnée
de ces n éléments.
Proposition : Les permutations de n éléments sont au nombre de Ann = n!
Amélie Lambert (Cnam)
MPRO 2016-2017
16 / 91
Les combinaisons
Définition : Un choix de r objets distincts pris parmi n sans tenir compte
de leur ordre est appelé combinaison de r objets pris parmi n.
Exemple : Si on prend l’ensemble des combinaisons de 2 lettres parmi 4
lettres {a, b, c, d } :
La combinaison {a, b} qui est la même que la combinaison {b, a}
L’arrangement {a, b} est différent de l’arrangement {b, a}.
Amélie Lambert (Cnam)
MPRO 2016-2017
17 / 91
Les combinaisons
Le nombre total de combinaisons de r objets pris parmi n est noté Crn .
Pour trouver l’expression de Crn , comparons le nombre d’arrangements et
de combinaisons possibles de r objets pris parmi n.
Dans un arrangement on choisit r objets, puis on tient compte de leur
ordre.
Dans une combinaison seul le choix des r objets compte. Comme le
nombre de façons d’ordonner les r objets choisis est r !, on conclut
qu’à chaque combinaison de r objets pris parmi n, on peut associer r !
arrangements et donc qu’il y a r ! fois plus d’arrangements que de
combinaisons.
Proposition : Une combinaison de r objets pris parmi n est :
Crn =
Anr
n(n − 1)(n − 2) . . . (n − r + 1)
n!
=
=
r!
r!
r !(n − r )!
Amélie Lambert (Cnam)
MPRO 2016-2017
18 / 91
Exemple 1 (rappel)
Soit une classe composée de 2 groupes :
Filles
Garçons
Total
Groupe 1
3
25
28
Groupe 2
10
19
29
Total
13
44
57
Expérience aléatoire : Tirer au hasard 2 étudiants.
Question : Quelle est la probabilité de l’évènement E : { tirages avec 1
étudiant (e) de chaque genre et 1 étudiant (e) de chaque groupe } ?
Amélie Lambert (Cnam)
MPRO 2016-2017
19 / 91
Solution de l’exemple 1 par les arrangements (1/2)
Les arrangements cherchés sont de la forme A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1) avec :
Amélie Lambert (Cnam)
MPRO 2016-2017
20 / 91
Solution de l’exemple 1 par les arrangements (1/2)
Les arrangements cherchés sont de la forme A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1) avec :
cardA = A31 A19
1 = 3 ∗ 19 = 357
Amélie Lambert (Cnam)
MPRO 2016-2017
20 / 91
Solution de l’exemple 1 par les arrangements (1/2)
Les arrangements cherchés sont de la forme A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1) avec :
cardA = A31 A19
1 = 3 ∗ 19 = 357
25
cardB = A10
1 A1 = 10 ∗ 25 = 250
Amélie Lambert (Cnam)
MPRO 2016-2017
20 / 91
Solution de l’exemple 1 par les arrangements (1/2)
Les arrangements cherchés sont de la forme A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1) avec :
cardA = A31 A19
1 = 3 ∗ 19 = 357
25
cardB = A10
1 A1 = 10 ∗ 25 = 250
10
cardC = A25
1 A1 = 25 ∗ 10 = 250
Amélie Lambert (Cnam)
MPRO 2016-2017
20 / 91
Solution de l’exemple 1 par les arrangements (1/2)
Les arrangements cherchés sont de la forme A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1) avec :
cardA = A31 A19
1 = 3 ∗ 19 = 357
25
cardB = A10
1 A1 = 10 ∗ 25 = 250
10
cardC = A25
1 A1 = 25 ∗ 10 = 250
3
cardD = A19
1 A1 = 19 ∗ 3 = 357
Amélie Lambert (Cnam)
MPRO 2016-2017
20 / 91
Solution de l’exemple 1 par les arrangements (2/2)
On a E = A ∪ B ∪ C ∪ D
Amélie Lambert (Cnam)
MPRO 2016-2017
21 / 91
Solution de l’exemple 1 par les arrangements (2/2)
On a E = A ∪ B ∪ C ∪ D
D’où
cardE = cardA + cardB + cardC + cardD = 357 + 250 + 250 + 357 = 1214
Amélie Lambert (Cnam)
MPRO 2016-2017
21 / 91
Solution de l’exemple 1 par les arrangements (2/2)
On a E = A ∪ B ∪ C ∪ D
D’où
cardE = cardA + cardB + cardC + cardD = 357 + 250 + 250 + 357 = 1214
La probabilité de tirer 1 étudiant (e) de chaque genre et 1 étudiant (e) de
chaque groupe vaut :
P(E ) =
Amélie Lambert (Cnam)
nombres de cas favorables
1214
=
= 0.38
nombres de cas possibles
3192
MPRO 2016-2017
21 / 91
Probabilités sur un ensemble fini
Amélie Lambert (Cnam)
MPRO 2016-2017
22 / 91
Probabilités sur un ensemble fini
Définition : Si l’univers Ω est constitué de n événements élémentaires {ei }
(événements n’ayant qu’un élément), une mesure de probabilité P sur Ω
consiste à se donner n nombres P(ei ) = pi ∈ [0, 1], les probabilités des
événements élémentaires, tels que :
n
X
pi = 1
i=1
Si l’événement A est la réunion disjointe de k événements élémentaires
{ei }, avec 0 < k < n, la probabilité de A vaut, par définition :
P(A) = P(∪ki=1 ei ) =
k
k
X
X
P(ei ) =
pi
i=1
Amélie Lambert (Cnam)
i=1
MPRO 2016-2017
23 / 91
Probabilité uniforme
Définition : Il y a probabilité uniforme ou équiprobabilité lorsque tous les
pi valent n1 .
La probabilité d’un sous-ensemble A de k éléments vaut alors :
P(A) =
Amélie Lambert (Cnam)
card(A)
k
=
n
card(Ω)
MPRO 2016-2017
24 / 91
Propriétés des probabilités d’un événement aléatoire
Propriété 1 : On appelle ∅ l’événement impossible, puisqu’il n’est jamais
réalisé. Sa probabilité P(∅) vaut 0.
Amélie Lambert (Cnam)
MPRO 2016-2017
25 / 91
Propriétés des probabilités d’un événement aléatoire
Propriété 1 : On appelle ∅ l’événement impossible, puisqu’il n’est jamais
réalisé. Sa probabilité P(∅) vaut 0.
Propriété 2 : On note Ā l’événement contraire de A. C’est le
complémentaire de A dans Ω. Sa probabilité vaut P(Ā) = 1 − P(A).
Amélie Lambert (Cnam)
MPRO 2016-2017
25 / 91
Propriétés des probabilités d’un événement aléatoire
Propriété 1 : On appelle ∅ l’événement impossible, puisqu’il n’est jamais
réalisé. Sa probabilité P(∅) vaut 0.
Propriété 2 : On note Ā l’événement contraire de A. C’est le
complémentaire de A dans Ω. Sa probabilité vaut P(Ā) = 1 − P(A).
Propriété 3 : Si B est un sous-ensemble de A (i.e. B ⊆ A), on a :
P(B) ≤ P(A)
Amélie Lambert (Cnam)
MPRO 2016-2017
25 / 91
Propriétés des probabilités d’un événement aléatoire
Propriété 1 : On appelle ∅ l’événement impossible, puisqu’il n’est jamais
réalisé. Sa probabilité P(∅) vaut 0.
Propriété 2 : On note Ā l’événement contraire de A. C’est le
complémentaire de A dans Ω. Sa probabilité vaut P(Ā) = 1 − P(A).
Propriété 3 : Si B est un sous-ensemble de A (i.e. B ⊆ A), on a :
P(B) ≤ P(A)
Propriété 4 (Théorème des probabilités totales :) Si A et B sont deux
sous-ensembles de Ω, on a :
P(A ∪ B) = P(A) + P(B) − P(A ∩ B)
Ainsi, si A et B sont disjoints, i.e., si leur intersection A ∩ B est vide, alors
P(A ∪ B) = P(A) + P(B).
Amélie Lambert (Cnam)
MPRO 2016-2017
25 / 91
Événements indépendants
Définition : Deux événements A et B sont indépendants si la probabilité
sur l’événement A n’est pas affectée par la probabilité de B.
Amélie Lambert (Cnam)
MPRO 2016-2017
26 / 91
Événements indépendants
Définition : Deux événements A et B sont indépendants si la probabilité
sur l’événement A n’est pas affectée par la probabilité de B.
Propriété : Si deux événements sont indépendants, la probabilité qu’ils se
réalisent tous les deux est égale au produit de leurs probabilités respectives.
On peut donc écrire :
P(A ∩ B) = P(A) ∗ P(B)
Amélie Lambert (Cnam)
MPRO 2016-2017
26 / 91
Événements indépendants
Définition : Deux événements A et B sont indépendants si la probabilité
sur l’événement A n’est pas affectée par la probabilité de B.
Propriété : Si deux événements sont indépendants, la probabilité qu’ils se
réalisent tous les deux est égale au produit de leurs probabilités respectives.
On peut donc écrire :
P(A ∩ B) = P(A) ∗ P(B)
Exemple : Les tirages avec remise sont des événements indépendants.
Amélie Lambert (Cnam)
MPRO 2016-2017
26 / 91
Evènements dépendants, probabilités conditionnelles
Définition : Deux événements A et B sont dépendants si la probabilité sur
l’événement A est affectée par la probabilité de B.
Amélie Lambert (Cnam)
MPRO 2016-2017
27 / 91
Evènements dépendants, probabilités conditionnelles
Définition : Deux événements A et B sont dépendants si la probabilité sur
l’événement A est affectée par la probabilité de B.
Définition : Soient A et B deux événements, A étant supposé de
probabilité non nulle. On appelle probabilité conditionnelle de B par
rapport à A, la probabilité de réalisation de l’événement B sachant que A
est réalisé. On la note
P(A ∩ B)
P(B|A) =
P(A)
Amélie Lambert (Cnam)
MPRO 2016-2017
27 / 91
Evènements dépendants, probabilités conditionnelles
Définition : Deux événements A et B sont dépendants si la probabilité sur
l’événement A est affectée par la probabilité de B.
Définition : Soient A et B deux événements, A étant supposé de
probabilité non nulle. On appelle probabilité conditionnelle de B par
rapport à A, la probabilité de réalisation de l’événement B sachant que A
est réalisé. On la note
P(A ∩ B)
P(B|A) =
P(A)
Théorème (probabilité composées ou règle de la multiplication) :
P(A ∩ B) = P(B|A)P(A) = P(A|B)P(B)
Amélie Lambert (Cnam)
MPRO 2016-2017
27 / 91
Evènements dépendants, probabilités conditionnelles
Définition : Deux événements A et B sont dépendants si la probabilité sur
l’événement A est affectée par la probabilité de B.
Définition : Soient A et B deux événements, A étant supposé de
probabilité non nulle. On appelle probabilité conditionnelle de B par
rapport à A, la probabilité de réalisation de l’événement B sachant que A
est réalisé. On la note
P(A ∩ B)
P(B|A) =
P(A)
Théorème (probabilité composées ou règle de la multiplication) :
P(A ∩ B) = P(B|A)P(A) = P(A|B)P(B)
Exemple : Les tirages sans remise sont des événements dépendants.
Amélie Lambert (Cnam)
MPRO 2016-2017
27 / 91
Exemple 1 (rappel)
Soit une classe composée de 2 groupes :
Filles
Garçons
Total
Groupe 1
3
25
28
Groupe 2
10
19
29
Total
13
44
57
Expérience aléatoire : Tirer au hasard 2 étudiants.
Question : Quelle est la probabilité de l’évènement E : { tirages avec 1
étudiant (e) de chaque genre et 1 étudiant (e) de chaque groupe } ?
Amélie Lambert (Cnam)
MPRO 2016-2017
28 / 91
Solution de l’exemple 1 par probabilités conditionnelles (1/2)
Soient les évènements suivants : A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1).
Amélie Lambert (Cnam)
MPRO 2016-2017
29 / 91
Solution de l’exemple 1 par probabilités conditionnelles (1/2)
Soient les évènements suivants : A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1).
La probabilité de l’événement A, c’est la probabilité de tirer en premier une
3
), multipliée par la probabilité, sachant qu’on a déjà
fille du groupe 1, ( 57
tiré une fille du groupe 1, de tirer un garçon du groupe 2, soit :
P(A) = P(F 1) ∗ P(G 2|F 1) =
Amélie Lambert (Cnam)
3
∗ P(G 2|F 1)
57
MPRO 2016-2017
29 / 91
Solution de l’exemple 1 par probabilités conditionnelles (1/2)
Soient les évènements suivants : A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1).
La probabilité de l’événement A, c’est la probabilité de tirer en premier une
3
), multipliée par la probabilité, sachant qu’on a déjà
fille du groupe 1, ( 57
tiré une fille du groupe 1, de tirer un garçon du groupe 2, soit :
P(A) = P(F 1) ∗ P(G 2|F 1) =
3
∗ P(G 2|F 1)
57
Une fois qu’on a tiré une fille du groupe 1, il reste à tirer un étudiant dans
un paquet de 56 qui compte 19 garçons du groupe 2, donc P(G 2|F 1) = 19
56 .
Il vient :
P(A) =
Amélie Lambert (Cnam)
3 19
357
∗
=
57 56
3192
MPRO 2016-2017
29 / 91
Solution de l’exemple 1 par probabilités conditionnelles (2/2)
Soient les évènements suivants : A = (F 1, G 2), B = (F 2, G 1),
C = (G 1, F 2), et D = (G 2, F 1).
Idem pour B, C et D, donc :
P(E ) =
Amélie Lambert (Cnam)
357
250
250
357
1214
+
+
+
=
= 0.38
3192 3192 3192 3192
3192
MPRO 2016-2017
30 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
31 / 91
Définition
Amélie Lambert (Cnam)
MPRO 2016-2017
32 / 91
Variables aléatoires
Exemple 3 : On jette deux fois une pièce de monnaie non truquée, et on
s’intéresse au nombre de fois que le côté "face" a été obtenu.
Pour calculer les probabilités des divers résultats, on introduira une variable
aléatoire X qui désignera le nombre de fois où le côté "face" est obtenu.
Ici, X peut prendre les valeurs 0, 1, 2.
Définition : Soit un univers Ω associé à une expérience aléatoire, sur
lequel on a défini une mesure de probabilité P et des évènements E . Une
variable aléatoire X est l’application :
(Ω, E , P) → R
ω → X (ω)
Amélie Lambert (Cnam)
MPRO 2016-2017
33 / 91
Variables aléatoires discrètes (1/2)
Définition : Une variable aléatoire discrète est une variable aléatoire qui ne
prend que des valeurs entières, en nombre fini ou dénombrable :
(Ω, E , P) → N
ω → X (ω)
On note X (Ω) = {xi , i ∈ I } l’ensemble des valeurs ordonnées prises par X .
Amélie Lambert (Cnam)
MPRO 2016-2017
34 / 91
Variables aléatoires discrètes (2/2)
On associe à chacune des valeurs possibles de la variable aléatoire la
probabilité qui lui correspond. Pour calculer la probabilité que la variable X
soit égale a xi , on cherche tous les événements élémentaires ej pour
lesquels X (ej ) = xi , et on a :
P(X = xi ) =
k
X
P({ej }) si X = xi sur les évts élémentaires e1 , . . . , ek
j=1
On appelle fonction de densité discrète f la fonction de R dans [0, 1],
qui à tout nombre
X réel xi associe f (xi ) = P(X = xi ).
On a bien sûr
f (xi ) = 1.
i
Amélie Lambert (Cnam)
MPRO 2016-2017
35 / 91
Exemple (suite)
Exemple 3 (rappel) : On jette deux fois une pièce de monnaie non
truquée, et on s’intéresse au nombre de fois que le côté "face" a été
obtenu. Pour calculer les probabilités des divers résultats, on introduira une
variable X qui désignera le nombre de "face" obtenu. X peut prendre les
valeurs 0, 1, 2.
La variable X = nombre de côtés "face" peut prendre les valeurs 0, 1, 2.
1
4
P((pile, face)) = 12
P((face, face)) = 41
f (0) = P(X = 0) = P((pile, pile)) =
f (1) = P(X = 1) =
f (2) = P(X = 2) =
f (x) = 0 si x ∈
/ {0, 1, 2}
x
f (x) = P(X = x)
Amélie Lambert (Cnam)
0
1
2
1
4
1
2
1
4
total
1
MPRO 2016-2017
36 / 91
Variables aléatoires continues
Définition : Une variable aléatoire est dite continue si elle peut prendre
toutes les valeurs dans un intervalle donné (borné ou non borné). En règle
générale, toutes les variables qui résultent d’une mesure sont de type
continu.
Remarque : Pour une variable aléatoire continue, la probabilité associée à
l’évènement {X = a} est nulle, car il est impossible d’observer exactement
cette valeur. On considère alors la probabilité que la variable aléatoire X
prenne des valeurs comprises dans un intervalle [a, b] tel que P(a ≤ X ≤ b).
Amélie Lambert (Cnam)
MPRO 2016-2017
37 / 91
Fonction de répartition
Définition : La fonction de répartition d’une variable aléatoire X indique
pour chaque valeur réelle x la probabilité que X prenne une valeur au plus
égale à x. C’est la somme des probabilités des valeurs de X jusqu’à x. On
la note F :
X
∀x ∈ R, F (x) = P(X ≤ x) =
P(X = xi )
xi ≤x
La fonction de répartition est toujours croissante et comprise entre 0 et 1.
Amélie Lambert (Cnam)
MPRO 2016-2017
38 / 91
Espérance mathématique
Amélie Lambert (Cnam)
MPRO 2016-2017
39 / 91
Espérance mathématique d’une distribution de probabilité
Idée générale : Si l’on s’imagine que le nombre d’observations croît
indéfiniment, les fréquences observées vont tendre vers les probabilités
théoriques et on admet que la moyenne calculée sur un échantillon de taille
n va tendre vers une valeur limite qui sera la moyenne de l’ensemble des
valeurs de la population entière.
On appelle cette moyenne espérance mathématique de la variable
aléatoire X . C’est intuitivement la valeur que l’on s’attend à trouver, en
moyenne, si l’on répète un grand nombre de fois la même expérience
aléatoire.
Amélie Lambert (Cnam)
MPRO 2016-2017
40 / 91
Définition : Espérance mathématique (1/2)
Cas d’une variable discrète :
Soit X une variable aléatoire discrète qui prend un nombre fini de
valeurs x1 , x2 , . . . , xn et dont la loi de probabilité est
f : f (xi ) = P(X = xi ). L’espérance mathématique de X est :
E(X ) =
n
X
xi f (xi )
i=1
Si la variable aléatoire X prend un nombre dénombrable de valeurs
x1 , x2 , . . . , xn , . . ., son espérance mathématique est :
E(X ) =
∞
X
xi f (xi ) ( à condition que la série converge)
i=1
Amélie Lambert (Cnam)
MPRO 2016-2017
41 / 91
Définition : Espérance mathématique (2/2)
Cas d’une variable continue :
Si la variable aléatoire X est continue et a pour fonction de densité de
probabilité f , son espérance mathématique est :
Z
E(X ) = xf (x)dx (si la fonction x → xf (x) est intégrable sur R)
R
Amélie Lambert (Cnam)
MPRO 2016-2017
42 / 91
Propriétés de l’espérance mathématique
Les propriétés de l’espérance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω,
admettant une espérance E, alors :
Amélie Lambert (Cnam)
MPRO 2016-2017
43 / 91
Propriétés de l’espérance mathématique
Les propriétés de l’espérance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω,
admettant une espérance E, alors :
Propriété 1 E(X + Y ) = E(X ) + E(Y )
Amélie Lambert (Cnam)
MPRO 2016-2017
43 / 91
Propriétés de l’espérance mathématique
Les propriétés de l’espérance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω,
admettant une espérance E, alors :
Propriété 1 E(X + Y ) = E(X ) + E(Y )
Propriété 2 ∀a ∈ R, on a E(aX ) = aE(X )
Amélie Lambert (Cnam)
MPRO 2016-2017
43 / 91
Propriétés de l’espérance mathématique
Les propriétés de l’espérance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω,
admettant une espérance E, alors :
Propriété 1 E(X + Y ) = E(X ) + E(Y )
Propriété 2 ∀a ∈ R, on a E(aX ) = aE(X )
Propriété 3 Si X ≥ 0, alors E(X ) ≥ 0
Amélie Lambert (Cnam)
MPRO 2016-2017
43 / 91
Propriétés de l’espérance mathématique
Les propriétés de l’espérance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω,
admettant une espérance E, alors :
Propriété 1 E(X + Y ) = E(X ) + E(Y )
Propriété 2 ∀a ∈ R, on a E(aX ) = aE(X )
Propriété 3 Si X ≥ 0, alors E(X ) ≥ 0
Propriété 4 Si la variable aléatoire est constante : ∀ω, X (ω) = k,
alors E(X ) = k
Amélie Lambert (Cnam)
MPRO 2016-2017
43 / 91
Propriétés de l’espérance mathématique
Les propriétés de l’espérance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω,
admettant une espérance E, alors :
Propriété 1 E(X + Y ) = E(X ) + E(Y )
Propriété 2 ∀a ∈ R, on a E(aX ) = aE(X )
Propriété 3 Si X ≥ 0, alors E(X ) ≥ 0
Propriété 4 Si la variable aléatoire est constante : ∀ω, X (ω) = k,
alors E(X ) = k
Propriété 5 Si X et Y indépendantes, alors E(XY ) = E(X )E(Y )
Amélie Lambert (Cnam)
MPRO 2016-2017
43 / 91
Variance, écart-type et covariance
Amélie Lambert (Cnam)
MPRO 2016-2017
44 / 91
Variance d’une distribution de probabilité
Idée générale : c’est une mesure servant à caractériser la dispersion d’une
distribution. Elle indique de quelle manière la variable aléatoire se disperse
autour de sa moyenne (son espérance).
Une variance de zéro signale que toutes les valeurs sont identiques. Une
petite variance est signe que les valeurs sont proches les unes des autres
alors qu’une variance élevée est signe que celles-ci sont très écartées.
Amélie Lambert (Cnam)
MPRO 2016-2017
45 / 91
Variance d’une distribution de probabilité
Le calcul de la variance peut s’effectuer en utilisant l’expression :
Var(X ) = E((X − E(X ))2 ) = E(X 2 ) − (E(X )2 )
1
Cas d’une variable discrète finie :
Var(X ) =
n
X
(xi − E(X ))2 f (xi )
i=1
n
X
Var(X ) = ( xi2 )f (xi ) − E(X )2
i=1
2
Cas d’une variable continue :
Z
(x − E(X ))2 f (x)dx
Var(X ) =
R
Z
Var(X ) = ( x 2 f (x)dx) − E(X )2
R
Amélie Lambert (Cnam)
MPRO 2016-2017
46 / 91
Propriétés de la variance
Les propriétés de la variance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω :
Amélie Lambert (Cnam)
MPRO 2016-2017
47 / 91
Propriétés de la variance
Les propriétés de la variance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω :
Propriété 1 ∀a ∈ R, on a Var(aX ) = a2 Var(X )
Amélie Lambert (Cnam)
MPRO 2016-2017
47 / 91
Propriétés de la variance
Les propriétés de la variance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω :
Propriété 1 ∀a ∈ R, on a Var(aX ) = a2 Var(X )
Propriété 2 ∀(a, b) ∈ R2 , on a Var(aX + b) = a2 Var(X )
Amélie Lambert (Cnam)
MPRO 2016-2017
47 / 91
Propriétés de la variance
Les propriétés de la variance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω :
Propriété 1 ∀a ∈ R, on a Var(aX ) = a2 Var(X )
Propriété 2 ∀(a, b) ∈ R2 , on a Var(aX + b) = a2 Var(X )
Propriété 3 Si X et Y ind., alors Var(X + Y ) = Var(X ) + Var(Y )
Amélie Lambert (Cnam)
MPRO 2016-2017
47 / 91
Propriétés de la variance
Les propriétés de la variance valent aussi bien pour une variable aléatoire
discrète ou une variable aléatoire absolument continue.
Si X et Y sont deux variables aléatoires définies sur un même univers Ω :
Propriété 1 ∀a ∈ R, on a Var(aX ) = a2 Var(X )
Propriété 2 ∀(a, b) ∈ R2 , on a Var(aX + b) = a2 Var(X )
Propriété 3 Si X et Y ind., alors Var(X + Y ) = Var(X ) + Var(Y )
Propriété 4 Si X et Y ind., alors Var(X − Y ) = Var(X ) + Var(Y )
Amélie Lambert (Cnam)
MPRO 2016-2017
47 / 91
Écart-type
Définition : On appelle écart-type de la variable aléatoire X la racine
carrée de sa variance :
p
θ(X ) = Var(X )
Amélie Lambert (Cnam)
MPRO 2016-2017
48 / 91
Covariance de deux variables aléatoires (1/2)
Lorsque deux variables aléatoires ne sont pas indépendantes, il existe une
caractéristique qui permet de déterminer l’intensité de leur dépendance.
C’est la covariance.
Définition : La covariance de deux variables aléatoires X et Y est définie
par :
Cov(X , Y )
Cov(X , Y )
Cov(X , Y )
Cov(X , Y )
=
=
=
=
Amélie Lambert (Cnam)
E((X − E(X )(Y − E(Y ))
E(XY − X E(Y ) − Y E(X ) + E(X )E(Y ))
E(XY ) − E(X )E(Y ) − E(Y )E(X ) + E(X )E(Y )
E(XY ) − E(X )E(Y )
MPRO 2016-2017
49 / 91
Covariance de deux variables aléatoires (2/2)
Proposition 1 Si deux variables aléatoires sont indépendantes, leur
covariance est nulle.
Attention : La réciproque n’est pas vraie. Deux variables de
covariance nulle ne sont pas obligatoirement indépendantes.
Amélie Lambert (Cnam)
MPRO 2016-2017
50 / 91
Covariance de deux variables aléatoires (2/2)
Proposition 1 Si deux variables aléatoires sont indépendantes, leur
covariance est nulle.
Attention : La réciproque n’est pas vraie. Deux variables de
covariance nulle ne sont pas obligatoirement indépendantes.
Proposition 2 Si deux variables aléatoires sont dépendantes :
E(XY ) = E(X )E(Y ) + Cov(X , Y )
Var(X + Y ) = Var(X ) + Var(Y ) + 2Cov(X , Y )
Amélie Lambert (Cnam)
MPRO 2016-2017
50 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
51 / 91
Définition générale
Un processus aléatoire est un ensemble de variables aléatoires, toutes
définies sur le même espace de probabilité, et indexées par un paramètre
réel t. On note un tel processus { X (t) ; t ∈ C }.
Amélie Lambert (Cnam)
MPRO 2016-2017
52 / 91
Définition générale
Un processus aléatoire est un ensemble de variables aléatoires, toutes
définies sur le même espace de probabilité, et indexées par un paramètre
réel t. On note un tel processus { X (t) ; t ∈ C }.
t est le paramètre du processus,
Amélie Lambert (Cnam)
MPRO 2016-2017
52 / 91
Définition générale
Un processus aléatoire est un ensemble de variables aléatoires, toutes
définies sur le même espace de probabilité, et indexées par un paramètre
réel t. On note un tel processus { X (t) ; t ∈ C }.
t est le paramètre du processus,
C est l’ensemble des paramètres. Si C fini ou infini dénombrable C
est discret (par exemple C = {0, 1, 2, . . .}), sinon C est continu (par
exemple C = [0, +∞[). Quand C est un ensemble d’entier, on note
les variables aléatoires Xn .
Amélie Lambert (Cnam)
MPRO 2016-2017
52 / 91
Définition générale
Un processus aléatoire est un ensemble de variables aléatoires, toutes
définies sur le même espace de probabilité, et indexées par un paramètre
réel t. On note un tel processus { X (t) ; t ∈ C }.
t est le paramètre du processus,
C est l’ensemble des paramètres. Si C fini ou infini dénombrable C
est discret (par exemple C = {0, 1, 2, . . .}), sinon C est continu (par
exemple C = [0, +∞[). Quand C est un ensemble d’entier, on note
les variables aléatoires Xn .
S est l’espace des états (i.e. des valeurs possibles) des X (t). Si S fini
ou infini dénombrable, S est discret, sinon S est continu.
Amélie Lambert (Cnam)
MPRO 2016-2017
52 / 91
Définition générale
Un processus aléatoire est un ensemble de variables aléatoires, toutes
définies sur le même espace de probabilité, et indexées par un paramètre
réel t. On note un tel processus { X (t) ; t ∈ C }.
t est le paramètre du processus,
C est l’ensemble des paramètres. Si C fini ou infini dénombrable C
est discret (par exemple C = {0, 1, 2, . . .}), sinon C est continu (par
exemple C = [0, +∞[). Quand C est un ensemble d’entier, on note
les variables aléatoires Xn .
S est l’espace des états (i.e. des valeurs possibles) des X (t). Si S fini
ou infini dénombrable, S est discret, sinon S est continu.
Exemple : t peut être interprété comme le temps et C comme les instants
à considérer, X (t) est alors la valeur du processus à l’instant t.
Amélie Lambert (Cnam)
MPRO 2016-2017
52 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
53 / 91
Les processus markoviens
Dans un processus markovien, le futur dépend seulement de l’état présent.
Définition 1 Le processus aléatoire { X (t) ; t ∈ C } est un processus de
Markov si pour tout entier n, pour tout t1 < t2 < . . . < tn < tn+1 ∈ C , et
pour tout ensemble d’états S :
P{X (tn+1 ) ∈ S|X (t1 ), . . . , X (tn )} = P{X (tn+1 ) ∈ S|X (tn )}
Amélie Lambert (Cnam)
MPRO 2016-2017
54 / 91
Les processus markoviens
Dans un processus markovien, le futur dépend seulement de l’état présent.
Définition 1 Le processus aléatoire { X (t) ; t ∈ C } est un processus de
Markov si pour tout entier n, pour tout t1 < t2 < . . . < tn < tn+1 ∈ C , et
pour tout ensemble d’états S :
P{X (tn+1 ) ∈ S|X (t1 ), . . . , X (tn )} = P{X (tn+1 ) ∈ S|X (tn )}
Définition 2 Un processus de Markov est dit homogène si
P{X (t + s) ∈ S|X (tn )} = P{X (s) ∈ S|X (0)}
i.e. P{X (t + s) ∈ S|X (tn )} ne dépend pas de t.
Amélie Lambert (Cnam)
MPRO 2016-2017
54 / 91
Les processus markoviens
Dans un processus markovien, le futur dépend seulement de l’état présent.
Définition 1 Le processus aléatoire { X (t) ; t ∈ C } est un processus de
Markov si pour tout entier n, pour tout t1 < t2 < . . . < tn < tn+1 ∈ C , et
pour tout ensemble d’états S :
P{X (tn+1 ) ∈ S|X (t1 ), . . . , X (tn )} = P{X (tn+1 ) ∈ S|X (tn )}
Définition 2 Un processus de Markov est dit homogène si
P{X (t + s) ∈ S|X (tn )} = P{X (s) ∈ S|X (0)}
i.e. P{X (t + s) ∈ S|X (tn )} ne dépend pas de t.
Application : en physique quand l’état futur peut être déduit du passé avec
un historique assez faible.
Amélie Lambert (Cnam)
MPRO 2016-2017
54 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
55 / 91
Les processus stationnaires
Définition : Le processus aléatoire { X (t) ; t ∈ C } est un processus
stationnaire si : ti ∈ C , ti + s ∈ C , i = 1, 2, . . . , n (n est un entier
quelconque), alors :
P{X (t1 ) < x1 , . . . , X (tn ) < xn } = P{X (t1 +s) < x1 , . . . , X (tn +s) < xn } ∀s
Ils sont utilisés dans les modèles de Recherche Opérationnelle pour décrire
les processus qui ont évolué pendant un long moment.
Amélie Lambert (Cnam)
MPRO 2016-2017
56 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
57 / 91
Les processus de poisson
Définition : Un processus de Poisson est un processus de Markov
homogène, dont l’espace des états est discret S = {1, 2, . . .}, et l’ensemble
des paramètre est continu {X (t) ; t ∈ [0, +∞]}.
En d’autres termes : des événements se produisent aléatoirement à partir
de l’instant t = 0, et X (t) = nombre d’événements qui se sont produits
entre les instants 0 et t.
Amélie Lambert (Cnam)
MPRO 2016-2017
58 / 91
Les processus de poisson
Les postulats définissant un processus de Poisson sont :
1
La probabilité qu’au moins 1 événement se produise pendant un
intervalle de tps de longueur h est :
P(h) = λh + o(h) , (λ > 0)
(o(h) : toute fonction définie au voisinage de 0 et telle que
quand h → 0+ )
2
o(h)
h
→0
La probabilité que 2 événements ou plus se produisent pendant
l’intervalle de temps h est o(h). (Ce postulat revient à exclure la
possibilité de la réalisation simultanée de 2 événements ou plus).
Amélie Lambert (Cnam)
MPRO 2016-2017
59 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
60 / 91
Les processus de naissance
Une généralisation naturelle du processus de Poisson consiste à faire
dépendre la probabilité de réalisation d’un événement à un instant donné
du nombre d’événements déjà réalisés.
Définition : Soient {λk } une suite de nombres positifs, X (t) le nombre
de naissances dans l’intervalle [0, t]. Un processus de naissance est un
processus de Markov satisfaisant les postulats :
1
P{X (t + h) − X (t) = 1|X (t) = k} = λk h + o(h)
2
P{X (t + h) − X (t) = 0|X (t) = k} = 1 − λk h + o(h)
3
P{X (t + h) − X (t) < 0|X (t) = k} = 0
Les membres de gauche de 1 et 2 peuvent s’écrire Pk,k+1 (h) et Pk,k (h).
Il s’agit d’un processus homogène puisque λk ne dépend pas de t.
Amélie Lambert (Cnam)
MPRO 2016-2017
61 / 91
Graphe associé à un processus de naissance
Amélie Lambert (Cnam)
MPRO 2016-2017
62 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
63 / 91
Les processus de naissance et de mort
Une des généralisation du processus de naissance consiste à permettre à
X (t) de décroître aussi bien que de croître, on obtient alors un processus
de naissance et de mort.
Définition Un processus de naissance et de mort est un processus de
Markov homogène sur les états 0, 1, 2, . . ., avec ses probabilités de
transition qui vérifient : ∀s, Pij (t) = P{X (t + s) = j|X (s) = i}.
De plus, les Pij (t) satisfont :
1
Pi,i+1 (h) = λi h + o(h),
i ≥0
2
Pi,i−1 (h) = µi h + o(h),
i ≥1
3
Pi,i (h) = 1 − (λi + µi )h + o(h),
i ≥0
Avec λi > 0, ∀i et µi > 0, ∀i 6= 0, µ0 = 0.
Amélie Lambert (Cnam)
MPRO 2016-2017
64 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
65 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
66 / 91
Les chaînes de Markov
Définition : Une chaîne de Markov est un processus stochastique à
ensemble d’indices discrets T et espace d’états discrets S.
Soit {Xn ; n = 0, 1, 2 . . .} une famille de variables aléatoires, c’est une
chaîne de Markov si :
P{Xn = jn |Xo = j0 , . . . , Xn−1 = jn−1 } = P{Xn = jn |Xn−1 = jn−1 }
avec n ≥ 1 et jk ∈ S (0 ≤ k ≤ n)
Amélie Lambert (Cnam)
MPRO 2016-2017
67 / 91
Les chaînes de Markov
Définition : Une chaîne de Markov est un processus stochastique à
ensemble d’indices discrets T et espace d’états discrets S.
Soit {Xn ; n = 0, 1, 2 . . .} une famille de variables aléatoires, c’est une
chaîne de Markov si :
P{Xn = jn |Xo = j0 , . . . , Xn−1 = jn−1 } = P{Xn = jn |Xn−1 = jn−1 }
avec n ≥ 1 et jk ∈ S (0 ≤ k ≤ n)
On note la probabilité de transition
∀(i ∈ S, j ∈ S) pij = P{Xn = j|Xn−1 = i}
Une chaîne est dite homogène (dans le temps) si P{Xn = j|Xn−1 = i} ne
dépend pas de n.
Amélie Lambert (Cnam)
MPRO 2016-2017
67 / 91
Contexte
Dans la suite, nous ne considérerons que des chaînes de Markov
homogènes avec un espace d’état S = {s1 , s2 , . . . , sr }.
Le processus démarre dans un de ces états et évolue d’un état à un
autre.
Chaque mouvement est appelé "pas".
Si la chaîne est dans l’état si , elle se trouve alors dans l’état sj avec la
probabilité pij .
Le processus peut rester dans l’état où il se trouve avec la probabilité
pii .
Amélie Lambert (Cnam)
MPRO 2016-2017
68 / 91
Exemple 4 : la ruine du joueur
2 joueurs A et B tirent à "pile ou face". Si A gagne (pile), il reçoit 1
euro de B, s’il perd (face) il donne 1 euro à B. La partie se termine
lorsque l’un des deux joueurs est ruiné.
Au début de la partie l’avoir de A est a euros et l’avoir de B est b
euros. Posons s = a + b.
Ensemble des états : S = 0, 1, 2, . . . , s − 1, s avoir de A.
Les probabilités de transmissions sont :

Proba "pile" = p si j = i + 1 , i 6= 0



Proba "face" = q si j = i − 1 , i 6= s
pij
1 si i = j = 0 ou i = j = s



0 dans les autres cas
Amélie Lambert (Cnam)
MPRO 2016-2017
69 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
70 / 91
Matrice associée à une chaîne de Markov
On peut regrouper les probabilités de transition pour former une
matrice carrée d’ordre r , où r = |S| désigne le nombre d’états.
Le processus étant dans l’état i à l’instant n, il sera dans un des états
j = 1, 2, . . . , r à l’instant n + 1, on a donc
r
X
pij = 1,
i = 1, 2, . . . , r
j=1




P=


Amélie Lambert (Cnam)
p11 p12
p21 p22
..
..
.
.
pi1 pi2
pr 1 pr 2
. . . p1r
. . . p2r
..
..
.
.
. . . pir
. . . prr







MPRO 2016-2017
71 / 91
Exemple 4 : la ruine du joueur (suite)
2 joueurs A et B tirent à "pile ou face". Si A gagne (pile), il reçoit 1
euro de B, s’il perd (face) il donne 1 euro à B. La partie se termine
lorsque l’un des deux joueurs est ruiné.
Au début de la partie l’avoir de A est a euros et l’avoir de B est b
euros. Posons s = a + b.
Ensemble des états : S = 0, 1, 2, . . . , s − 1, s avoir de A.
La matrice associée est :





P=



1
q
0
0
..
.
0
0
q
0
..
.
0
p
0
q
..
.
0
0
p
0
..
.
...
...
...
...
..
.
0
0
0
0
..
.









0 0 0 0 ... 1
Amélie Lambert (Cnam)
MPRO 2016-2017
72 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
73 / 91
Matrice stochastique
On appelle matrice stochastique une matrice carrée P, dont les éléments
vérifient :
1
2
0 ≤ pij ≤ 1, ∀(i, j) ∈ {1, . . . , r }2
r
X
pij = 1, ∀i ∈ {1, . . . , r }
j=1
Amélie Lambert (Cnam)
MPRO 2016-2017
74 / 91
Théorème
Soit P la matrice des probabilités de transition d’une chaîne de Markov. Le
(n)
terme (i, j) de la matrice P n (noté pij ) donne la probabilité que la chaîne
de Markov, partant de l’état i se trouve dans l’état j après n pas. On a :
X
(2)
1 p
=
pik pkj
ij
k
2
(n)
pij
X
(n−1)
=
pik pkj
k
3
et de façon plus générale (Équation de Chapman-Kolmogorov)
X (m) (n)
(m+n)
pij
=
pik pkj
k
Amélie Lambert (Cnam)
MPRO 2016-2017
75 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
76 / 91
Graphe associé à une chaîne de Markov
G = (S, U)
Sommets : ensemble des états S = {s1 , s2 , . . . , sr }
Arcs : probabilité de transition non nulle (si , sj ) ∈ U ⇔ pij > 0
Exemple : Considérons la chaîne de Markov à 5 états dont la matrice
des probabilités de transition est la suivante :
s1
s2
s3
s4
s5
s1
s2
s3
s4
s5
1/3 0 1/3 0 1/3
0 1/2 0 1/2 0
1/2 0 1/4 0 1/4
0 1/3 0 2/3 0
1
0
0
0
0
Amélie Lambert (Cnam)
MPRO 2016-2017
77 / 91
Classification des états dans une chaîne de Markov
Considérons la relation d’équivalence définie sur les états de la chaîne
E1 , E2 , . . . , E r :
(n)
(m)
Ei R Ej ⇔ ∃n tq pij > 0 et ∃m tq pji
>0
En terme de graphe :
Ei R Ej ⇔ il existe un chemin de Ei à Ej et de Ej à Ei
Amélie Lambert (Cnam)
MPRO 2016-2017
78 / 91
Classification des états dans une chaîne de Markov
On dit que Ei et Ej sont deux états communiquants ssi Ei R Ej . On
peut donc faire une partition des états en classes d’états
communiquants. (Rque : ce sont les composantes fortement connexes
du graphe associé à la chaîne).
C est un ensemble fermé d’états si :
∀ Ei ∈ C
pij = 0
∀ Ej ∈
/C
Un ensemble fermé d’états à 1 seul élément Ei (pii = 1) est un état
absorbant.
Amélie Lambert (Cnam)
MPRO 2016-2017
79 / 91
Chaîne de Markov irréductible
Définition Une chaîne de Markov est irréductible si elle ne contient
aucun sous-ensemble fermé (autre que celui de tous ces états).
Théorème : Dans une chaîne irréductible tous les états sont
communiquants.
Propriété : Une chaîne est irréductible ssi le graphe associé est
fortement connexe.
Amélie Lambert (Cnam)
MPRO 2016-2017
80 / 91
Premier temps d’atteinte d’un état (1/2)
Soit Tij la variable aléatoire du temps de premier passage :
Tij = min{k|Xk = j , Xo = i}
k
(n)
Propriété : Probabilité de premier passage : fij = P{Tij = n}
(probabilité de passer pour la première fois en j au bout de n pas
étant parti de i)

si n = 1
 p
ij
X
(n)
(n−1)
fij =
pik fkj
si n > 1

k6=j
Amélie Lambert (Cnam)
MPRO 2016-2017
81 / 91
Premier temps d’atteinte d’un état (2/2)
Probabilité de passer pour la première fois en j, partant de i, avant la
transition n + 1 :
n
X
(n)
(k)
Fij =
fij
k=1
Probabilité que partant de i, le système atteigne un jour l’état j :
(n)
Fij = lim Fij
n→∞
Amélie Lambert (Cnam)
MPRO 2016-2017
82 / 91
Les états transitoires et persistants
Définition 1 : On dit que Ei est un état transitoire ssi Fii < 1 (le système
partant de i peut ne pas revenir en i).
Définition 2 : On dit Ei est un état persistant (ou récurrent) (le système
partant de Ei , repassera à coup sûr par Ei ). Informellement, si une
trajectoire typique du système passe infiniment souvent par cet état.
Amélie Lambert (Cnam)
MPRO 2016-2017
83 / 91
Périodicité des états persistants
Définition 1 : Un état Ei persistant est un état périodique de période di si
(n)
di = PGCD (n|pii > 0) est > 1.
(n)
(PGCD entre tous les n tels que pii > 0 i.e. di est le PGCD de la
longueur des circuits passant par Ei , la probabilité de passage de i à i en n
transitions est nulle sauf si n est un multiple de di )
Amélie Lambert (Cnam)
MPRO 2016-2017
84 / 91
Périodicité des états persistants
Définition 1 : Un état Ei persistant est un état périodique de période di si
(n)
di = PGCD (n|pii > 0) est > 1.
(n)
(PGCD entre tous les n tels que pii > 0 i.e. di est le PGCD de la
longueur des circuits passant par Ei , la probabilité de passage de i à i en n
transitions est nulle sauf si n est un multiple de di )
Définition 2 : Si di = 1, on dit que l’état Ei est apériodique ou non
périodique.
Une condition suffisante de non périodicité de l’état Ei est que le graphe
possède une boucle au sommet Ei . Cette condition n’est pas nécessaire.
Amélie Lambert (Cnam)
MPRO 2016-2017
84 / 91
Périodicité des états persistants
Définition 1 : Un état Ei persistant est un état périodique de période di si
(n)
di = PGCD (n|pii > 0) est > 1.
(n)
(PGCD entre tous les n tels que pii > 0 i.e. di est le PGCD de la
longueur des circuits passant par Ei , la probabilité de passage de i à i en n
transitions est nulle sauf si n est un multiple de di )
Définition 2 : Si di = 1, on dit que l’état Ei est apériodique ou non
périodique.
Une condition suffisante de non périodicité de l’état Ei est que le graphe
possède une boucle au sommet Ei . Cette condition n’est pas nécessaire.
Théorème : Tous les états d’une classe d’états persistants ont la même
période (résultat concernant la longueur des circuits dans une composante
fortement connexe).
Amélie Lambert (Cnam)
MPRO 2016-2017
84 / 91
1
Rappels de probabilité d’une expérience aléatoire
Le dénombrement
Les variables aléatoires
2
Les processus aléatoires
Les processus markoviens
Les processus stationnaires
Les processus de poisson
Les processus de naissance
Les processus de naissance et de mort
3
Les chaînes de Markov
Définition
Matrice associée à une chaîne de Markov
Matrice stochastique
Graphe associé à une chaîne de Markov
Distribution limite dans une chaîne de Markov
Amélie Lambert (Cnam)
MPRO 2016-2017
85 / 91
Quelques définitions
Définition 1 : Une chaîne de Markov est ergodique ou irréductible s’il est
possible d’aller de tout état à tout état (pas nécessairement en 1 pas).
Amélie Lambert (Cnam)
MPRO 2016-2017
86 / 91
Quelques définitions
Définition 1 : Une chaîne de Markov est ergodique ou irréductible s’il est
possible d’aller de tout état à tout état (pas nécessairement en 1 pas).
Définition 2 : Une chaîne de Markov est régulière s’il existe une puissance
de la matrice des probabilités de transition dont tous les éléments sont
strictement positifs.
La particularité des chaînes régulières est qu’on peut aller de n’importe
quel état vers n’importe quel autre en un nombre fixé de pas k, où k est
indépendant de l’état de départ.
Amélie Lambert (Cnam)
MPRO 2016-2017
86 / 91
Quelques définitions
Définition 1 : Une chaîne de Markov est ergodique ou irréductible s’il est
possible d’aller de tout état à tout état (pas nécessairement en 1 pas).
Définition 2 : Une chaîne de Markov est régulière s’il existe une puissance
de la matrice des probabilités de transition dont tous les éléments sont
strictement positifs.
La particularité des chaînes régulières est qu’on peut aller de n’importe
quel état vers n’importe quel autre en un nombre fixé de pas k, où k est
indépendant de l’état de départ.
Exemple :
0 1
P=
1 0
La chaîne est ergodique mais non régulière
Amélie Lambert (Cnam)
MPRO 2016-2017
86 / 91
Vecteur de distribution des probabilités
Soit le vecteur Q(n) = [q1 (n), q2 (n), . . . , qr (n)] où qi (n) désigne la
probabilité que la chaîne soit dans l’état Ei à l’instant n.
Amélie Lambert (Cnam)
MPRO 2016-2017
87 / 91
Vecteur de distribution des probabilités
Soit le vecteur Q(n) = [q1 (n), q2 (n), . . . , qr (n)] où qi (n) désigne la
probabilité que la chaîne soit dans l’état Ei à l’instant n.
On a
r
X
qi (n) = 1
i=1
Amélie Lambert (Cnam)
MPRO 2016-2017
87 / 91
Vecteur de distribution des probabilités
Soit le vecteur Q(n) = [q1 (n), q2 (n), . . . , qr (n)] où qi (n) désigne la
probabilité que la chaîne soit dans l’état Ei à l’instant n.
On a
r
X
qi (n) = 1
i=1
On a qi (n + 1) =
r
X
qk (n)pki , ∀i.
k=1
Amélie Lambert (Cnam)
MPRO 2016-2017
87 / 91
Vecteur de distribution des probabilités
Soit le vecteur Q(n) = [q1 (n), q2 (n), . . . , qr (n)] où qi (n) désigne la
probabilité que la chaîne soit dans l’état Ei à l’instant n.
On a
r
X
qi (n) = 1
i=1
On a qi (n + 1) =
r
X
qk (n)pki , ∀i.
k=1
Ou encore matriciellement Q(n + 1) = Q(n) ∗ P (où P est la matrice
des probabilités de transition)
Amélie Lambert (Cnam)
MPRO 2016-2017
87 / 91
Vecteur de distribution des probabilités
Soit le vecteur Q(n) = [q1 (n), q2 (n), . . . , qr (n)] où qi (n) désigne la
probabilité que la chaîne soit dans l’état Ei à l’instant n.
On a
r
X
qi (n) = 1
i=1
On a qi (n + 1) =
r
X
qk (n)pki , ∀i.
k=1
Ou encore matriciellement Q(n + 1) = Q(n) ∗ P (où P est la matrice
des probabilités de transition)
Il en résulte que Q(n) = Q(0) ∗ P n
Amélie Lambert (Cnam)
MPRO 2016-2017
87 / 91
Distribution limite dans une chaîne de Markov
Notation : Q(n) = [q1 (n), q2 (n), . . . , qr (n)] avec qi (n) : la probabilité
d’être dans l’état Ei à l’étape n.
Rappelons que : Q(n + 1) = Q(n) ∗ P et Q(n) = Q(0) ∗ P n
Définition : Une chaîne de Markov est régulière ssi elle possède une
distribution limite Q ∗ indépendante de l’état initial Q(0) :
lim Q(n) = Q ∗
n→∞
Amélie Lambert (Cnam)
MPRO 2016-2017
88 / 91
Théorème
Théorème : Une chaîne de Markov est régulière ssi la matrice des
probabilités de transition P admet une limite P ∗ dont toutes les lignes sont
identiques.
Preuve :
1
2
Soit une chaîne régulière, Q ∗ existe et ne dépend pas de Q(0), on a
Q ∗ = Q(0) ∗ P ∗ .
Supposons que l’état initial soit Ei , on a Q(0) = (0, . . . , 0, 1, 0, . . . , 0),
comme Q ∗ = Q(0) ∗ P ∗ , on a bien que Q ∗ est la i eme ligne de P ∗ ,
=⇒ toutes les lignes de P ∗ sont identiques et valent Q ∗
Supposons toutes les lignes de P ∗ identiques (α1 , α2 , . . . , αr ).
r
X
Q ∗ = Q(0) ∗ P ∗ =⇒ qi∗ = αi
qk (0) = αi =⇒
k=1
Q ∗ = (α1 , α2 , . . . , αr ) et ne dépend donc pas de l’état initial.
Amélie Lambert (Cnam)
MPRO 2016-2017
89 / 91
Exemple de chaîne régulière (1/2)


1/2 1/2 0
0
 0
0 2/3 1/3 

P=
 1/2 1/2 0
0 
0
0
1
0
Existence d’une boucle =⇒ non périodicité
Graphe fortement connexe =⇒ 1 seule classe finale d’états communs
Amélie Lambert (Cnam)
MPRO 2016-2017
90 / 91
Exemple de chaîne régulière (2/2)
La distribution limite est déterminée par Q ∗ = Q ∗ P et
4
X
qi∗ = 1
i=1
1
2
1
2
 0
Soit (q1∗ , q2∗ , q3∗ , q4∗ ) = (q1∗ , q2∗ , q3∗ , q4∗ ) 
 1
2
0
0

I
I
I
I
q1∗
q2∗
q3∗
q4∗
=
=
=
=
1 ∗
2 q1
1 ∗
2 q1
2 ∗
3 q2
1 ∗
3 q2
1
2
0
0
0
2
3
1
3
0
1



0 
0
+ 21 q3∗
+ 21 q3∗
+ q4∗
I
q1∗ + q2∗ + q3∗ + q4∗ = 1 =⇒ q1∗ + q1∗ + q1∗ + 1/3q1∗ = 1
I
3
3
3
1
=⇒ Q ∗ = ( 10
, 10
, 10
, 10
)
Amélie Lambert (Cnam)
MPRO 2016-2017
91 / 91
Téléchargement