UNIVERSITÉ CLAUDE BERNARD
UE AMSB
Examen de modélisation – Chaînes de Markov
2 mai 2005 – 1 h.
Tous documents et calculatrices autorisés.
On veut modéliser le comportement d’individus, en réponse de comportement
de leur entourage. Pour cela, dans un contexte simple, on considère le « dilemme
des prisonniers ».
Le dilemne des prisonniers peut être vu comme un jeu qui se déroule entre
deux individus, en un certain nombre de tours. À chaque tour, chaque individu
a le choix entre deux comportements : la coopération (C) et la trahison (T).
Chacun choisit un comportement en secret, puis les deux choix sont confrontés.
Si les deux individus coopèrent, chacun gagne trois points.
S’ils trahissent tous deux, chacun gagne un point.
Si l’un trahit et l’autre coopère, celui qui trahit gagne cinq points, alors
que l’autre ne gagne rien.
À la fin, on compte pour chacun ses gains sur l’ensemble des tours. Le gagnant
est celui qui a le plus de points.
On considère des individus dont le comportement est régi par une loi de
probabilité. Pour chaque couple de belligérants, un coup est noté par un couple
de lettres. Par exemple, si le premier trahit et le second coopère, on note cela
T1C2, par souci de clarté. On dispose ainsi de quatre états, C1C2, T1C2, C1T2, T1T2,
que l’on considérera toujours dans cet ordre.
1 Joueurs naïfs
Joe : Au premier coup, il trahit avec une probabilité 2
3.
Si l’autre a trahi au coup précédent, il trahit avec une probabilité 4
5.
Si l’autre a coopéré au coup précédent, il trahit avec une probabilité 1
3.
Averell : Au premier coup, il trahit avec une probabilité 1
3.
Si l’autre a trahi au coup précédent, il trahit avec une probabilité 2
3.
Si l’autre a coopéré au coup précédent, il trahit avec une probabilité 1
5.
Par exemple, si Joe trahit et Averell coopère, on note ce coup TJCA.
1. (a) i. Quel est l’état initial Idu système ?
ii. Quelle est la probabilité de passer de l’état CJTAà l’état TJTA?
iii. Décrire la matrice Mde transition entre les coups.
(b) Quelle est la probabilité que la suite des 5 premiers coups soit :
CJCA, TJCA, CJCA, CJCA, TJTA?
(c) Quelle est la probabilité que les deux se fassent confiance, s’ils se sont
trahis deux coups avant ?
(d) Vérifier que la distribution πM=30
121 ,36
121 ,25
121 ,30
121 (avec les états dans
le même ordre que ci-dessus) est stationnaire par M.
2. (a) Quelle est la probabilité que Joe trahisse, s’il a trahi deux coup avant ?
(b) Quelle est la matrice Jde transition entre les coups modulo 2 de Joe
(c’est-à-dire entre les coups 1,3,5,7,... ou entre les coups 2,4,6,8,...) ?
Écrire dans Jles états dans l’ordre CJ,TJ.
(c) Quelle est la distribution stationnaire πJde J?
3. Faire de même avec Averell, ce qui donnera la matrice Aet la distribution
à l’équilibre πA.
4. Retrouver πMgrâce à πAet πJ(sans oublier de justifier).
5. On note gJ(resp. gA) le gain de points de Joe (resp. Averell) en fonction
du coup joué.
(a) Quelles sont les valeurs de gJet gApour les différents coups possibles ?
(b) Après un très grand nombre de coups, lequel des deux joueurs gagne ?
2 Joe ruse
Joe se doute que son comportement est un peu trop simple, et prévisible.
Ainsi, il décide son coup en fonction du coup précédent de son adversaire et de
lui-même.
Ainsi, pour chaque coup, il prend d’abord une option de trahison ou de co-
opération en fonction du coup précédent de l’adversaire, et selon son option et
son propre coup précedent, il prend une décision.
Au premier coup, il trahit avec une probabilité 2
3.
Il prend ses options de coups avec les mêmes probabilités qu’avant.
Ainsi, si l’autre a trahi au coup précédent, il prend l’option de trahir
avec une probabilité 4
5
Si l’autre a coopéré au coup précédent, il prend l’option de trahir avec
une probabilité 1
3.
Ensuite :
S’il a pris l’option de trahir :
Si au coup précédent il a trahi, il trahira effectivement avec une pro-
babilité de 2
3.
Si au coup précédent il a coopéré, il trahira effectivement avec une
probabilité de 3
4.
S’il a pris l’option de coopérer :
Si au coup précédent il a trahi, il coopérera effectivement avec une
probabilité de 5
6.
Si au coup précédent il a coopéré, il coopérera effectivement avec une
probabilité de 1
6.
Averell garde la même tactique.
1. (a) Quelle est la probabilité de passer du coup CJCAau coup TJCA?
(b) Construire la matrice Ndes coups entre Joe et Averell.
2. Expliquer pourquoi on ne peut pas appliquer la méthode du 2 de la partie
précédente.
3. Comme à la partie précédente, calculer lequel des deux joueurs gagnera (on
pourra se calculer de valeurs approchées pour la distribution stationnaire).
Correction
1 Joueurs naïfs
1. (a) i. I=1
9
2
4
1
2
ii. 1
5.4
5=4
25
iii. M=
8
15
4
15
2
15
1
15
2
9
1
9
4
9
2
9
4
25
16
25
1
25
4
25
1
15
4
15
2
15
8
15
(b) 2
9.4
15 .2
9.8
15 .1
15 '0.0045
(c) 512
3375
(d) ...
2. (a) Si Joe trahit au temps 1, deux possibilités :
i. Averell trahit avec une probabilité 2
3, et donc Joe trahira avec une
probabilité 2
3.4
5=8
15 .
ii. Averell coopère avec une probabilité 1
3, et donc Joe trahira avec une
probabilité 1
3.1
3=1
9.
Donc globalement la probabilité de trahison de Joe au temps 3 est 29
45 .
(b) De même, si Joe coopère au temps 1, il trahira au temps 3 avec une
probabilité 1
5.4
5+4
5.1
3=32
75 .
J=43
75
32
75
16
45
29
45
(c) πJ= ( 5
11
6
11 )
3. A=29
45
16
45
32
75
43
75 et πA= ( 6
11
5
11 ).
4. Il suffit de multiplier les vecteurs terme à terme, car les coups simultanés
de Joe et d’Averell sont indépendants, et donc P(CJTA) = P(CJ)P(TA).
5. (a) gA:CJCA3
TJCA0
CJTA5
TJTA1
et gJ:CJCA3
TJCA5
CJTA0
TJTA1
(b) gA=245
121 et gJ=300
121 , donc Joe gagne.
2 Joe ruse
1. (a) P(TJCA|CJCA) = 29
45
(b) N=
7
45
29
45
7
180
29
180
2
9
1
9
4
9
2
9
14
75
46
75
7
150
23
150
13
90
17
90
13
45
17
45
2. Parce que les coups au même temps de Joe et d’Averell ne sont pas indé-
pendants, puisqu’ils dépendent tous deux du coup précédent de Joe.
3. πN=0.184 0.347 0.239 0.23 . Ainsi, gJ= 1,977 et gA= 2,517,
donc Averell gagne.
1 / 4 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !