1 h. 1 Joueurs naïfs

publicité
UNIVERSITÉ CLAUDE BERNARD
UE AMSB
Examen de modélisation – Chaînes de Markov
2 mai 2005 – 1 h.
Tous documents et calculatrices autorisés.
On veut modéliser le comportement d’individus, en réponse de comportement
de leur entourage. Pour cela, dans un contexte simple, on considère le « dilemme
des prisonniers ».
Le dilemne des prisonniers peut être vu comme un jeu qui se déroule entre
deux individus, en un certain nombre de tours. À chaque tour, chaque individu
a le choix entre deux comportements : la coopération (C) et la trahison (T ).
Chacun choisit un comportement en secret, puis les deux choix sont confrontés.
— Si les deux individus coopèrent, chacun gagne trois points.
— S’ils trahissent tous deux, chacun gagne un point.
— Si l’un trahit et l’autre coopère, celui qui trahit gagne cinq points, alors
que l’autre ne gagne rien.
À la fin, on compte pour chacun ses gains sur l’ensemble des tours. Le gagnant
est celui qui a le plus de points.
On considère des individus dont le comportement est régi par une loi de
probabilité. Pour chaque couple de belligérants, un coup est noté par un couple
de lettres. Par exemple, si le premier trahit et le second coopère, on note cela
T1 C2 , par souci de clarté. On dispose ainsi de quatre états, C1 C2 , T1 C2 , C1 T2 , T1 T2 ,
que l’on considérera toujours dans cet ordre.
1
Joueurs naïfs
Joe : Au premier coup, il trahit avec une probabilité 32 .
Si l’autre a trahi au coup précédent, il trahit avec une probabilité 45 .
Si l’autre a coopéré au coup précédent, il trahit avec une probabilité 13 .
Averell : Au premier coup, il trahit avec une probabilité 13 .
Si l’autre a trahi au coup précédent, il trahit avec une probabilité 23 .
Si l’autre a coopéré au coup précédent, il trahit avec une probabilité 15 .
Par exemple, si Joe trahit et Averell coopère, on note ce coup TJ CA .
1. (a) i. Quel est l’état initial I du système ?
ii. Quelle est la probabilité de passer de l’état CJ TA à l’état TJ TA ?
iii. Décrire la matrice M de transition entre les coups.
(b) Quelle est la probabilité que la suite des 5 premiers coups soit :
CJ CA , TJ CA , CJ CA , CJ CA , TJ TA ?
(c) Quelle est la probabilité que les deux se fassent confiance, s’ils se sont
trahis deux coups avant ?
30 36 25 30
(d) Vérifier que la distribution πM = 121
, 121 , 121 , 121 (avec les états dans
le même ordre que ci-dessus) est stationnaire par M.
2. (a) Quelle est la probabilité que Joe trahisse, s’il a trahi deux coup avant ?
(b) Quelle est la matrice J de transition entre les coups modulo 2 de Joe
(c’est-à-dire entre les coups 1,3,5,7,... ou entre les coups 2,4,6,8,...) ?
Écrire dans J les états dans l’ordre CJ , TJ .
(c) Quelle est la distribution stationnaire πJ de J ?
3. Faire de même avec Averell, ce qui donnera la matrice A et la distribution
à l’équilibre πA .
4. Retrouver πM grâce à πA et πJ (sans oublier de justifier).
5. On note gJ (resp. gA ) le gain de points de Joe (resp. Averell) en fonction
du coup joué.
(a) Quelles sont les valeurs de gJ et gA pour les différents coups possibles ?
(b) Après un très grand nombre de coups, lequel des deux joueurs gagne ?
2
Joe ruse
Joe se doute que son comportement est un peu trop simple, et prévisible.
Ainsi, il décide son coup en fonction du coup précédent de son adversaire et de
lui-même.
Ainsi, pour chaque coup, il prend d’abord une option de trahison ou de coopération en fonction du coup précédent de l’adversaire, et selon son option et
son propre coup précedent, il prend une décision.
— Au premier coup, il trahit avec une probabilité 32 .
— Il prend ses options de coups avec les mêmes probabilités qu’avant.
— Ainsi, si l’autre a trahi au coup précédent, il prend l’option de trahir
avec une probabilité 54
— Si l’autre a coopéré au coup précédent, il prend l’option de trahir avec
une probabilité 13 .
Ensuite :
— S’il a pris l’option de trahir :
— Si au coup précédent il a trahi, il trahira effectivement avec une probabilité de 32 .
— Si au coup précédent il a coopéré, il trahira effectivement avec une
probabilité de 34 .
— S’il a pris l’option de coopérer :
— Si au coup précédent il a trahi, il coopérera effectivement avec une
probabilité de 65 .
— Si au coup précédent il a coopéré, il coopérera effectivement avec une
probabilité de 61 .
Averell garde la même tactique.
1. (a) Quelle est la probabilité de passer du coup CJ CA au coup TJ CA ?
(b) Construire la matrice N des coups entre Joe et Averell.
2. Expliquer pourquoi on ne peut pas appliquer la méthode du 2 de la partie
précédente.
3. Comme à la partie précédente, calculer lequel des deux joueurs gagnera (on
pourra se calculer de valeurs approchées pour la distribution stationnaire).
Correction
1
Joueurs naïfs


2
 4 

1. (a) i. I = 91 
 1 
2
ii.
1 4
.
5 5
4
= 25


iii. M = 

(b)
(c)
2 4 2 8 1
. . . .
9 15 9 15 15
512
3375
4
15
1
9
16
25
4
15
8
15
2
9
4
25
1
15
2
15
4
9
1
25
2
15
1
15
2
9
4
25
8
15




' 0.0045
(d) ...
2. (a) Si Joe trahit au temps 1, deux possibilités :
i. Averell trahit avec une probabilité 23 , et donc Joe trahira avec une
8
probabilité 23 . 45 = 15
.
ii. Averell coopère avec une probabilité 13 , et donc Joe trahira avec une
probabilité 13 . 13 = 91 .
Donc globalement la probabilité de trahison de Joe au temps 3 est
29
.
45
(b) De même, si Joe coopère au temps 1, il trahira au temps 3 avec une
.
probabilité 51 . 45 + 45 . 31 = 32
75
43 32 75
75
J=
29
16
(c) πJ = (
29
45
3. A =
32
75
45
45
5
6
11
11
16
45
43
75
)
6
11
et πA = (
5
11
).
4. Il suffit de multiplier les vecteurs terme à terme, car les coups simultanés
de Joe et d’Averell sont indépendants, et donc P (CJ TA ) = P (CJ )P (TA ).
5. (a) gA : CJ CA
TJ CA
CJ TA
TJ TA
(b) g A =
2
245
121
→
→
→
→
3
0
5
1
et g J =
et
300
,
121
donc Joe gagne.
Joe ruse
1. (a) P (TJ CA |CJ CA ) =
 7 29 7

(b) N = 

45
2
9
14
75
13
90
45
1
9
46
75
17
90
29
45
180
4
9
7
150
13
45
gJ : CJ CA
TJ CA
CJ TA
TJ TA
29
180
2
9
23
150
17
45




→
→
→
→
3
5
0
1
2. Parce que les coups au même temps de Joe et d’Averell ne sont pas indépendants, puisqu’ils dépendent tous deux du coup précédent de Joe.
3. πN = 0.184 0.347 0.239 0.23 . Ainsi, g J = 1, 977 et g A = 2, 517,
donc Averell gagne.
Téléchargement