Exemples de jeux

publicité
Exemples et situations
de jeu
Théorie des jeux
Etudie de façon formelle des situations
d’interaction consciente (jeux) entre agents
individuels (joueurs) animés d’objectifs
spécifiques
 Interaction consciente: chaque joueur sait
qu’il interagit avec d’autres et a une
information plus ou moins précise sur cette
interaction
 Les joueurs ont des objectifs qu’ils visent à
atteindre le mieux possible (ils sont
« rationnels »)

Un jeu est défini par:
 Un
ensemble N de n joueurs, indicés par i
 Pour chaque joueur i, l’ensemble Ai des actions
(stratégies) disponibles au joueur i
 Une fonction qui associe à toute combinaison
(a1,…,an) d’actions des joueurs une conséquence
c(a1,…,an) particulière
 Pour chaque joueur i, un classement subjectif i
des conséquences
 Considérons des exemples de telles situations
Exemple 1: course cycliste
 Alberto
et Lance vont s’affronter demain
dans une course cycliste de montagne de
300 kilomètres
 Chacun dans son hôtel doit, la veille de la
course, décider de consommer ou non de
l’EPO
 Les conséquences qui peuvent résulter
des différentes combinaisons de leurs
actions sont décrites dans le tableau
suivant
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire de Floyd en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire de Floyd en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire de Floyd en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire de Floyd en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire d’Alberto en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire d’Alberto en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire d’Alberto en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire d’Alberto en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Exemple 1: course cycliste
Alberto Lance
conséquence
epo
epo
epo
non
non
epo
non
non
Ex aequo, mauvaise
santé (A)
Victoire d’Alberto en
mauvaise santé (B)
Victoire de Lance (en
mauvaise santé (C)
Ex aequo, bonne
santé (D)
Préférences des joueurs
Préférences des joueurs
Alberto
Lance
B
C
D
D
A
A
C
B
Préférences des joueurs
Alberto
Lance
B
C
D
D
A
A
C
B
Préférences des joueurs
Alberto
Lance
B
C
D
D
A
A
C
B
Préférences des joueurs
Alberto
Lance
B
C
D
D
A
A
C
B
Unanimité sur D et A
Préférences des joueurs
Alberto
Lance
B
C
D
D
A
A
C
B
Unanimité sur D et A et
Préférences des joueurs
Alberto
Lance
B
C
D
D
A
A
C
B
Unanimité sur D et A et opposition sur C et B
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
EPO
Alberto
NON
NON
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
Regardons les choses du point de vue d’Alberto
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
supposons que Lance prenne de l’EPO
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
supposons que Lance prenne de l’EPO
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
Puisqu’Alberto préfère A à C, il a intérêt dans
ce cas à prendre également de l’EPO
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
Supposons que Lance ne prenne pas d’EPO
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
Puisqu’Alberto préfère B à D, il a également
intérêt à prendre de l’EPO dans ce cas
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
Alberto a intérêt à prendre de l’EPO
quoique fasse Lance !!
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
La prise d’EPO est, pour Alberto,
une stratégie dominante
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
On peut vérifier que le même raisonnement
s’applique à Lance
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
La prise d’EPO est une stratégie dominante
pour chacun des joueurs
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
(EPO,EPO) est une prédiction de l’issue du jeu
sous l’hypothèse de rationalité individuelle
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
Paradoxe ? la poursuite de l’intérêt individuel
conduit les agents dans une situation (A)…
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
qu’ils sont tous d’accord pour juger moins
bonne qu’une autre (D)
Que sera l’issue vraisemblable de cette
interaction ?
Lance
EPO
NON
EPO
A
B
NON
C
D
Alberto
La poursuite de l’intérêt individuel s’oppose
à l’intérêt collectif!!!!
Dans cet exemple, on a décrit
litérairement les conséquences
possibles de l’interaction
Lance
Alberto
EPO
NON
EPO
A
B
NON
C
D
Mais il est souvent commode pour
l’analyse d’exprimer ces conséquences
par des listes de “paiements”
Lance
Alberto
EPO
NON
EPO
A
B
NON
C
D
Mais il est souvent commode pour
l’analyse d’exprimer ces conséquences
par des listes de “paiements”
Lance
Alberto
EPO
NON
EPO
A (0,0)
B (+5,-5)
NON
C (-5,+5)
D (1,1)
Mais il est souvent commode pour
l’analyse d’exprimer ces conséquences
par des listes de “paiements”
Lance
Alberto
EPO
NON
EPO
(0,0)
(+5,-5)
NON
(-5,+5)
(1,1)
La seule information contenue dans ces
paiements est le classement des cases qu’ils
induisent chez chaque joueur
Lance
Alberto
EPO
NON
EPO
(0,0)
(+5,-5)
NON
(-5,+5)
(1,1)
Il y donc un grand nombre de manières
possibles d’assigner de tels paiements
Lance
Alberto
EPO
NON
EPO
(0,0)
(+5,-5)
NON
(-5,+5)
(1,1)
Il y donc un grand nombre de manières
possibles d’assigner de tels paiements
Lance
Alberto
EPO
NON
EPO
(3,3)
(5,-1)
NON
(-1,5)
(4,4)
Il y donc un grand nombre de manières
possibles d’assigner de tels paiements
Lance
Alberto
EPO
NON
EPO
(200,300)
(320,150)
NON
(100,400)
(300,350)
Nous prendrons dans les prochains exemples
l’habitude de décrire ces conséquences par
des paiements
Lance
Alberto
EPO
NON
EPO
(200,300)
(320,150)
NON
(100,400)
(300,350)
Exemple 2: bataille de la mer de
Bismark (2e guerre mondiale)
L’Amiral japonais Kimura souhaite faire parvenir
des renforts en Nouvelle Guinée par convoi naval
 L’amiral américain Kenney veut faire subir à ce
convoi des pertes aussi lourdes que possibles
 Kimura doit choisir entre deux itinéraires pour
faire passer son convoi: un itinéraire nord, plus
court, ou un itinéraire sud, plus long
 Kimura doit décider où envoyer ses avions pour
bombarder le convoi
 Si Kenney envoie ses avions au mauvais endroit, il
peut les rappeler et les réenvoyer ailleurs mais le
temps de bombardement est réduit
 Représentons ce problème sous la forme d’un jeu

Bataille de la mer de Bismark
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Bataille de la mer de Bismark
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Issue de cette interaction ?
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Pas de stratégie dominante ici
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Kenney veut aller au nord si Kimura
va au nord…
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Mais veut aller au sud si Kimura
va au sud
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Kenney n’a pas de stratégie dominante mais
Kimura en a une
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Kimura n’a en effet pas intérêt à aller au sud
si Kenney va au nord
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Il a en outre strictement intérêt à aller au
nord si Kenney va au sud
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Aller au nord fait toujours aussi
bien qu’aller au sud pour Kimura
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Nord est une stratégie faiblement dominante
pour Kimura
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Kimura ne devrait donc pas aller au sud
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Kimura ne devrait donc pas aller au sud
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Inamura ne devrait donc pas aller au sud
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Mais si Kimura va au nord…
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Kenney a intérêt à aller aussi au nord!
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Kenney a intérêt à aller aussi au nord!
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Les deux joueurs iront donc au nord!
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Le raisonnement est basé sur l’élimination
itérative des stratégies dominées!
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Il requiert l’hypothèse de rationalité de
Kimura,…
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
celle de la connaissance de cette rationalité
par Kenney et…
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
celle de la rationalité de Kenney
Kimura
Kenney
nord
sud
nord
(2,-2)
(2,-2)
sud
(1,-1)
(3,-3)
Exemple 3: Romance entre Alonzo
et Natacha
Alonzo et Natacha habitent une petite ville d’une
région isolée et s’aiment secrètement
 Chacun aimerait donc multiplier ses chances de
rencontrer l’autre
 Deux lieux de rencontre possibles: le stade de foot
(où a lieu un match) ou la salle paroissiale (où a
lieu un spectacle de ballet classique)
 Alonzo préfère le ballet au foot mais Natacha
préfère le foot au ballet
 Chacun d’entre eux préfère aller à l’endroit où va
l’autre que de se retrouver sans l’autre
 Représentons ce problème sous la forme d’un jeu

Romance d’Alonzo et de Natacha
Natacha
Alonzo
ballet
foot
ballet
(2,-2)
(2,-2)
foot
(1,-1)
(3,-3)
Romance d’Alonzo et de Natacha
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Prédiction de l’issue du jeu ?
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Pas de stratégie dominante, ni pour Alonzo,
ni pour Natacha!!
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Difficile de faire une prévision ici, sans
mécanisme extérieur de coordination
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Un critère: la stabilité interne de la
configuration de comportements
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Une bonne prédiction ne doit donner à aucun
agent d’incitation unilatérale à dévier
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Ce critère peut-il être utile ici ?
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Regardons la configuration où Alonzo et
Natacha vont chacun à leur activité préférée
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Regardons la configuration où Alonzo et
Natacha vont chacun à leur activité préférée
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Cette configuration n’est pas stable…
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Natacha a intérêt à dévier …
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Et Alonzo aussi
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
De même, (foot,ballet) n’est pas stable
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Il y deux combinaisons d’actions qui sont
stables…
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
(ballet, ballet) et…
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
(ballet, ballet) et (foot,foot)
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
(ballet, ballet) et (foot,foot) sont les deux seuls
équilibres de Nash de ce jeu
Natacha
Alonzo
ballet
foot
ballet
(3,2)
(1,1)
foot
(0,0)
(2,3)
Exemple 4: Roche-papier-ciseaux
Joueur 2
roche
roche
Joueur 1
papier
ciseaux
papier
ciseaux
Aucune combinaison de stratégies
n’est stable
Joueur 2
Joueur 1
roche
papier
ciseaux
Roche
(0,0)
(-1,1)
(1,-1)
papier
(1,-1)
(0,0)
(-1,1)
(1,-1)
(0,0)
ciseaux (-1,1)
Aucun équilibre de Nash
Joueur 2
Joueur 1
roche
papier
ciseaux
Roche
(0,0)
(-1,1)
(1,-1)
papier
(1,-1)
(0,0)
(-1,1)
(1,-1)
(0,0)
ciseaux (-1,1)
Exemple 4: Roche-papier-ciseaux
Joueur 2
Joueur 1
roche
papier
ciseaux
Roche
(0,0)
(-1,1)
(1,-1)
papier
(1,-1)
(0,0)
(-1,1)
(1,-1)
(0,0)
ciseaux (-1,1)
Aucun équilibre de Nash…
Joueur 2
Joueur 1
roche
papier
ciseaux
Roche
(0,0)
(-1,1)
(1,-1)
papier
(1,-1)
(0,0)
(-1,1)
(1,-1)
(0,0)
ciseaux (-1,1)
au moins en stratégies pures……
Joueur 2
Joueur 1
roche
papier
ciseaux
Roche
(0,0)
(-1,1)
(1,-1)
papier
(1,-1)
(0,0)
(-1,1)
(1,-1)
(0,0)
ciseaux (-1,1)
Mais on pourrait admettre que les
joueurs choisissent leurs stratégies
au hasard……
Joueur 2
Joueur 1
roche
papier
ciseaux
Roche
(0,0)
(-1,1)
(1,-1)
papier
(1,-1)
(0,0)
(-1,1)
(1,-1)
(0,0)
ciseaux (-1,1)
Exemple 5: jeu dynamique, la
menace crédible
France Telecom est en monopole sur le marché du
téléphone
 Deutche Telecom envisage d’entrer sur le marché
 France Telecom, pour dissuader son concurrent
d’entrer, le menace d’une guerre des prix
 La menace est-elle crédible ?
 FT fait des profits de 300 si elle est seule
 Elle doit partager ses profits en deux si DT entre et
elle ne fait pas de guerre des prix
 Si elle fait une guerre des prix, le marché à
partager avec DT n’est que de 150
 DT doit payer un coût fixe de 100 pour entrer

Illustration
guerre
FT
(-25,75)
entre
DT
n’entre pas
paix
(50,150)
(0,300)
Exemple 6 (Kreps)
 Deux
fabricants de jouets A et B envisagent
de lancer un jeu différent avant noël.
 Si A lance son jeu, il doit dépenser (coûts
fixes) 40 millions d’euros en conception,
commercialisation, et production. Le coût
correspondant pour B est de 60 millions.
 Le marché du jouet est incertain. Avec
probabilité 2/5, il sera bon (ventes totales de
20 millions unités). Avec probabilité 3/5, il sera
mauvais (ventes de 6 millions d’ unités).
Exemple 6, Kreps
 Si
les 2 firmes lancent le jouet, le prix
d’équilibre est de 10 euros. Si une seule
des deux firmes lance le jeu, le prix
d’équilibre est de 12 euros
 Coût marginal de 5 euros pour firme A et 3
euros pour firme B (en + des coûts fixes)
 La firme B a un avantage: Elle a fait une
étude de marché qui lui permet de
connaître avant de lancer son jeu l’état du
marché (bon ou mauvais).
Forme extensive
(0,120)
(0,0)
in
out
nature
(0,-6)
(0,0)
in
out
B
bon
0,4
out
B
bon out
0,4
nature
in
A
mauvais
0,6
B
(10,10)
in
mauvais
0,6 in
B
out
(100,0)
(-25,-39)
(2,0)
Un autre exemple: Information
imparfaite





Sylvester aime se battre contre des mauviettes,
mais ne sait pas distinguer une mauviette d’un
homme viril avant d’engager le combat (en
moyenne 2/3 des hommes sont mes mauviettes,
1/3 sont virils)
Sylvester est devant un café et envisage de taper
sur la première personne qu’il pense être une
mauviette.
Tartarin est dans le café et sait qu’il va passer sur
le chemin de Sylvester; Tartarin n’aime pas se
battre (qu’il soit ou non une mauviette)
Sylvester peut observer la consommation de
Tartarin
Il sait que les mauviettes préfèrent le lait
grenadine alors que les hommes virils préfèrent
la bière
Forme extensive
(1,-1)
(3,0)
combat
Sylvester
paix
bière
Tartarin
combat lait
(0,-1)
(2,0) paix
combat
paix
(-1,1)
(2,0)
faible bière
(2/3)
Tartarin
Nature
lait
fort
(1/3)
combat
Sylvester
paix
(0,1)
(3,0)
Question pour un champion
 Que
fera chacun de ces deux
individus ?
Téléchargement