Chapitre 1
Recherche stratégique dans un espace d’états
1.1 Introduction
Nous nous intéressons à la modélisation d’un jeu qui se passe entre deux joueurs. Le joueur qui joue
en premier s’appelle max et son but est de maximiser le gain. Le joueur qui joue en second s’appelle
min et son but est de minimiser le gain de max. Nous allons modéliser les possibilités du jeu par un
arbre. La racine de l’arbre se trouve au niveau 0. Les nœuds de l’arbre correspondent aux possibilités
qu’ont les joueurs. Les nœuds appartenant à un niveau pair correspondent aux choix que peut avoir
max tandis que les les nœuds appartenant à un niveau impair correspondent aux choix demin. Les
successeurs d’un nœuds donné preprésentent l’ensemble des positions accessibles en un coup depuis
pet est noté Succ(p). On peut déterminer pour les nœuds terminaux (les feuilles) une estimation de
la valeur intrinsèque vi de la position atteinte. Cette estimation peut être un score numérique ou bien
elle peut prendre sa valeur dans l’ensemble {P erdant, Nulle, Gagnant}. Noter bien que les scores
associés ici correspondent aux scores de max seulement.
1.2 Notions : Arbre de jeu et stratégies des joueurs
Nous avons vu que nous modélisons les étapes du jeu par un arbre G. La racine de l’arbre corres-
pond au début de jeu quand max va jouer. Les feuilles correspondent à la fin du jeu o ? à l’arrêt sur une
étape ou une évaluation de toutes les feuilles soit possible.
De point de vue de max, la valeur associée à un nœud donné p est calculée de la façon suivante :
1. max{V(Succ(p))}, s’il s’agit de score numérique,
2. sinon
–G si l’un des successeurs est gagnant.
–P si tous les successeurs sont perdants.
–N si l’un des successeurs est Nul est aucun n’est gagnant.
De même, selon le point de vue de min, la valeur associée à un nœud donné p est calculé de la façon
suivante :
1. min{V(Succ(p))}, s’il s’agit de score numérique
2