Cours 4 d'Hugo Gimbert sur les Jeux Stochastiques

Téléchargement

Algorithmes pour les jeux stochastiques

Hugo Gimbert

27 novembre 2009

Table des matières

1 Jeux à 0joueur 5

1.1 ChaînesdeMarkov........................ 5

1.1.1 Distributions de probabilités et leurs limites . . . . . . 5

1.1.2 Chaînes de Markov . . . . . . . . . . . . . . . . . . . . 5

1.2 Calcul des probabilités d’accessibilité . . . . . . . . . . . . . . 7

1.3 Conditions de Büchi . . . . . . . . . . . . . . . . . . . . . . . 9

1.4 Vériﬁcation des systèmes probabilistes . . . . . . . . . . . . . 11

1.4.1 Approche naïve par automates . . . . . . . . . . . . . 12

1.4.2 Approche optimale . . . . . . . . . . . . . . . . . . . . 16

2 Jeux stochastiques à 2joueurs à information parfaite 19

2.1 Jeux d’accessibilité stochastiques à information parfaite . . . 19

2.1.1 Jeux et stratégies . . . . . . . . . . . . . . . . . . . . . 19

2.1.2 Valeurs et stratégies optimales . . . . . . . . . . . . . 21

2.2 Calcul des valeurs . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.2.1 Polynomial dans le cas à un joueur . . . . . . . . . . . 26

2.2.2 Un problème dans NP ∩co −NP ........... 27

2.2.3 Algorithme d’amélioration des stratégies . . . . . . . . 27

2.2.4 Algorithme des permutations . . . . . . . . . . . . . . 28

TABLE DES MATIÈRES

Chapitre 1

Jeux à 0joueur

1.1 Chaînes de Markov

1.1.1 Distributions de probabilités et leurs limites

Pour mesurer les probabilités d’un nombre ﬁni ou dénombrable d’événe-

ments, on utilise des distributions de probabilités.

Déﬁnition 1 (Distributions de probabilités).Etant donné un ensemble S

ﬁni ou dénombrable, on note D(S)l’ensemble des distributions de probabilités

sur Sdéﬁni par D(S) = {δ:S→[0,1] |Ps∈Sδ(s)=1}.

Par exemple, Speut être l’ensemble {pile,face}et δ(pile) = δ(face) = 1

Exercice 1. Supposons qu’on lance une pièce jusqu’à obtenir face. On peut

représenter cette expérience en utilisant l’ensemble d’états pile∗face ∪{pileω}.

Montrer que δdéﬁni par δ(pilenface) = 1

2n+1 et δ(pileω)=0est une distri-

bution de probabilités sur pile∗face ∪{pileω}.

Exercice 2. Est-il possible de choisir un entier n∈Nau hasard ?

Exercice 3. Supposons maintenant que S={pile,face}ω. Quelle particula-

rité ont les fonctions δ:S→[0,1] telles que Ps∈Sδ(s) = 1 ?

1.1.2 Chaînes de Markov

Pour pouvoir déﬁnir des probabilités sur des ensembles d’événements non-

dénombrables comme toutes les suites possibles de pile ou face, l’exercice 3

montre que les distributions de probabilités ne sont pas un outil mathéma-

tique adapté. Il faut utiliser la notion de mesure de probabilité. Dans ce

cours, on n’introduira pas la notion générale de mesure de probabilité, on se

bornera à mesurer la probabilité d’événements dans des chaînes de Markov.

Déﬁnition 2 (Chaînes de Markov).Soit Sun ensemble ﬁni ou dénombrable.

Une chaîne de Markov est un triplet M= (S, s0∈S, p :S→ D(S).

1 / 29 100%

Documents connexes

Partiel de novembre 2003

8 Chaînes de Markov (Théorèmes ergodiques)

Marketing, Vente MENTION Responsable

Étude d`un paradoxe Introduction 1 Étude du jeu A

devoir - Jean

FICHE D`EXERCICES N 2 Exercice 1. Exercice 4.

TE1-TTR16 - Stephan Robert

Examen – Probabilités

Corrigé de l`exercice 16, fiche 1

les ateliers développement de la maison de l`entreprise

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d'utilisation

Cours 4 d'Hugo Gimbert sur les Jeux Stochastiques

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Cours 4 d'Hugo Gimbert sur les Jeux Stochastiques

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib