2 Conditionnement instrumental . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.1 Formalisme des m´ethodes de renforcement . . . . . . . . . . . . . . 78
2.2 Les techniques de renforcement . . . . . . . . . . . . . . . . . . . . 81
2.2.1 Sch´ema de fonctionnement g´en´eral . . . . . . . . . . . . . 81
2.2.2 L’algorithme TD(λ) ..................... 82
2.2.3 Le Q-learning . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.2.4 L’algorithme Dyna-Q . . . . . . . . . . . . . . . . . . . . . 83
10 Multi-agents 85
1 Introduction................................... 85
1.1 Pourquoi distribuer l’intelligence ? . . . . . . . . . . . . . . . . . . . 85
1.2 D´efinition d’un agent (physique ou virtuel) . . . . . . . . . . . . . . 86
1.3 D´efinition d’un syst`eme multi-agents (SMA) . . . . . . . . . . . . . 87
1.4 Agent logiciel/agent physique . . . . . . . . . . . . . . . . . . . . . 87
1.5 Niveaux d’organisation . . . . . . . . . . . . . . . . . . . . . . . . . 88
2 Conceptiond’unSMA ............................. 88
2.1 Pourquoi utiliser des SMA ? . . . . . . . . . . . . . . . . . . . . . . 88
2.2 Quelle est la n´ecessit´e d’utiliser des SMA ? . . . . . . . . . . . . . . 89
2.3 Inspiration................................ 89
2.4 Quand utiliser un SMA ? . . . . . . . . . . . . . . . . . . . . . . . . 89
2.5 Conception ............................... 90
2.6 Applications............................... 91
3 Agentsmobiles ................................. 91
3.1 Int´erˆet.................................. 91
3.2 Avantages................................ 91
3.3 Inconv´enients .............................. 92
4 Nouvelle architecture ISO . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5 Application : Projet Netmarch´e . . . . . . . . . . . . . . . . . . . . . . . . 92
5.1 Pr´esentation............................... 92
5.2 Implantation : FIPA-OS . . . . . . . . . . . . . . . . . . . . . . . . 92
5.3 Autre strat´egie possible . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4 D´eveloppement ............................. 93
6 Applications................................... 93
6.1 ToursdeHano¨ı ............................. 93
A Filtrage de Wiener 94
4