Introduction
Généralement considérée comme une des disciplines de l’intelligence ar-
tificielle, l’apprentissage automatique est fortement lié, entre autres, aux
statistiques, à la théorie des probabilités, aux sciences cognitives et bien
sûr à l’informatique théorique. Elle consiste en la conception et l’analyse
de méthodes non triviales, d’algorithmes permettant à une machine, à
partir d’un ensemble de données ou de mesures, d’effectuer automatique-
ment des tâches complexes comme la prise intelligente de décision ou la
reconnaissance de motifs. Le champ des applications de l’apprentissage
automatique est très large et se situe dans des domaines aussi divers que
la biologie, la chimie, la robotique, la linguistique et les technologies web.
Citons quelques exemples de problèmes qu’il est possible de résoudre en
utilisant des techniques relevant de l’apprentissage automatique. D’abord,
considérons un site internet de vente par correspondance. Celui-ci sou-
haite mettre en place un système de recommandation automatique, en
conseillant à un acheteur des produits pouvant l’intéresser. Une des ap-
proches possibles consiste, à partir des commandes précédemment effec-
tuées et des pages visitées par chaque utilisateur, à identifier des groupes
de clients au comportement proche grâce à une méthode d’apprentissage
non supervisée ou de clustering. Ainsi, on pourra orienter l’internaute vers
des produits commandés par des utilisateurs aux centres d’intérêt simi-
laires. Second exemple, la poste américaine s’est intéressée dans les an-
nées 1980 au problème de la reconnaissance de chiffres manuscrits, afin
d’être capable de diriger automatiquement le courrier en fonction du code
postal. On dispose au départ d’une base de données (un ensemble d’ap-
prentissage) constituée de quelques milliers de chiffres, provenant de scrip-
teurs différents, et identifiés, par un être humain, comme appartenant à
une classe donnée, c’est-à-dire comme étant un 0, un 1, un 8... A partir
de ces exemples munis d’une classe, ou étiquette, l’objectif est de calculer
une fonction capable d’associer automatiquement une classe (de catégo-
riser) à un chiffre manuscrit ne provenant pas de l’ensemble d’appren-
tissage. C’est à ce type de problèmes de classification supervisée que nous
nous intéressons dans ce manuscrit. Enfin, dernier exemple, la concep-
tion d’un mini-hélicoptère capable de voler à l’envers en vol stationnaire.
Une stratégie envisageable consiste à avoir recours à l’apprentissage par
renforcement. L’hélicoptère va effectuer des vols successifs et sera récom-
pensé (positivement ou négativement) suivant ses actions à chaque étape
d’un vol. Par exemple, la récompense sera positive lorsque l’hélicoptère
réussira à se retourner. Ainsi, l’hélicoptère va, au cours de cette séquence
d’expériences (autrement dit de ces vols successifs), rechercher le com-
portement lui permettant de maximiser les récompenses obtenues jusqu’à
atteindre le maximum, lorsque le véhicule est en vol stationnaire inversé.
1