Résumé
Les machines à vecteurs supports (Support Vector Machines) sont de nouvelles
techniques d'apprentissage statistique proposées par V. Vapnik en 1995. Elles permettent
d'aborder des problèmes très divers comme la classification, la régression, la fusion, etc.
Depuis leur introduction dans le domaine de la Reconnaissance de Formes (RdF), plusieurs
travaux ont pu montrer l'efficacité de ces techniques principalement en traitement d'image.
L'idée essentielle des SVM consiste à projeter les données de l'espace d'entrée
(appartenant à deux classes différentes) non-linéairement séparables dans un espace de plus
grande dimension appelé espace de caractéristiques de façon à ce que les données deviennent
linéairement séparables. Dans cet espace, la technique de construction de l'hyperplan optimal
est utilisée pour calculer la fonction de classement séparant les deux classes.
L‟apprentissage des SVM se ramène à résoudre un programme quadratique, la mise en
œuvre d‟un algorithme de SVM est donc coûteuse en temps et mémoire. Pour remédier à ce
problème, les travaux plus récents visent à construire des algorithmes de SVM incrémentaux.
Le principe des algorithmes incrémentaux est de ne charger qu‟un petit bloc de données
en mémoire à la fois, de construire un modèle partiel et de le mettre à jour en chargeant
consécutivement des blocs de données. Cela permet de traiter de très grandes quantités de
données sans difficulté de mémoire sur une machine standard. Un algorithme incrémental
peut donner des résultats approximatifs ou identiques à ceux obtenus par un algorithme
d‟apprentissage chargeant une seule fois l‟ensemble entier des données.
Dans ce mémoire un nouvel algorithme incrémental est proposé pour résoudre un
problème d‟un SVM binaire, l‟algorithme est testé sur une base de données artificielle, et sur
des paires de chiffres manuscrits extraites à partir de la base de données standard MNIST.
MOTS CLETS : Apprentissage incrémental, Machines à Vecteurs Supports,
Apprentissage statistique, Classification, Apprentissage hors ligne.