classification automatique, le plus couramment rencontr´e est l’algorithme des k-means
s´equentiel de MacQueen (1967).
Dans le cadre d’un probl`eme de d´etection de d´efauts par ´emission acoustique, nous
avons ´et´e amen´e `a classifier sous contraintes de temps r´eel un ensemble de points situ´es
sur un plan. La solution fournie par l’algorithme CEM (Celeux et Govaert, 1992) est
satisfaisante et rapide par rapport `a l’algorithme EM (Dempster, Laird et Rubin, 1977).
Cependant malgr´e sa rapidit´e, cet algorithme ne permet pas de r´epondre en temps r´eel
quand le nombre de points `a classifier devient trop important (sup´erieur `a 10000 obser-
vations). Dans ce travail, nous cherchons `a d´evelopper un algorithme de classification
s´equentiel bas´e sur une approche probabiliste, qui permet aussi le choix du nombre de
classes.
On suppose dans tout notre travail que les donn´ees sont des observations x1, . . . , xn, . . .
de IRpre¸cues au cours du temps et distribu´ees suivant un mod`ele de m´elange
f(x;Φ) = PK
k=1 πkfk(x;θk) avec Φ= (π1, . . . , πK,θ1, . . . , θK), o`u π1, . . . , πKsont les
proportions du m´elange et θ1, . . . , θKles param`etres des densit´es de probabilit´e de chaque
composant. On note z1, . . . , zn, . . . les donn´ees manquantes associ´ees aux observations, o`u
zn∈ {1, . . . , K}correspond `a la classe de xn.
Pour estimer le param`etre Φ, nous choisissons d’utiliser un algorithme de gradient
stochastique. Ces algorithmes permettent g´en´eralement d’optimiser un crit`ere moyen
(Bottou, 1991,1998)
C(Φ) = E[J(x,Φ)] ,
o`u l’esp´erance est calcul´ee avec le vrai param`etre de la distribution fqui est inconnu
et J(x,Φ) d´esigne un crit`ere qui mesure la qualit´e du param`etre Φpour une observa-
tion x. L’algorithme de gradient stochastique permettant de maximiser ce crit`ere s’´ecrit
g´en´eralement
Φ(n+1) =Φ(n)+αn∇ΦJ(xn+1,Φ(n)) (1)
o`u le pas αnd´esigne un scalaire positif ou une matrice d´efinie positive tels que P|αn|=∞
et P|αn|2<∞.
Dans la deuxi`eme section, nous pr´esentons l’approche de classification s´equentielle
de Titterington (1984) ; la troisi`eme section concerne le nouvel algorithme de gradient
stochastique que nous proposons pour la classification de donn´ees s´equentielles ; une ´etude
exp´erimentale est r´esum´ee dans une quatri`eme section.
2 Algorithme de gradient stochastique d´eriv´e de EM
L’algorithme EM classique est un algorithme it´eratif permettant `a partir de donn´ees ob-
serv´ees xn= (x1, . . . , xn) et d’un param`etre initial Φ(0) de maximiser la log-vraisemblance
log p(xn;Φ) en maximisant dans le cas d’un mod`ele de m´elange la quantit´e
Q(Φ,Φ(q)) = E[log p(xn,zn;Φ)|xn,Φ(q)]
2