3.2 Présentation succincte de l’algorithme
Nous ne pouvons pas nous permettre de tester la totalité des sous-ensembles
possibles. Un algorithme
nous permet d’en faire une sélection. Il consiste à itérer deux étapes jusqu’à obtenir un recouvrement
convenable des courbes ( { ,
j
jC
Λ∈
U≈j
X nj ,...,1
}):
- Choix d’une feuille : nous choisissons une courbe notée F parmi , qui maximise
les critères d’une pondération.
jX nj ,...,1=
- Choix d’une classe : nous choisissons dans l’arborescence de la feuille F le nœud (et donc la
classe C) qui minimise le critère : CFX
µµ
−∆− ),()1( , où
est l’archétype de C.
est alors
rajouté à notre sous-ensemble
. Puis nous mettons à jour la pondération de l’ensemble des
feuilles.
La pondération est primordiale, elle permet en particulier de sélectionner à la première étape des feuilles
qui sont éloignées de tous les archétypes déjà sélectionnés, tout en évitant de ne sélectionner que les
outliers.
3.3 Apprentissage
L’algorithme dépend essentiellement du paramètre
: à
fixé, nous sélectionnons toujours les mêmes
archétypes. Nous faisons alors varier notre paramètre jusqu’à obtenir un opt
tel qu’il n’existe pas
d’autres candidats qui décrivent plus précisément l’échantillon d’apprentissage :
),(
1
minarg
1min j
i
N
ij
opt XY
N∆=Λ ∑
=Λ∈
µ
.
3.4 Comparaison avec la méthode classique
Habituellement, le choix du meilleur ensemble de classes dans la CAH se fait en coupant l’arbre au niveau
optimal et en gardant les classes correspondantes. Ainsi, seuls les sous ensembles constitués de nœuds (et
donc de classes) d’un même niveau dans la CAH sont considérés. Le problème de cette méthode est que
toutes les branches de l’arbre sont traitées de la même manière.
Nous comparons cette méthode classique avec la notre grâce à l’échantillon test. Le tableau ci-dessous
présente la moyenne, l’écart type, le minimum et le maximum des quantités ),(min j
i
jXZ∆
∆∈ :
Méthodes Moyenne Ecart type Min. Max.
Niveau de coupe fixe 0.43 5.0 18 28
Multiobjectif 0.34 4.2 18 19
Tableau 1
Nous obtenons de meilleurs résultats que la méthode classique. Nous appliquons notre méthode au trafic
routier. A une date T et une heure H, nous disposons de l’historique du trafic aux dates 1,…,T-1. Nous
obtenons un résumé optimal de cet ensemble de courbes grâce à notre algorithme. Puis nous estimons la
vitesse en H+1 en choisissant l’archétype le plus proche aux heures 0,…,H de la courbe en T et en prenant
la vitesse de cet archétype en H+1.
4 Bibliographie
[GLM 04] GAMBOA F., LOUBES J.M., MAZA E., Structural estimation for high dimensional data,
submitted to Annals of Statistics, 2004.
[LLM 04] LAVIELLE M., LOUBES J.M., and MAZA E , Classification and forecasting in travel time,
submitted to Canadian Journal of Statistics, 2004.