4 Revue. Volume X – n° x/année
contribue à la réussite, tandis que l'ensemble Déch servira à découvrir le comportement
commun qui contribue à l'échec.
A la suite de la classification, nous effectuons une recherche des séquences
fréquentes sur Dréu et Déch en appliquant l'algorithme SPADE. Afin de déterminer si une
séquence peut être considérée comme fréquente, cet algorithme s'appuie sur la notion de
sous-séquence et de support. Dans le cadre où nos séquences sont composées
d'ensembles à 1 élément, nous pouvons énoncer que la séquence α = (a1, a2, ..., an) est
une sous-séquence de la séquence β = (b1, b2, ..., bn), noté α
β, s'il existe des entiers i1
< i2 < ... < in tel que ai = bij. Par ailleurs, le support d'une séquence α dans un ensemble
D de traces est le pourcentage des traces S qui ont α comme sous-séquence, c'est à dire,
Une séquence α est alors dite fréquente dans un ensemble D quand
fr(α,D) ≥ SupportMin. Nous appellerons Fk l'ensemble des k-séquences fréquentes.
Reprenons notre exemple, et voyons comment l'algorithme procède pour identifier les
séquences fréquentes dans les traces des participants qui ont réussi l'exercice. Notre
exemple de la Figure 1 présente, dans sa première partie, un ensemble de 4 traces de
Dréu,, le support minimal utilisé (50%) et les résultats obtenus (Rréu = ∑Fk de réussite).
L'algorithme commence par déterminer les 1-séquences qui sont fréquentes en calculant
leur support et en ne gardant seulement que celles qui ont un support supérieur à
SupportMin (soit F1 = {A, B, F, G}). Ensuite, pour déterminer Fn, on sélectionne les
candidats possibles de telle sorte que ces probables n-séquences fréquentes soient
composées par n sous-séquences appartenant à Fn-1. On calcule ensuite leur support et on
ne retient parmi les candidats que les séquences dont le support est supérieur à
SupportMin. Par exemple, la séquence A→D (A,D є F1) n'est pas retenue comme
élément de F2 car son support de 25% est plus petit que SupportMin. Au contraire,
A→B→F (A→B, B→F, A→F є F2) est retenu pour F3 avec son support de 75%, ainsi
que D→B→F→A (D→B→F, D→B→A, D→F→A, B→F→A є F3) pour F4 avec son
support 50%.
Nous présentons dans la deuxième partie de la Figure 1 les traces de Déch et les
résultats obtenus (Réch = ∑Fk d’échec) avec également un support minimal de 50%. Ces
deux supports minimaux sont choisis à titre d'exemple. Avec des données réelles, nous
devrons passer par une phase de paramétrages afin d’adapter ces supports au contexte de
la plate-forme et de l’expérience visée.