[
()Fx =
1
()
iM
m
i
Sign f x
=
=
⎡⎤
⎢⎥
⎣⎦
∑ (17)
Par conséquent, Modest Adaboost, produit un ensemble
d’erreur de classification plus faible que celui calculé par Real
et Gentle Adaboost. Mais, à partir des résultats de plusieurs
recherches dans ce domaine, nous pouvons constater que
l’erreur d’apprentissage calculée par Modest Adaboost est plus
élevée que celle de Gentle Adaboost.
III. L’ALGORITHME
D’APPRENTISSAGE: Arbre de
classification (CARTs)
Les Algorithmes d’apprentissage sont constitués d’un
ensemble d’algorithme qui consiste à stimuler
automatiquement un système donné. Ces algorithmes sont
généralement utilisés pour la reconnaissance des forms et la
prise de décision. Les algorithmes d’apprentissage sont
employés dans des différentes applications telles que la
classification, la détection, l’analyse etc.
D’autre part, Les algorithmes d'apprentissage peuvent se
catégoriser selon le mode d'apprentissage qu'ils emploient:
Apprentissage supervisé, Apprentissage-non-supervisé etc.
Dans cet article, nous nous intéressons uniquement par
l’apprentissage supervisé. De ce fait, nous avons identifié
l’arbre de classification et de régression (CARTs) comme
notre algorithme d’apprentissage.
GML AdaBoost Toolbox implémente l’arbre de
classification et de regression (CARTs) ainsi que les
approaches d’Adaboost précédemment définies [5].
Par ailleurs, CARTs est considéré comme un arbre binaire
({1,-1}) puisque chaque nœud ne peut avoir que deux fils
(figure2). Le principe de l’algorithme de CART s’appuie sur
l’indice de Gini (IG) pour la segmentation de l’arbre qui vise à
construire les feuilles. Il faut, surtout, noter que plus l’indice
de Gini est faible, plus le noeud est pur (tous les éléments du
noeud appartiennent à la même classe). L’arbre de décision et
de régression (CARTs) a été conçu par Leo Breiman [13][14].
Faux
Vrai
Faux
Faux Vrai
Fig 2. Exemple d’un CART.
Le principe de cet algorithme consiste à partitionner d’une
manière récursive l’ensemble d’entraînement suivant la
méthode diviser pour mieux régénérer1. En effet, l’algorithme
fait une recherche minutieuse, pour chaque noeud, sur les
attributs et les valeurs de la segmentation puis il sélectionne le
regroupement binaire qui optimise le critère au nœud t [15].
La construction de l’arbre de décision binaire se fait,
essentiellement, en itérant cinq étapes [16]. L’algorithme
relatif s’appelle CART est comme suit:
1. Etablir pour chaque nœud toutes les divisions possibles.
2. Définir un critère de sélection de la meilleure division
d'un nœud.
3. Définir une règle d'arrêt des segmentations de l'arbre afin
de déclarer un nœud comme terminal
4. Affecter une valeur de la variable Y pour ces nœuds
terminaux.
5. Estimer le risque d'erreur de prévision associé à cet arbre.
IV. EXPERIMENTATIONS
A. Corpus de données
Dance ce travail, nous avons utilisé le dialecte DR1 (New
England) du corpus TIMIT[17]. Nous avons choisi pour nos
expérimentations les deux phrases SA1 et SA2 car dans nos
travaux, nous avons procédé à une classification binaire. Il est
important de noter que le dialecte DR1 vise à mettre l’accent
sur la divergence de la prononciation des différents locuteurs
[18][19]. La table I décrit la base de données utilisée pour
notre système de reconnaissance.
Table I.
Système de reconnaissance des phrases (RCP)
Phrase SA1 SA2
Locuteurs 14F+24M 14F+24M
Codification 1 -1
Paramétrisation 12 MFCC, 12 MFCC+ 12 Delta,
12 MFCC+ 12 Delta+ 12 Delta-Delta
B. Paramétrisation
La première étape de notre système vise à numériser le
signal entrant ce qui nous aboutie, par la suite, à réaliser
l’analyse acoustique du signal de parole sur des fenêtres
temporelles de courte durée. Néanmoins, parmi les types de
paramètres vraiment pertinents et utilisables efficacement,
nous trouvons les paramètres de l’analyse spectrale et
éventuellement les paramètres prosodiques puisqu’ils sont
respectivement corrélés à la forme du conduit vocal et à la
source d’excitation de l’appareil de production de la parole.
Dans ce travail, nous nous intéressons, principalement, aux
paramètres cepstraux de types Mel Mel Frequency Cepstral
(MFCC) et ses dérivées étant donné leurs fréquentes
utilisations dans le domaine de la reconnaissance ainsi que
leurs aptitudes à représenter les caractéristiques d’un signal et
leurs robustesses (Table I).
1 Du latin Divide ut imperes, méthode de conception consistant à diviser un
problème de grande taille en plusieurs sous-problèmes analogues, l‟étape de
subdivision étant appliquée récursivement
=-
X5 >0
X2 >2.3 X1 >3
Y=-1
Y=1 Y=-1
X6 >2
e-STA copyright 2011 by see
Volume 8, N°1, pp 53-60