VII. CONCLUSION
Nous avons étudié et mis en œuvre dans cet article un
système d’identification du locuteur en mode indépendant du
texte. Nous avons présenté un système hybride GMM-SVM.
Ce système présente la capacité générative de modélisation
des GMM et la discrimination de décision des supports
vecteurs machines. Dans le cadre de ce travail, Nous avons
montré aussi l’impact de l’étape de modélisation des locuteurs
sur les performances du système en faisant varier l’ordre des
GMM.
Une explication bien admise est qu’en dessous d’une certaine
valeur, le nombre de distributions Gaussiennes est insuffisant
pour modéliser précisément les densités de probabilité de
chaque locuteur. Au delà d’une certaine valeur, le système
modélisera des aspects singuliers des locuteurs donc il faut
choisir le bon nombre de gaussiennes. Nous avons étudié aussi
l’impact des noyaux SVM sur les taux d’identifications des
locuteurs. Nous avons montré que les noyaux polynomial et
linéaire ont donné les meilleurs résultats en affichant un taux
d’identification de 100%.
REFERENCES
[ATA 1976] Atal B.S. (1976), “Automatic Recognition of Speakers
from Their Voices”, Proceedings ofthe IEEE, Vol. 64, No. 4, April
1976, pp 460-475.
[BIM 2004] Bimbot, F., Bonastre, J. B., Fredouille, C., Gravier, G.,
Magrain-Chagnolleau, I., Meignier, S., Merlin, T.,Ortega-García, J.,
Petrovska-Delacrétaz, D., and Reynolds, D. A. (2004). A Tutorial on
Text-Independent speaker Verification. EURASIP Jouranl on Applied
Signal Processing, 4, 430.451.
[CAM 2006 ] W. M. Campbell, D. E. Sturim, D. A. Reynolds, and A.
Solomonoff, "SVM based speaker verification using a GMM-
supervector kernel and NAP variability compensation, " Proc. Int.
Conf. Acoustics, Speech, and Signal Processing, 2006.
[CAR 1991] Michael J. Carey, Eluned S. Parris et John S. Bridle
(1991). A speaker verification system using alpha-nets. In IEEE
International Conference on Acoustics, Speech, and Signal
Processing, ICASSP, volume 1, pages 397-400, Toronto.
[CHA 2001] C.-C. Chang and C.-J. Lin. LIBSVM: a library for
support vector machines, 2001. Software available at
http://www.csie.ntu.edu.tw/˜cjlin/libsvm.
[GAU 1994] Gauvain, J. L. and Lee, C. H. (1994). Maximum a
Posteriori Estimation for Multivariate Gaussian Mixture Observations
of Markov Chains. IEEE Trans. Speech Audio Processing, 2,
291.298.
[GUI 2006] Guigue, V., 2006. Separateurs µa Vaste Marges linéaires,
Laboratoire d'Informatique de Paris 6 (LIP6) d'après les cours d'Alain
Rakotoma-monjy.
[NEI 2001] Daniel Neiberg "Text Independent Speaker Verication
Using Adapted Gaussian Mixture Models", Centre for Speech
Technology (CTT) Department of Speech, Music and Hearing KTH,
Stockholm, Sweden 2001-12-11
[REY 2000] D. Reynolds, T. Quatieri, and R.Dunn. "Speaker
verification using adapted Gaussian mixture models". DSP, 10(1-
3):19–41, 2000.
[REY 19595] D. Reynolds and R. Rose, "Robust text-independent
speaker identification using Gaussian mixture speaker models, "
IEEE Trans. Speech Audio Proc., vol. 3, no. 1, pp. 72–83, 1995.
[SCH 1996] M.Schmidt and H.Gish, "Speaker Identification via
Support Vector Machies, " in ICASSP, 105-108, 1996.
[BEN 2010] Ben Ayed Mezghani D., Zribi Boujelbene S., Ellouze N.,
"Evaluation of SVM Kernels and Conventional Machine Learning
Algorithms for Speaker Identification", International Journal of
Hybrid Information Technology-IJHIT, Vol.3, No.3, July 2010.
[ZRI 2010] Zribi Boujelbene S., Ben Ayed Mezghani D., Ellouze N.
"Improving SVM by Modifying Kernel Functions for Speaker
Identification Task", Journal of Convergence Information Technology
– International Journal of Digital Content Technology and its
Applications, JDCTA, ISSN: 1975-9339, Vol. 4, No. 6, September
2010.
e-STA copyright 2011 by see
Volume 8, N°1, pp 61-65