LPC
Le problème fondamental du système LPC est de déterminer le formants
du signal de discours. La solution fondamentale est une équation de
différence, qui exprime chaque échantillon du signal comme une
combinaison linéaire d'échantillons précédents. On appelle une telle
équation un prophète linéaire, qui est pourquoi on l'appelle la Codification
Prophétique Linéaire.
Les coefficients de l'équation de différence (les coefficients de prédiction) caractérisent
le formants, donc le système LPC doit estimer ces coefficients. L'estimation est faite en
minimisant l'erreur carrée-moyenne entre le signal prédit et le signal réel.
LPC analyse le signal de discours en estimant le formants, en enlevant leurs effets du
signal de discours et en estimant l'intensité et la fréquence du bourdonnement restant.
On appelle le processus d'enlever le formants la filtration inverse et on appelle le signal
restant le résidu.
Lpc modèle autorégressif plus p est grand on aura mieux le spectre .lpc est plus rapide que fft
(contients le meme nombre de parametres ) fft se rapproche le mieux du spectre .
Synthèse :
L’analyse spéctrale -> la détection des pitch on peut trouver les coefficients de prédiqueteurs
a(j), en suite si le signale n’est pas voisé, on envoit un bruit blanc, sinon, un train de
impulsion de période de pitch.Et on peut procéder alors à la synthèse inverse(filtre de
synthèse).
Caractéristiques importants :
Pitch, formants,signale voisé.
HMM
La difference entre hmm et chaine de markov cachés ce que les observations ne sont plus
univoquement liées à une seule classe gaussienne
Programmation dynamique
Définition :
L’algorithme de programme dynamique, est une approche qui permet d’obtenir la solution
optimale à un problème de minimisation d’un certaine critère d’erreur sans devoir considérer
toutes les solutions possibles(solution global à partir des solutions locales).
D(n,j) =d(n,j) + min[D(n-1, j),D(n,j-1),D(n-1,j-1)] D(n.j)=distance accumulé d(n,j)=local
distance
DTW :
L’algorithme de programme dynamique peut-être applique aux problèmes de la comparaison
des 2 séquences temporelles, et par conséquent la reconnaissance de la parole. Pour se faire il
suffit de considérer pour chaque référence Y(k) une matrice D de dimension n et
J(k)(dimension= n*J(k)) qui sont respectivement le nombre de la vecteur dans la séquences de
test et de référence.
À chaque entrée (n,j) de cette matrice on y associe la distance locale D(Xn, Yj(k)).
HMM(hidden markov model)
-C’est la même chose de cas précédent, au lieu de distance comme le cas précédant, on prend
la probabilité.
-Dans le cas de HMM, on utilise l’approximation Viterbi qui est une estimation de meilleur
chemin.
Ce d’algorithme résulte d’une simplification de la récurrence dans laquelle on remplace tous
les sommes par une fonction de maximum.
Les algorithmes de programmation dynamique peuvent être utilisé pour la reconnaissance
HMM, avec plusieurs avantages :
-les parametres decrivant la distances local et les penalites des transitions pourront etre
determine automatiquement par entrainement .
1 / 2 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !