4 A.HAIDAR, M.FAKIR, O.BENCHAREF
5ème conférence internationale sur les TIC pour l’amazighe
pour tous les i, pour tous les j
Les coefficients d’appartenance d’un nouveau point Xi à la classe j est donnée par :
(7)
Tel que m est un entier, où est le coefficient d’appartenance à la classe Cj, =1 si appartient aux
K plus proches voisins =0 si non, de la observation, parmi les k plus proches voisins de xi.
La variable quant à elle, détermine l’importance de la contribution de la distance dans le calcul de la
fonction d’appartenance (contrôle l'efficacité de l'ampleur de la distance). C’est le paramètre de
fuzzification : si m croit, la contribution des voisins est d’avantage pondéré et la notion de distance
perd de son importance, si m tend vers l’unité, la contribution des voisins les plus proches sera
favorisée, ainsi la notion de distance prend de l’importance, si m vaut 2, la contribution de chaque
voisin est pondérée par l’inverse de la distance respective, au carré, qui sépare une observation de
l’observation à classer.
5. Système de reconnaissance
Notre système de reconnaissance de caractères Tifinagh manuscrits se base sur une hybridation de
deux approches stochastique et statistique. On a en entrée une image d’une lettre manuscrite qui
correspond à une lettre de l’alphabet Tifinagh, cette dernière sera nettoyée par un processus de
prétraitement qui comporte trois sous module : un sous module de prétraitement qui se charge de la
normalisation afin d’obtenir un mot adapté à une dimension fixée par le système, ensuite nous allons
passer cette même image à un autre sous module de binarisation qui se charge de la conversion de
l’image en une image bitonale, pour obtenir image nettoyée et enfin nous allons passer cette même
image à un autre sous module qui se charge de la squelettisation du mot. Cependant, l’image
prétraitée va passer à un sous-système d’apprentissage pour qu’elle puisse être traité, ce dernier se
charge d’extraction des caractéristiques importantes par le codage des chaines de Freeman et après on
passe ces caractéristiques (séquences de code de Freeman ) aux modèles da Markov cachés via
l’algorithme de Baum Walch qui va estimer les paramètres du modèle pour chaque caractère par le
critère de maximum de vraisemblance pour un nombre d’itérations fixé par rapport aux paramètres
d’un modèle initial défini au départ, on sauvegarde les valeurs des paramètres estimés des nouveaux
modèles ainsi les valeurs de vraisemblances, ces valeurs de vraisemblance seront classées à l’aide
de KPPV-floue ou KPPV enfin de les enregistrer sur une base de données d’apprentissage.
5.1 Prétraitement
Dans le but d’automatiser la reconnaissance de l’écriture, il faut préparer les images à traités. Les
étapes préliminaires, qui sont nécessaire à la reconnaissance sont la binarisation et la squelettisation.
Binarisation
La binarisation est la première étape de prétraitement elle consiste à convertir l’image numérisée en
une image binaire. Cependant, la binarisation est une opération qui produit deux classes de pixels, en
général, ils sont représentés par des pixels noirs et des pixels blancs.
Squelettisation
La squelettisation sert à obtenir une épaisseur égale à 1 du trait d'écriture et de se ramener ainsi à une
écriture linéaire. Le squelette doit préserver la forme, connexité, topologie et extrémités du tracé, et
ne doit pas introduire d'éléments parasites (Figure 2).