2.3 L’algorithme de Gatos et al.
L’article [3] pr´esente un algorithme capable de trouver l’orientation des
lignes d’un texte ainsi que leur position (leur ligne centrale).
2.3.1 L’algorithme
La premi`ere ´etape de l’algorithme consiste `a lisser verticalement l’image
en lui appliquant l’algorithme Run-length smoothing algorithm (RLSA) [6] :
on fixe un certain seuil T, si le nombre de pixels de fond (les blancs) entre
deux pixels de texte (les noirs) est inf´erieur ou ´egal au seuil T, alors ces
pixels de fond sont convertis en pixel de texte. Ce faisant, on obtient des
bandes horizontales noires plutˆot que du texte.
On s´electionne ensuite plusieurs lignes (deux au moins, plus am´eliore les
r´esultats) verticales qui d´ecoupe l’image en portions de mˆeme dimension, on
cr´e´e des tableaux qui contiennent soit 1 si des pixels sont pr´esents autour,
soit 0.
Des matrices de corr´elation sont ensuite calcul´ees qui repr´esentent les
possibilit´es de lignes entre deux lignes verticales. Si plus de deux lignes
verticales sont utilis´ees, on regroupe toutes les matrices dans une matrice
globale. De celle-ci on cherche la possibilit´e (l’angle) ayant la plus forte
chance d’ˆetre une ligne et on la choisit.
`
A partir d’une matrice de coh´erence, on peut aussi obtenir le centre des
lignes en s´electionnant les points `a plus forte concentration.
2.3.2 Analyse
Les avantages de cet algorithme :
– Beaucoup plus rapide que Hough, Hough+RLSA et ICC (Yan) (de 50
`a 100 fois d’apr`es les exp´eriences de l’article). De l’ordre de 4 secondes
sur un 486DX `a 33MHz.
– Seule une portion de l’image de d´epart est utilis´ee, celle autour des
lignes (voire juste les lignes si on ´elimine RLSA).
– R´esiste `a la pr´esence d’images dans le texte.
– Son exactitude est ajustable grˆace au nombre de lignes verticales.
Les limites de l’algorithme :
– D´ependant de l’angle maximum d’orientation de l’algorithme.
– Fonctionne uniquement sur des documents textuels (donc OK pour
nous).
On a N−1 matrices de corr´elation (o`u Nest le nombre de lignes verti-
cales) qui sont chacune de taille H×2Lo`u Hest la hauteur de l’image en
pixel et Lla pente maximum d’une ligne avec L=D×tan(2πθmax/360).
L’algorithme devrait aussi ˆetre modifiable pour pouvoir donner l’´epaisseur
(moyenne au moins) des lignes. :
2