Algorithmique du texte
Recherche de motifs
Introduction
Rechercher un motif dans un texte, indexer des donn´
ees textuelles,
expliciter les r´
egularit´
es d’un texte sont des probl`
emes omnipr´
esents en
informatique :
´
editeur de texte, moteur de recherche, bases de donn´
ees tex-
tuelles, analyse de s´
equences biologiques, compression
Contingences pratiques :
on travaille sur des donn´
ees de grande taille
il est imp´
eratif de trouver des algorithmes qui soient de petites
complexit´
es `
a la fois en temps et en espace
les donn´
ees sont des s´
equences de caract`
eres et n’ont pas de
structure explicite
d´
efinir des algorithmes rapides n´
ecessite de d´
efinir les structures
ad´
equates pour repr´
esenter et manipuler efficacement les cha
ˆ
ınes de
caract`
eres (structures pas trop coˆ
uteuses `
a construire et peu
gourmandes en espace)
2
Notations
Un alphabet Σ: un ensemble fini de symboles, appel´
es lettres ou
caract`
eres
Un motif ou un texte sur l’alphabet Σ: une suite de lettres de Σ
La longueur d’un mot w, not´
ee |w|: le nombre de lettres du mot
Le mot vide, i.e., le mot de longueur 0:ε
Par convention, on indice les lettres d’un mot `
a partir de 0:
w=w[0]w[1]. . . w[n1]avec n=|w|
La s´
equence de lettres partant de la position iet de longueur j:
w[i:i+j] = w[i]w[i+1]. . . w[i+j1]
Σ: l’ensemble de tous les mots sur Σ
Σ+: l’ensemble de tous les mots non vides sur Σ
3
Notations
Les pefixes de w:
Pref(w) = {x: il existe yΣtel que w=xy}
Les suffixes de w:
Suf(w) = {y: il existe xΣtel que w=xy}
Les facteurs de w:
Fact(w) = {z: il existe x,yΣtel que w=xzy}
Un pr´
efixe, suffixe ou facteur d’un mot west propre, s’il est diff´
erent de
wlui-mˆ
eme.
Exemple
w = abbaac
Pref(w) =
{ε, a,ab,abb,abba,abbaa,abbaac}
Suf(w) =
{ε, c,ac,aac,baac,bbaac,abbaac}
Fact(w) =
{ε, a,b,c,aa,ab,ac,ba,bb,aac,abb,baa,bba,
abba,baac,bbaa,abbaa,bbaac,abbaac}
4
Notations
Les pefixes de w:
Pref(w) = {x: il existe yΣtel que w=xy}
Les suffixes de w:
Suf(w) = {y: il existe xΣtel que w=xy}
Les facteurs de w:
Fact(w) = {z: il existe x,yΣtel que w=xzy}
Un pr´
efixe, suffixe ou facteur d’un mot west propre, s’il est diff´
erent de
wlui-mˆ
eme.
Exemple
w = abbaac
Pref(w) = {ε, a,ab,abb,abba,abbaa,abbaac}
Suf(w) = {ε, c,ac,aac,baac,bbaac,abbaac}
Fact(w) = {ε, a,b,c,aa,ab,ac,ba,bb,aac,abb,baa,bba,
abba,baac,bbaa,abbaa,bbaac,abbaac}
4
1 / 39 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !