T
Tu
ut
to
or
ri
ie
el
l
4
4
M
Mé
ét
ta
a-
-e
ex
xp
pr
re
es
ss
si
io
on
n
r
ré
ég
gu
ul
li
iè
èr
re
e
1
1.
.
I
IN
NT
TR
RO
OD
DU
UC
CT
TI
IO
ON
N
Dans le tutoriel 3 vous avez appris à formuler des requêtes simples. Il
s’agissait de méta-expression régulière atomique (MERA). Ces expressions
permettaient de décrire des ensembles de mots. Dans ce tutoriel, vous apprendrez à
formuler des requêtes plus complexes qui permettront de décrire des ensembles de
suite de mots.
2
2.
.
R
RE
EQ
QU
UE
ET
TE
E
S
SU
UR
R
D
DE
ES
S
M
MO
OT
TS
S
I
IS
SO
OL
LE
ES
S
:
:
M
ME
ET
TA
A-
-E
EX
XP
PR
RE
ES
SS
SI
IO
ON
N
R
RE
EG
GU
UL
LI
IE
ER
RE
E
A
AT
TO
OM
MI
IQ
QU
UE
E
(
(R
RA
AP
PP
PE
EL
L)
)
Une méta-expression régulière atomique (MERA) est une formule logique, sur
les noms de propriétés, les chaînes de caractères et les expressions régulières.
Un mot est décrit par la MERA si l'expression logique associée est « vraie » pour
le mot en question.
Un exemple de MERA est : [lemme="entraîner" & ems~"^VIND"]. Cette MERA
décrit tous les mots dont l'étiquette « lemme » est « entraîner » et l'étiquette
« ems » commence par « VIND ». Il s'agit donc d'une recherche du verbe entraîner
conjugué à l'indicatif.
[] est une MERA spéciale décrivant n'importe quel mot. En fait [] est
équivalent à [true].
3
3.
.
R
RE
EP
PE
ET
TI
IT
TE
EU
UR
R
D
DE
E
M
ME
ER
RA
A
:
:
M
ME
ET
TA
A-
-E
EX
XP
PR
RE
ES
SS
SI
IO
ON
N
R
RE
EG
GU
UL
LI
IE
ER
RE
E
E
EL
LE
EM
ME
EN
NT
TA
AI
IR
RE
E
Il est possible d'adjoindre un répétiteur pour répéter la MERA un certain
nombre de fois. Un répétiteur est de la forme {x, y}, avec x
y, où x est le nombre
minimum de fois où la MERA doit être répétée et y le nombre maximum de fois.
Il existe aussi des répétiteurs prédéfinis :
« * », pour dire un nombre quelconque de fois, est équivalent à {0,
LONG_MAX1} ;
« + » , pour dire au moins une fois, est équivalent à {1, LONG_MAX} ;
« ? » , pour dire zéro ou une fois, est équivalent à {0, 1}.
L'ensemble constitué par la MERA et son répétiteur associés sera appelé
meta-expression régulière élémentaire (MERE).
4
4.
.
R
RE
EQ
QU
UE
ET
TE
E
S
SU
UR
R
D
DE
ES
S
G
GR
RO
OU
UP
PE
ES
S
D
DE
E
M
MO
OT
TS
S
:
:
M
ME
ET
TA
A-
-E
EX
XP
PR
RE
ES
SS
SI
IO
ON
N
R
RE
EG
GU
UL
LI
IE
ER
RE
E
Une méta-expression régulière (MER) peut être vue comme une expression
régulière sur les MERA. Il est donc possible de juxtaposer une ou plusieurs MERA
pour décrire des suites de mots mais il est aussi possible d'utiliser les
parenthèses « ( » et « ) », un opérateur de disjonction « | », un opérateur de
conjonction « & » ainsi que les répétiteurs2 décrits dans la section précédente
(section 3).
Par exemple, la MER identifiant les verbes conjugués suivis de verbe à
l'infinitif au sein d'une même phrase pourra s'écrire :
[ems~"^V" & ems!~"^VINF|^VPARP"] [ems!~"^V" & ems!~"^PCTFORTE"]* [ems~"^VINF"]
1 LONG_MAX est égal au plus grand entier de type long que la machine peut
représenter.
2 Les répétiteurs peuvent être utilisés sur une MERA comme décrit dans la
section 3, mais également sur une méta-expression régulière entre parenthèses !
où la première MERA désigne un verbe qui n'est ni à l'infinitif, ni au participe
présent ni au participe passé, la seconde une suite de mots sans verbe ni
ponctuation forte, et la dernière un verbe à l'infinitif.
5
5.
.
M
MA
AI
IN
NT
TE
EN
NA
AN
NT
T,
,
O
ON
N
P
PA
AS
SS
SE
E
A
AU
UX
X
C
CH
HO
OS
SE
ES
S
S
SE
ER
RI
IE
EU
US
SE
ES
S
!
!
1) Ecrire une MERA qui décrit les verbes conjugués.
2) Modifiez la MERA pour ne pas avoir les formes du verbe « être » et du verbe
« avoir ».
3) Ajoutez une MERA pour que le verbe soit suivi d’un déterminant.
4) Ecrire une MER qui décrit des successions de trois ou quatre verbes.
5) Modifiez la MER pour que le dernier verbe soit à l’infinitif.
6) Ecrire une MER qui décrit les séquences du type : déterminant, nom-commun,
verbe conjugué, adjectif.
7) Ecrire une MER qui décrit les séquences du type qui suit. Verbe conjugué suivi
de 2 à 4 séquences de : 0 à 5 mots, autre que des verbes, suivis d’un verbe à
l’infinitif. Le tout au sein d’une même phrase.
Exemple : « ferait semblant de mourir pour échapper ».
R
Re
em
ma
ar
rq
qu
ue
e
1
1
:
:
a
ai
id
de
e
c
co
om
mp
pl
lé
ém
me
en
nt
ta
ai
ir
re
e
Pour une description plus détaillée de la syntaxe des différents
formalismes, ne pas hésiter à se référer à la documentation (dans la barre de menu
de l’application CooLoX, faire Aide`Méta expressions régulières).
R
Re
em
ma
ar
rq
qu
ue
e
2
2
:
:
s
st
tr
ra
at
té
ég
gi
ie
e
d
de
e
r
re
ec
ch
he
er
rc
ch
he
e
d
de
e
C
Co
oo
oL
Lo
oX
X
CooLoX conserve-t-il tous les segments retournés par la MER ?
Quand une MER retourne plusieurs segments de texte commençant à une même
position, seul le segment le plus long est conservé.
Comment CooLoX recherche-t-il les segments de texte décris par la MER ?
La recherche du prochain segment commence au mot suivant la fin du dernier
segment retourné.
Par exemple, pour la phrase « Il est venu. », la MER [ems~"^V"]{1,2} décrit
les segments {est}, {est venu}, {venu}. Le segment {est} est ignoré puisqu’il
existe le segment {est venu} plus long. Le segment {venu} est également ignoré
puisque la recherche poursuit au mot suivant la fin du dernier segment retourné,
c’est à dire le « . ».
1 / 2 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !