Ces règles syntagmatiques sont là pour essayer d'accéder à un degré de
généralisation plus élevé.
Les règles de réécriture permettent d'identifier les constituants immédiats
d'un constituant donné.
Dans les règles, en partie gauche on trouve toujours des catégories.
Les mots sont des constituants terminaux.
Dans les règles, il y a des constituants terminaux et des catégories
syntagmatiques. Ces dernières peuvent être à gauche et à droite.
Notre grammaire fonctionne avec uniquement des catégories syntagmatiques à
gauche et jamais des mots.
Quelques définitions :
- Chaque point de rencontre entre deux lignes d'un arbre est appelé un nœud.
- Chaque ligne qui associe deux nœuds est appelée une branche.
- Dominance :
un nœud α domine un nœud β s'il existe un chemin descendant de α à β.
un constituant α domine immédiatement un constituant β si α domine β et
s'il n'existe pas de constituant γ qui est aussi dominé par α.
- Constituance :
β est un constituant de α si α domine β.
β est un constituant immédiat de α si α domine immédiatement β.
- Par analogie avec les arbres généalogiques, on parle de mère, fille et sœur.
- Une catégorie lexicale domine immédiatement un mot dont elle identifie la
catégorie grammaticale.
- Une catégorie syntagmatique domine immédiatement une ou plusieurs
catégories (soit lexicale, soit syntagmatique).
Ce type de grammaire est appelé grammaire indépendante du contexte (contexte
free grammar = CFG).
Pour avoir une CFG, il faut des règles du type AZ avec A représente un
élément unique non nul, Z est non nul et représente une suite d'un ou plusieurs
symboles, Z est distinct de A.
Ces règles syntagmatiques permettent d'exprimer l'ordre linéaire et des
relations de dominance.
La notion de dominance permet de faire des généralisations.
Les relations de dominance apparaissent dans les arbres mais aussi dans les
règles de réécriture : ce qui est à gauche domine immédiatement ce qui est à
droite.
On utilise ces règles pour décrire un grand nombre de langues.