Syntaxe

publicité

Traitement automatique des langues naturelles
Syntaxe"
Hervé Blanchon
d’après Jean-Yves Antoine
http://www.info.univ-tours.fr/~antoine/Linguistique.html
Syntaxe"
o  Syntaxe : modélisation des règles de construction des énoncés d’un
langage à partir des éléments du vocabulaire sur lequel il est construit :
grammaire du langage
n  langages naturels
n  langages artificiels
o  programmation informatique, mathématiques, logique, calcul
symbolique, etc...
o  Jugement de grammaticalité : énoncé appartenant ou non au langage.
n  programmation
o  vérification du programme par le compilateur
n  mathématiques
o  contrôle de parenthésage des expressions arithmétiques ou
symboliques, correction d’un raisonnement logique...
n  langage naturel
o  grammaticalité d’un énoncé difficile à circonscrire
o  grammaire de la langue reflétant bien souvent une volonté, de
normalisation (Bescherelle, Grevisse dans une moindre mesure).
Syntaxe et grammaticalité"
o 
Qu’est qu’un énoncé grammaticalement correct ?
o 
jugement normatif usage fréquent attesté
o 
Les agrammaticalités comme indices d’évolution diachronique [Gadet 1992]
Des exemples jugés non grammaticaux à un moment donné sont acceptés
progressivement du fait de leur usage de plus en plus fréquent.
o 
morpho-syntaxe
n  mouler le café, agoniser d’injures, s’assir
n  visionner
à partir de
voir
n  réceptionner
à partir de
recevoir
n  becter à partir de
becqueter
n  magne-toi
à partir de
manier
o 
Syntaxe :
n  relatives
o  un copain que j’ai passé mon enfance avec lui
o  une ville où il y fait bon vivre
n  chute du discordantiel ne
Certains principes linguistiques
semblent cependant toujours devoir être respectés
Structure syntaxique"
o  Caractériser les relations formelles entre les différents éléments de
l’énoncé
n  langages artificiels
o  correspondance biunivoque avec le sens de l’énoncé
n  langages naturels
o  pas d’identité : dépend du sens mais ne le fonde pas.
o  Exemples
Structure syntaxique"
o  Langage naturel
n  dépendances syntaxiques : prédicat / argument ; dominant / dominé)
n  fonctions syntaxiques : sujet, objet, attribut, etc...
o  Grammaires de constituants ou syntagmatiques [Chomsky 1956]
n  regroupement d’éléments de l’énoncé en sous-parties possédant une
structure interne et une unité cohérente (syntagmes , groupe, ou
constituants)
le petit chat
est entré
dans le jardin potager
n  regroupements récursifs jusqu’à arriver à un constituant regroupant
toute la phrase
n  structure syntaxique : relations entre constituants
o  Grammaires de dépendances [Tesnière 1959]
n  pas de structures syntagmatiques intermédiaires : dépendances entre
mots
Approche syntagmatique"
o  Formalisation des grammaires traditionnelles
o  Vision hiérarchique des la construction de l’énoncé
o  Autres principes (transformations ; structure de surface / structure
profonde ; compétence / performance) non étudiées ici.
Syntagmes de base"
o  Syntagme (Phrase en anglais) ou constituant
n  groupe élémentaire de mots contigus répondant au même
comportement syntaxique
n  exemple : accord en genre et en nombre
n  tête : mot principal qui caractérise le syntagme syntaxiquement et
sémantiquement
o  Principales classes de syntagmes
n  nominaux
SN (NP) tête : nom ou pronom
n  verbaux SV (VP) tête : verbe
n  prépositionnel SP (PP) tête : préposition"
(ou nom introduit suivant la théorie)
n  adjectivaux
SAdj (AdjP)
tête : adjectif
Proposition"
o  Proposition (clause)
n  Partie d’énoncé regroupant d’une part un groupe verbal avec son
sujet et tous ses autres compléments et pouvant être interprété de
manière indépendante
n  forme générale SN (sujet) + SV (prédicat)
n  Exemple
le peintre observe la ville de Chartres depuis la cathédrale
[ leDET peintreNC ]SN [ observeV [ laDET [ villeNC [ dePREP [ ChartresNP]GN]GP]GN]SN
[ depuisPREP [ laDET cathédraleNC ]GN ]SP ]SV ]P
o  Énoncé (sentence ou utterance)
n  Simple une seule proposition S = P
n  Complexe plusieurs propositions
Représentation arborescente"
Énoncés complexes"
o  Enchâssement
n  Enoncé = proposition_principale + (propositions subordonnées)
o  [il ne sait jamais] [où se trouvent ses clefs]
o  [à chaque fois que le facteur arrive] [mon chien aboie sans cesse]
o  [il partit] [dès qu’elle arriva]
n  Enchâssement dans un syntagme
o  relative
n  [ si je connaissais l’enfant de gredin [ qui m ’a volé mon nain de jardin ] ]
o  complétive
n  [ je cherche [à partir ] ]
n  [ je suis content [de partir ] ]
o  syntagmes récursifs
o  Coordination
n  Propositions
o  [j’ai reposé le corps] puis [j’ai appelé la police]
o  [il m’aime] et [il me déteste] tout à la fois
n  Syntagmes
o  Je prendrai [ma 2 CV] ou [ma Ferrari]
Fonctions syntaxiques"
o  Lien entre syntaxe et sémantique
n  manifestation du rôle fonctionnel des mots dans l’énoncé
n  relation (non univoque) entre fonction syntaxique et rôles sémantiques
o  Jean mange la pomme AGENT = Sujet (actif)
o  La pomme est mangée par Jean OBJET = Sujet (passif)
o  Fonctions syntaxiques
n  prédicat
o  verbe de la proposition
n  sujet
n  complément
o  objet
o  objet indirect ou attribution
o  « circonstanciel » (modifieur)
Grammaires syntagmatiques"
o  Grammaire
n  Grammaire descriptive (règles de formation) et non normative
(Bescherelle)
o  Grammaire syntagmatique
n  Règles de dérivation des syntagmes
o 
o 
o 
o 
GN è DET ADJ NC
GN è DET NC PREL
GV è V
S è GN GV le petit oiseau
l’homme qui arrive
vole
le petit oiseau vole
n  Grammaires formelles [Chomsky 1956]
n  Structure syntaxique : arbre d’analyse de l’énoncé par la
grammaire.
n  Interdépendances des règles lors de leur définition : difficultés
de maintenance
Grammaires syntagmatiques : Attributs"
o  Traits morpho-syntaxiques pour la gestion des accords
o  Grammaire syntagmatique
n  Règles de grammaires avec attributs :
o 
GN[g,n] è DET [g,n] ADJ [g,n] NC [g,n]
o  Structure syntaxique
n  Intégration des traits morphologiques à la représentation
n  Exemple : le petit oiseau
Approche par dépendances"
o  Syntaxe structurale de Tesnière [Tesnière 59]
n  approche lexicalisée : relation entre mots, sans structure intermédiaire
n  stemma : structure de dépendances syntaxiques entre mots
n  prédicat : verbe dominant la structure de l’énoncé
n  compléments
o  actants (sujet, objet ou patient, bénéficiaire)
o  circonstants
o  pas de rôle particulier du sujet
n  exemple : le peintre observe la ville de Chartres depuis la cathédrale
Téléchargement