CATÉGORISATION DE VERBES ASSERTIFS
d’un point de vue logique à un point de vue interactionniste
Valérie St Dizier De Almeida et Pierre Beust
GREYC CNRS UPRESA 6072
Université de Caen
Bd Maréchal Juin -14050 Caen Cedex
Tél : 02 31 56 73 98, Fax : 31 56 58 14
Résumé : L’article rapporte une recherche qui vise la conception d’une base de connaissances
évolutive pouvant constituer une partie de l’amorce d’un agent logiciel voué à la gestion des
interactions homme-machine. Si en DHM (Dialogue Homme-Machine), la catégorisation des
actes de langage se fonde essentiellement sur la taxonomie initialement proposée par Searle qui
permet de distinguer les actes de langage selon leur but illocutoire : assertifs, directifs,
commissifs, déclaratifs, nous pensons qu’il faut également que le système puisse faire la
distinction entre une simple information et une réprimande par exemple. Les travaux de
Vanderveken traitant des verbes illocutoires fournissent des éléments permettant d’opérer ce
type de distinction : ce sont les caractéristiques des composants de la force illocutoire des actes
de langage (Vanderveken, 1988). Dans son ouvrage, Vanderveken représente sous une forme
arborescente des relations entre verbes illocutoires. Cette forme de représentation est
difficilement exploitable pour le DHM (Dialogue Homme-Machine). Nous présentons ici une
catégorisation des verbes illocutoires assertifs obtenue grâce à la méthode Anadia. Cette
catégorisation (peu coûteuse du point de vue informatique car fondée sur des propiétés
suffisantes, mais non nécessaires) constitue une base performante pour l’interprétation et la
génération des énoncés.
Mots clés : Dialogue homme-machine, Verbes illocutoires, Catégorisation.
1
1. Introduction
Notre objectif est de participer à la conception de l’amorce d’une machine qui puisse gérer
une interaction verbale à la manière d’un humain. L’amorce est définie à partir d’un modèle de
la gestion des interactions langagières entre agents développé dans Nicolle et St Dizier De
Almeida (1998). Ce modèle que nous ne présentons pas ici intègre les résultats de différents
travaux : entre autres, un modèle de dialogue (Lehuen, 1997, Gérard et Nicolle, 1998), un
modèle de la temporalité (Gosselin, 1996), un modèle de la référence (Beust et Nicolle, 1998).
Le projet ici s’articule autour de la conception d’un modèle de l’interprétation sémantico-
pragmatique pour la relance interactionnelle. Dans ce cadre, nous proposons de fournir une
catégorisation des verbes illocutoires assertifs tels qu’ils sont définis dans Vanderveken (1988).
Ces verbes illocutoires sont d’un grand intérêt dans une perspective TAL (Traitement
Automatique des Langues) car ils sont porteurs d'informations tant pour déterminer la valeur
sémantique en terme de procès des énoncés que leur valeur pragmatique. Nous nous référons
en particulier au chapitre VI de l’ouvrage de Vanderveken “Les actes de discours (1988) au
cours duquel l’auteur applique l’appareil logique de la sémantique générale - qu’il développe
dans les chapitres précédents - à l’analyse lexicale des principaux verbes de la langue française.
Vanderveken (1988) définit différents verbes de type assertif en utilisant comme formalisme de
description les composants de la force illocutoire. Les définitions de verbes en ces termes nous
intéressent dans le sens chaque composant peut renvoyer dans le modèle Anadia - que nous
présenterons dans les grandes lignes - à des attributs susceptibles d’esquisser des catégories de
verbes. L’objet de cet article est de s’approprier de façon pertinente les propositions de
Vanderveken dans le contexte du DHM. En d’autres termes, il s’agit de montrer comment il est
possible de passer de la description faite par Vanderveken des verbes assertifs à une
catégorisation utile pour la gestion des interactions, et en particulier des interactions homme-
machine. Précisons que si nous nous focalisons sur les verbes illocutoires assertifs, ce n’est parce
que nous pensons que leur étude est suffisante à la gestion des interactions verbales, mais
simplement qu’ils peuvent constituer un point de départ intéressant dans cette perspective.
Dans une première partie, nous définissons le cadre théorique. Dans une seconde, nous
présentons les données à catégoriser (les verbes illocutoires assertifs) et dans une troisième, la
méthode de catégorisation utilisée. Enfin, nous restituons et commentons la catégorisation des
verbes à laquelle nous parvenons.
2. Cadre théorique
A la différence des modèles classiques en TAL qui cherchent à calculer le sens d’un énoncé
par des méthodes logiques de représentation des connaissances ou à remplir des bases de
données à partir d’informations littéralement exprimées dans les énoncés, notre objectif quant à
l’interprétation des énoncés consiste à déceler à partir des différents niveaux d’analyse des
énoncés (syntaxique, sémantique, pragmatique), des contraintes qui délimitent dans une
certaine mesure le champ des interprétations possibles pour un énoncé donné. Ces contraintes,
délimitent un potentiel de sens (Brassac, De Almeida, Grégori et Saint-Dizier, 1996 ; Brassac et
Stewart, 1996).
Dans le cadre de cet article, nous nous intéressons aux verbes illocutoires assertifs tels qu’ils
sont définis dans Vanderveken (1988). Ces verbes sont intéressants dans une perspective
TAL/DHM car ils constituent des indices qui véhiculent des informations tant sémantiques que
pragmatiques. Ces informations qui résultent d’un travail interprétatif sur la base d’indices
linguistiques lorsqu’elles sont mises en adéquation avec les éléments contextuels, forment des
contraintes permettant de délimiter un potentiel de sens.
3. Données à catégoriser
Il s’agit dans une perspective DHM, de fournir une catégorisation des verbes illocutoires
assertifs adaptée à l’interprétation et à la génération d’énoncés.
2
3.1. Les arbres illocutoires de Vanderveken
Vanderveken (1988) a mis à jour des relations d'engagement et d'implication entre verbes
illocutoires de la langue française. Il représente ces relations au moyen d'arbres qu'il nomme
arbres illocutoires. Les relations entre verbes pendent des composants de la force illocutoire
qui caractérisant chacun d’eux. Les composants de la force sont définis dans la partie 2.2.
L'arbre ci-après (Vanderveken, 1988 : 175) représente les relations entre différents verbes
assertifs dégagées par Vanderveken (les branches qui apparaissent en pointillé représentent
d'autres alternatives d'arbres possibles dues au fait - c’est l’auteur qui l’annonce - qu'une même
analyse sémantique peut donner lieu à plusieurs arbres).
Figure 1 : Arbres des verbes illocutoires assertifs de Vanderveken
3.2. Les composants de la force illocutoire
Les composants impliqués dans la constitution de la force illocutoire des actes de langage
ont été définis par Searle et Vanderveken (1985). Ils distinguent au total sept composants :
1- le but illocutoire : il traduit l'aspect intentionnel de l'acte, ce qui est visé lors de
l’accomplissement de l’acte. Le but détermine aussi la direction d’ajustement de l’acte - le
rapport entre le contenu propositionnel et le monde. Cinq types de but ou force illocutoire sont
développés :
* les assertifs : leur but est d’engager le locuteur des degrés divers) à la vérité de la
proposition exprimée, à ce que quelque chose soit effectivement le cas (direction d’ajustement :
les mots s’ajustent au monde),
* les directifs : leur but est d’obtenir que l’auditeur fasse quelque chose (direction
d’ajustement : le monde s’ajuste aux mots),
* les commissifs : leur but est d’engager le locuteur à l’accomplissement d’une action future
(direction d’ajustement : le monde s’ajuste aux mots),
* les expressifs : leur but est d’exprimer l’état psychologique du locuteur (la direction
d’ajustement est vide),
* les déclaratifs : leur but est de changer l’état du monde par l’énonciation même de ce type
d’actes (la direction d’ajustement est double : les mots s’ajustent au monde et le monde s’ajuste
aux mots)
2- le mode d'accomplissement : il détermine la manière dont le locuteur doit atteindre le but
; « le mode d’accomplissement (...) détermine comment son but doit être accompli sur le
contenu propositionnel lors de l’accomplissement d’un acte ayant cette force « (Vanderveken,
1988 : 113),
3
3- les conditions de contenu propositionnel : ce sont les contraintes syntaxico-sémantiques
qui pèsent sur l’expression linguistique de la proposition représentant les conditions de
satisfaction de l’acte,
4- les conditions préparatoires : elles représentent les états de chose que le locuteur
présuppose ou tient pour vrais lors de l’accomplissement de l’acte ; elles concernent des
propriétés du locuteur, de l’auditeur, de leurs relations et du monde,
5- les conditions de sincérité : elles déterminent le mode des états mentaux que le locuteur
devrait avoir s'il voulait accomplir sincèrement un certain type d'acte,
6- le degré de puissance : il détermine l'intensité avec lequel le but illocutoire est atteint, il
est fonction de l’engagement du locuteur,
7- le degré de force : il mesure le degré d'expression d'états psychologiques.
3.3. La définition des verbes illocutoires assertifs
Pour les besoins de la catégorisation nous avons, à partir de la présentation de Vanderveken,
répertorié les composants caractérisant chaque verbe. Les définitions des verbes assertifs
auxquelles nous parvenons figurent en annexe.
4. La méthode de catégorisation : Anadia
La méthode Anadia constitue une assistance à la construction, à partir d’un ensemble d'objets,
de catégories qui aient de bonnes propriétés algébriques. Pour être optimale, une représentation
catégorielle n'a pas besoin d'être complète, elle doit être suffisante pour différencier toutes les
entités qui sont visées comme différentes. La méthode de catégorisation mise en place dans
Anadia est basée sur l’interdépendance entre les représentations de chaque entité. Il ne s’agit pas
de décrire l’essence de chaque entité mais de proposer une grille qui permette de faire les
différences pertinentes pour interpréter ou produire des énoncés langagiers. Les concepts mis en
jeu dans le modèle sont les suivants:
Attribut : propriété que l'on peut ou non attribuer à une chose. Un attribut est spécifié par les
valeurs possibles de la propriété (par exemple, l'attribut lié à l'état physique d'une matière est
décrit par les valeurs solide, liquide, gazeuse).
Registre : ensemble d'attributs.
Table : combinatoire des valeurs des attributs d'un registre.
Sélection : places de la table reconnues valides (on peut les nommer et en donner des exemples)
Topique : graphe des relations entre les places sélectionnées. La relation entre deux places est
un nombre de différences de valeurs d'attributs. La topique la plus intéressante est la topique
des différences sur une valeur d'un attribut, qu'on appelle "différence à un trait près". Les
topiques révèlent la structure du domaine initial relativement aux attributs considérés. Si toutes
les places ont été sélectionnées, la topique des différences à un trait près est un graphe complet
et tous les attributs choisis sont indépendants et pertinents.
L'intérêt d'Anadia n'est pas uniquement son résultat en terme de représentations
systémiques mais consiste également dans le processus interactif mis en place pour y parvenir,
via notamment le choix des attributs, la formation des registres (c'est à dire considérer les
attributs au bon niveau) et la reconnaissance des catégories effectives. Ces dernières imposent
une réflexion fructueuse sur les concepts d'un domaine avant d'en concevoir un modèle. Les
répercutions de ces choix sont directement analysables en terme de propriétés algébriques du
modèle qu'Anadia permet de réaliser. Parmi ces propriétés on peut par exemple citer les notions
de dépendance et de subordination des attributs (Nicolle et Beust, 1997) et l'importance des
catégories vides dans la table (Beust, Delépine, Nicolle, Coursil, 1996).
5. Application à la catégorisation des verbes assertifs
5.1. Problématique
Situés dans une perspective interactionniste en DHM, nous ne pouvons nous satisfaire des
arborisations de Vanderveken développées dans une perspective logique et figée. En effet, les
arbres de Vanderveken ne reflètent pas une catégorisation fonctionnelle - i.e. exploitable dans le
4
cadre de la gestion des interactions homme-machine - , mais ils découlent d’un travail logique.
Dans les arbres illocutoires, “un verbe est le successeur immédiat d’un autre verbe si et
seulement si la force illocutoire qu’il nomme peut être obtenue à partir de la force nommée par
l’autre par l’ajout de nouvelles composantes ou l’augmentation du degré de puissance”
(Vanderveken, 1988 : 174). Ainsi, les arborisations sont une représentation d’un travail logique
qui n’a a priori pas d’équivalence avec une arborisation qui rendrait compte d’une
catégorisation qui soit efficace et exploitable dans une perspective DHM interactionniste.
Quoi qu’il en soit les définitions de Vanderveken fournissent des éléments sur ce qui peut
distinguer des groupes de verbes et sur les similitudes qu’entretiennent entre eux les verbes
illocutoires assertifs. Les distinctions et similitudes sont exprimées dans les termes de la logique
illocutoire, c’est à dire en termes de composants de la force. C’est donc dans ce formalisme que
nous proposons des attributs dont les valeurs vont permettre de dissocier des catégories de
verbes.
5.2. Application de la méthode Anadia
La méthode Anadia nous a conduit à rejeter plusieurs formes de catégorisation qui ne
répondaient pas aux critères précédents : trop de catégories vides étaient générées et/ou des
mêmes attributs avaient besoin d’être réutilisés à de nombreuses reprises pour générer de
nouvelles catégories. Après avoir éliminer les catégorisations ne respectant pas de bonnes
propriétés algébriques, nous n’avions à faire le choix que parmi deux catégorisations. L’une
partait de l’attribut premier « mode d’accomplissement ou degré de puissance » et l’autre de
l’attribut « conditions préparatoires ». Pour faire un choix parmi ces deux catégorisations, nous
avons éprouvé les catégorisations relativement à l’objectif DHM qui est de fournir des catégories
autorisant un même type d’enchaînement conversationnel. Nous observons que le mode
d’accomplissement et le degré de puissance sont des composants qui présentent comme
particularité de se modifier au gré des relations sociales, des contrats d’interaction. Partant, c’est
la catégorisation reposant sur les attributs premiers « conditions préparatoires » que nous avons
retenue.
5.3. Le catégorisation retenue
Les attributs utilisés renvoient à des conditions préparatoires de la force illocutoire.
L’attribut de niveau 0 permet de scinder les verbes de type assertif en trois catégories. Cet
attribut renvoie à la qualité de l’état de choses représenté dans le contenu propositionnel de
l’acte de langage qui contient le verbe. L’état de choses représenté peut être mauvais, bon ou
neutre. Ainsi l’attribut possède trois valeurs : bon - mauvais - neutre. Sur la base de ces valeurs,
voici comment se distribuent les verbes assertifs (cf. Annexe A) :
BON : vanter - se vanter - louer (catégorie A)
MAUVAIS : critiquer - dénoncer - confesser - réprimander - blâmer - accuser - se lamenter -
se plaindre - admettre/reconnaître - avouer (catégorie B)
NEUTRE : contester - maintenir - assurer - certifier - déclarer - suggérer - relater - rappeler -
informer - témoigner - attester - jurer - confier - proclamer - asserter - penser - conjecturer - dire
- prédire - insister - soutenir - notifier - s’objecter - contredire - démentir (catégorie C)
La catégorie B peut se scinder en trois autres catégories. L’attribut en question concerne la
relation que les interlocuteurs entretiennent avec le contenu représentationnel véhiculé par P.
Cet attribut possède trois valeurs qui sont les suivantes : P concerne A (A = le locuteur) - P
concerne B (B = l’allocutaire) - P concerne une personne qui est ni A, ni B. Voici comment les
verbes de la catégorie B se distribuent relativement aux valeurs de l’attribut mentionné :
P CONCERNE A : confesser - se lamenter - se plaindre - admettre/reconnaître - avouer
(catégorie B1)
P CONCERNE B : blâmer - accuser (catégorie B2)
5
1 / 14 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !