La syllabisation automatique du français

Téléchargement

syllabisation automatique

français

par

Nina CATACH

Vincent MEISSONNIER

L./.S.H.

C.N.R.S.

PARIS

165

Actes du Congrès international informatique et sciences humaines

syllabisation intervient dans

multiples opérations

que

l'on

peut

s'efforcer de réaliser sur

les

textes.

plus

connue,

absolument

nécessaire

pour

les

coupures en fin de ligne

justification àdroite en

cas de

composition

non manuelle,

est

celle qui est

actuellement

utilisée dans l'édition (des journaux

en particulier). Elle se fait en emmagasinant (déjà coupés en syllabes), les

mots

d'un

lexique complet,

par exemple

contenu

d'un

ou plusieurs dictionnaires. Pour l'anglo-américain,

cette

opération

est

difficile

que

les

correcteurs utilisent

constamment

le Webster, où

toutes

les

coupures syllabiques de

mots

sont

déjà indiquées,

d'où

perte

temps

considérable.

frllnçais,

syllabisation est de

type

essentiellement phonologique; ce qui nous apermis à

fois

d'en

faire une analyse systématique, avec relativement peu

d'exceptions,

de réaliser

conjointement

deux

types

coupures

automatiques

également

importantes:

coupures graphiques

(d'une

chaîne

écrite)

coupures

phoniques

(d'une

chaîne au préalable phonétisée).

Les

applications

ces

deux

types

coupures viennent

immédiatement

l'esprit:

analyse de vérifi-

cations

fichiers, recherches linguistiques, littéraires, poétiques,

rythme,

d'intonation,

de fréquences

groupes

lettres

sons, enseignement assisté sur

ordinateur

(avec couplage des chaînes gra-

phiques

phonétiques correspondantes

éventuellement des courbes mélodiques), conversion auto-

matique graphème-phonème, en vue

passage àla synthèse

parole, etc. C'est essentiellement

en vue

cette

dernière application

que

nous avons accompli ce travail.

Les

recherches

sur

les

syllabes,

point

vue acoustique-articulatoire,

sont

loin

pouvoir être

considérées

comme

définitives:

au contraire,

les

travaux

ces dernières années

ont

fait

apparaître

nombreux

points

discordance entre

les

linguistes àce sujet.

Sur

plan graphique, les seules expériences

que

nous pouvons citer

sont

des recherches

fréquences

des syllabes dans

les

listes de mots

dans

les

textes

(Chavasse, 1948; Verglas, 1962; Baudot,

1968;

Moreau,

1972;

voir Bibliographie).

Pour

notre

part, nous nous en sommes

tenus

pour

l'instant

dans ses grandes lignes au

découpage·

traditionnel, tel qu'il se

pratique

couramment,

tenant

compte

àl'écrit des habitudes de l'usage, à

l'oral des descriptions faites jusqu'ici

pour

français

standard

par

Léon, Delattre, etc. Ceci,

pour

des

~aisons

d'applicabilité immédiate.

FONDEMENTS LINGUISTIQUES

Modèle général de description

nous avons respecté dans ses grandes lignes le découpage tel qu'il

pratique,

faut souligner

que

notre programme ne

constitue

pas une simple liste de mots coupés,

un assemblage de règles

trou-

vées

uniquement

par l'expérience, mais

que

nos règles

s'efforcent

relever

d'une

théorie générale

des

rapports

entre

graphèmes

phonèmes en français,

fonctionnement

notre

système

d'écriture

(voir

Catach,

1979

1980).

167

Actes du Congrès international informatique et sciences humaines

Brièvement, disons

qu'à

notre

avis,

malgré

les apparences, ce système est essentiellement phonolo-

gique, ce

que

confirme

d'ailleurs

fonctionnement

relativement régulier de

notre

découpage syllabique.

Certes,

français

connaît

des

coupures

type

morphologique (sur les préfixes vivants en particulier).

Mais il

n'y

là

rien

comparable

aux

coupures

étymologiques, morphologiques

sémantiques

l'anglais par exemple.

Exemple:

té-Ié-spec-ta-teur

(à

cause de télévision, téléreportage, etc.;

mais té-Ies-co-pe (le sens du préfixe

s'est

perdu);

ra-dio-scrip-teur, mais des-crip-tion, res-tric-tion, etc.;

dé-struc-tu-rer, mais des-truc-tion, etc.

Deuxièmement,

l'unité

pour

nous

n'est

pas

lettre, mais le graphème,

formé

soit

d'une

lettre,

soit

d'un

groupe

lettres, assurant

correspondance

avec une

unité

orale.

Nous avons ainsi dégagé

unités graphiques environ,

dont

l'ensemble

est

tellement

régul ier qu'il

peut

fonctionner

sans

contexte,

par simple appel à

une

table

d'équivalences.

Cette

table

substitue,

dans

%des cas, à

tout

examen

particulier des rencontres de lettres.

Exemple:

ch, gu, gn, ph,

seront

appelées des consonnes,

comme

b, c, d, f, etc.

ai,

au, eau, ei, eu

seront

appelées des voyelles,

comme

etc.

Les

voyelles accentuées également.

Nous avons représenté

chaque

classe de graphèmes ainsi déterminés, les accents, les blancs,

ponctu-

ation, par des

entités

par des symboles, ce qui nous

permet

de formaliser au

maximum

nos

règles:

Exemple:

C(consonnes)

est

noté

V(voyelles)

est

noté

B(blancs) est

noté

les

accents

sont

notés

ponctuation

est

notée

"1"

"&"

en chaîne graphique

Cas particuliers

Nous avons

accordé

un soin

tout

particulier

aux

problèmes

que

posent

malgré

tout

les

coupures

sylla-

biques du français, àl'écrit

àl'oral.

Ces problèmes

sont

essentiellement:

les

coupures

morphologiques des préfixes vivants, les groupes

consonnes +Iiquides, les semi-voyelles

groupes de voyelles, les voyelles nasales, les voyelles

muettes

fi-

nales(e caduc).

plus, il y a

certain

nombre

d'exceptions

enfin,

naturellement,

des ambiguités.

Nous avons parlé

des

préfixes.

ce qui

concerne

les groupes

consonnes

+Iiquides, qui ne

sont

jamais séparables (cer-cle, prê-tre,

etc.),

nous afallu ne pas inclure les liquides

Let

Rparmi les

168

Actes du Congrès international informatique et sciences humaines

consonnes.

question

pose

surtout

pour

des

mots

comme

loua/coua, liant/client, lier/crier, où

présence

d'un

groupe

consonne

+Iiquide change<la syllabisation

semi-voyelle, àl'écrit

àl'oral.

qui

concerne

les groupes

voyelles, en général seule

présence

d'un

accent

d'un

tréma

permet

couper

entre

les voyelles :a-è-de, a-é'rien, etc.

Les

voyelles nasales

ont

cette

caractéristique qu'elles

forment

une

seule syllabe

devant

consonne

blanc,

deux

syllabes

devant

une

voyelle (elles se dénasalisent)

Exemple:

an /â-ne

moins /moi-ne

un /u-ne, etc.

Les

finales e, es,

ent

(règne, règnes, règnent, etc.)

posent,

comme

les ecaducs internes,

sérieux

problèmes de syllabisation

phonétisation,

qu'il nous afallu résoudre.

plus,

faut

couper

différemment

des mots

comme

cli-ent

ils

plient, affluent

ils

affluent, etc. (ambigul'tés).

Règles générales

syllabisation

Une fois traités ces problèmes, on

remarque

que

conformation

standard

d'une

syllabe en français

est, àplus

fondamentalement

type:

C + V(consonne +voyelle).

Les

règles principales

sont

les suivantes

(à

l'écrit) :-Une voyelle seule

peut

constituer

une

syllabe -Elle

n'a

besoin en prin-

cipe

que

d'une

seule

consonne

avant elle

pour

soutenir,

les autres faisant partie de

syllabe précé-

dente:

exemple:

exemp-ter, promp-ti-tu-de. C'est

loi de

1ère

consonne

(exception:

les groupeS

consonnes +liquides) -

Les

groupes

consonnes àl'initiale ou à

finale ne

sont

jamais

coupés

règle générale,

coupe

entre

deux

consonnes

- Y

X(et 1

=yod) ne

sont

principe jamais

coupés (mais on

peut

couper

yo-yo, deu-xiè-me), etc.

total,

nous pouvons dire

que

notre

programme, qui

comprend

120 règles

seulement

(dont

6excep-

tions

règles de préfixes),

permet

d'obtenir

des

coupures

écrites

type

classique

(coupures

entre

les mots graphiques, mais

cependant

pas

coupure

sur

l'apostrophe)

tout

àfait satisfaisantes, sur

n'importe quel texte

français.

syllabisation

phonique

Apartir

texte

phonétisé

que

nous

obtenons

avec

notre

programme

phonétisation

automatique,

nous,pouvons, sur des bases légèrement différentes,

une

même

procédure

règles

réécriture,

comprenant

àgauche une

transcription

phonétique,

découper

cette

suite de

phonèmes.

Les

principales différences

entre

syllabe écrite.

syllabe orale, en français

standard,

sont

les

suivantes:

Les

syllabes

comprenant

muet

sont

supprimées,

exemple:

Actes du Congrès international informatique et sciences humaines

syllabes

graphiques

syllabes

phoniques

cè-de(s,

ent)

SeD

(e =e

ouvert)

rè-gne{s,

ent)

Re%

=gn)

rè-gle(s,

ent)

ReGL

SYLLABES

SYLLABE

Les

coupures entre

les

mots ne sont pas régulières: elles

peuvent

apparaître

disparaître

selon les

cas

(nous

avons prévu les

deux

possibilités). Les liaisons

sont

rejetées au

début

mot

qui

suit,

exemple:

-les

yeux

......

ZYE

(& =e

fermé)

petit

enfant........y PETI T*

F*'

=AN)

bien-aimé

---+

BYe Ne

-X,

ILL peuvent être coupés,

exemple:

-hexa-go-ne

---4

eG-ZA-GON

taxi

noya

billet

---4

TAK-SI

-4

NWA-YA

-BI-Ye

II. LES

FFERENTES

ETAPES

PROGRAMME

A. Les

trois

étapes

syllabisation

Nous

sommes

passés par

certain

nombre

d'étapes

que

nous

appelons

SYLLAB.1,

SYLLAB.2,

SYLLAB.3.

L'étape

SYLLAB1

présentait

les

caractéristiques

suivantes:

1) Elle suivait

très

près

l'analyse

linguistique

mentionnée

plus

haut;

2) Elle

fonctionnait

droite

gauche;

Elle utilisait

certain

nombre

codes

d'entités:

Exemple:

:syllabe

formée

par

concaténation

contexte;

syllabe

formée

par

disjonction

contexte.

4) Elle

fonctionnait

sur

les

graphèmes

réguliers classés

par

catégories

(voyelles

accentuées,

non

accentuées,

consonnes,

semi-voyelles,

groupes

consonnes

+liquides,

etc.).

Cette

étape

analytique

été

nécessaire

pour

affiner,

enrichir

vérifier nos

règles:

ainsi,

nous nous

170

Actes du Congrès international informatique et sciences humaines

1 / 10 100%

Documents connexes

Le langage dans toutes ses dimensions : l`oral

Voici le jeu de cartes à imprimer

Charte_phonèmes français

Progression découverte des réalités sonores du langage

V 02 - Soutien 67

Le déserteur

L 3 LIRE

Aspects de la grammaire française

La syllabe - Nono l`instit

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

La syllabisation automatique du français

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

La syllabisation automatique du français

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib