Les erreurs dans la production écrite de documents rédigés en

ELÉMENTS DE STRATÉGIE DE CORRECTION
AUTOMATIQUE DE TEXTES : LE CAS DES
FRANCOPHONES SEXPRIMANT EN ANGLAIS
Camille Albert
(
CAS
),
(),
Marie Garnier (CAS),
Arnaud
Rykner
(LLA)
Arnaud
Rykner
(LLA)
Patrick Saint-Dizier (IRIT)
Toulouse
-
France
Toulouse
France
SOMMAIRE
éfi i i d j
1.D
éfi
n
i
t
i
on
d
upro
j
et
Motivationetobjectifsduprojet
Méthodologie de travail
Méthodologie
de
travail
2.Constitutionducor
p
us
p
Nature,phasesdelaconstitutionetparamètresd’analyseducorpus
3.Détectionetlacorrectiondeserreurs:unprocessusdynamique
Laclassificationdeserreurs:troisphasesd’analyse
espr
nc
pes
anno
a
on
eserreursencorpus
Unexempled’interaction:correcteurinternet
L
induction des gles de correction
L induction
des
gles
de
correction
Conclusion:
p
ers
p
ectivesdu
p
ro
j
et
pp pj
DÉFINITION DU PROJET
Objectif:
Objectif:
Motivation:
Taux d’erreur
Mail: 1erreur/l
Objectif:
Procédures de correction de
classes d’erreurs non traitées par
les éditeurs de texte
Mail: 1erreur/l
.
Publi: 3 erreur/p.
Corpus
Corpus:
les éditeurs de texte
-niveaux de contrôle:
--- emails, forums, blogs
+++
pub
li
s
,
r
appo
r
ts
Démarche
éi tl
-contextes,
p
pub s
, appo ts
-domaines de spécialité
-contextes, public.
exp
é
r
i
men
t
a
l
e
Méthodologie
detravail
empirique:observationducorpus
d’annotationsetinductionderègles
pairedelangueanglaisfrançais
Niveaux
lexique
Niveaux
linguistiques
deserreurs
lexique
syntaxe
styleettexte
ETAT DE LART
|Diversoutilsinformatiquesdecorrectionautomatique:
Word
liil tit S llCh k t
BPt
Cdil2008
l
og
i
c
i
e
l
sgra
t
u
it
s:
S
pe
llCh
ec
k
.ne
t
,
B
on
P
a
t
ron,
C
or
di
a
l
2008
.
Postéditionmanuelles :ProofingPro,J.ClarkPowers,Euroscript.
Goo
g
le :traductionsautomati
q
ues
g
q
|Problèmegénéral
Ctili ité à
l
ti d’ il ùl’i t ti
C
orrec
ti
on
li
m
ité
e
à
l
acorrec
ti
on
d’
erreurss
i
mp
l
es,o
ù
l’i
n
t
erac
ti
on
avecl’utilisateurestquasiinexistante.
ÆOrcetteinteractionestsouventessentielle.
ÆDeplusilfautaussisouventfaireappelàdesdonnéeslinguistiques
(lexicales).
CONSTITUTION DU CORPUS
Lecorpus
|Locuteursnatifsfrançais.
|Taille:environ200pages.
90pagesdedocumentsélectroniques,35auteurs.
110pagesdedocumentspublications,rapports,50auteurs.
Différentesphases:
miseenplaced’uncorpusexploratoire,
lli i éhdl i d i d
ana
l
ysesqua
li
tat
i
ves,avecunem
é
t
h
o
d
o
l
og
i
e
d
utra
i
tement
d
e
l’erreur:quelle(s)erreur(s)?Queltype?Quelle(s)
correction
(
s
)
?
Q
uellescaté
g
orisations
p
ourleserreurs?
() Q g p
analysesquantitatives:corpusd’emails(cf.tableau)
1 / 19 100%

Les erreurs dans la production écrite de documents rédigés en

La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !