Romanisches & Deutsches Seminar
Le nouveau corpus SMS de Suisse:
traitement des données multilingues et
premiers résultats d'analyse
Prof. Dr. Elisabeth Stark
estark@rom.uzh.ch
Prof. Dr. Christa Dürscheid
duerscheid@ds.uzh.ch
Romanisches & Deutsches Seminar
Sommaire
1. Situation de départ
2. Le projet SMS suisse
3. Des donnés brutes au corpus
4. Travaux de recherche prévus
5. Premiers résultats (choix)
6. Conclusions et perspectives
Bibliographie
Romanisches Seminar & Deutsches Seminar
15.05.2011 Seite 3
1. Situation de départ
Corpora déjà disponibles, p.ex. :
Les corpora pour la Computer Mediated Communication (= CMC;
communcation médiée par ordinateur, CMO):
http://www.cmc-corpora.de (cf. Beißwenger/Storrer 2008).
Les corpora déjà disponibles sont en règle générale :
a. relativement petits (de 300 à 8‘000 SMS, cf. Tagg 2009);
b. basés sur des SMS recopiés perte d‘authenticité;
c. sans indications démographiques
Raison d‘être du projet international sms4science
15.05.2011
Romanisches Seminar & Deutsches Seminar
15.05.2011 Seite 4
Notre intérêt:
Les grands corpora de SMS offrent des données idéales concernant
les stratégies d’écriture/l‘usage linguistique à l‘écart de la norme.
Ils nous aident ainsi à réconcilier la linguistique variationnelle et la
linguistique structurelle/formelle (recherche centrée sur la
morphosyntaxe/grammaire):
la graphie non réfléchie peut contenir des indices des régularités
grammaticales sous-jacentes;
les données socio-démographiques permettent une recherche
linguistique variationnelle bien fondée ;
le matériel d’écrit spontané permet la vérification statistiquement
valide d‘hypothèses grammatico-théoriques ou typologiques.
15.05.2011 Seite 4
1. Situation de départ
15.05.2011 Seite 4
Romanisches Seminar & Deutsches Seminar
15.05.2011 Seite 515.05.2011 Seite 5
Période de collecte : du 11.9.2009 au 31.01.2010
SMS donnés (utilisables) : 24'038
Nombre de mots : env. 480‘000
Régions : 18% Romandie, 82% Suisse allemande et italienne
Nombre de dons : en moyenne 1 à 5 SMS par personne (80
personnes avec plus de 50 SMS).
2. Le projet SMS suisse
1 / 41 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !