Analyse des données textuelles - Ceremade

Téléchargement

Université Paris – Dauphine

Ecole Doctorale de Gestion

M. Gettler – Summa, C. Pardoux

ANALYSE DES

DONNÉES TEXTUELLES

Traitement automatique

des questions ouvertes

19/04/2005 EDOGEST 2

Question ouverte

¾Souhaitez-vous ajouter des informations que ce

questionnaire n’a pas permis de recueillir ?

¾Contexte : question finale

¾Intention des concepteurs : redonner la main aux

enquêtés

¾Conséquence : espace de liberté important du fait d’une

question très ouverte (avantage et inconvénient)

19/04/2005 EDOGEST 3

Exploration des données textuelles

1. Disposer d’une base contenant au moins une variable

textuelle et au moins une variable nominale.

2. Créer le « Vocabulaire des mots et segments répétés ».

3. Explorer les données textuelles :

¾Recherche des « Contextes de mots »,

¾Recherche du « Vocabulaire spécifique » de groupes d’individus,

¾Construction de « Tableaux lexicaux » de contingence pour

comprendre les liaisons entre le vocabulaire et les groupes

d’individus.

19/04/2005 EDOGEST 4

Les unités statistiques de base

¾Les formes graphiques

Suite de caractères non-délimiteurs entourée par des

caractères délimiteurs : un même mot peut donner lieu à

plusieurs formes graphiques selon son genre ou sa

conjugaison, une même forme graphique peut renvoyer à

plusieurs mots.

¾Les segments répétés

Unités plus larges composées de plusieurs formes

graphiques : sécurité d’emploi, études supérieures…

Les segments sont le plus souvent formés de deux mots et

rarement de plus de quatre mots (mots composés…)

19/04/2005 EDOGEST 5

Formes lexicales

Mots et segments ⇒Formes lexicales

Les comparaisons n’ont de sens que si les formes lexicales

apparaissent avec une certaine fréquence.

Il convient d’écarter les hapax (formes n’apparaissant qu’une

fois) et les formes rares. On peut ne garder que les formes

apparaissant au moins kfois (k= 5, par exemple).

La présence de mots-outils (dans, par, que, qui, des…) n’est

justifiée que si ces mots caractérisent certaines catégories.

1 / 25 100%

Documents connexes

Inscrire le nom de l`entreprise ou du projet

Exemple d`un cahier de mots en plusieurs parties

Objectifs fondamentaux et base marketing

Le patient - ifsi dijon

Logiciels d`analyse de données textuelles : Alceste et Iramuteq

FLS-FRE030 - Université de Sherbrooke

Chapitre 2 : Les stratégies marketing. Elaboration : 1) Déterminer la

D`UN POINT A L`AUTRE Par deux points distincts

OFFRE DE STAGE Etude de marché coopératives et agro

quadrilatere 05

Linguistique française – Bibliographie

Stratégie marketing

Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans l'interface ou les textes ? Ou savez-vous comment améliorer l'interface utilisateur de StudyLib ? N'hésitez pas à envoyer vos suggestions. C'est très important pour nous!

GDPR Confidentialité Conditions d''utilisation

Analyse des données textuelles - Ceremade

Documents connexes

Faire une suggestion

Produits

Assistance

Produits

Assistance

Analyse des données textuelles - Ceremade

Documents connexes

Faire une suggestion

Produits

Assistance

Ajouter ce document à la (aux) collections

Ajouter ce document à enregistré

Suggérez-nous comment améliorer StudyLib