Le powert-point de la conférence

publicité
L’analyse qualitative de données
assistée par ordinateur (CAQDAS).
Méthodologies, applications, chausses-trapes.
Clément VIKTOROVITCH
Docteur en science politique
Laboratoire Communication et Politique (IRISSO - CNRS)
I- Les méthodes informatisées d’analyse de données qualitatives
II- Une tension méthodologique intrinsèque
III- Le logiciel : une affaire de goût… et de méthodologie
I- Les méthodes informatisées d’analyse de données qualitatives
Deux méthodes principales :
 La lexicométrie
 Le codage informatique de données
D’autres options disponibles, davantage marginales ou expérimentales : l’analyse
statistique par dictionnaires préconstitués (Tropes), le machine-learning…
I- Les méthodes informatisées d’analyse de données qualitatives
1- La lexicométrie
Logiciel courant : Alceste
Technique :
 Lemmatisation du corpus textuel
 Découpage en « unités de contexte élémentaires » (UCE)
 Classification descendante hiérarchique : dissociation des UCE en « classes » dont les
vocabulaires sont les plus différents possibles.
 Le logiciel fait émerger des « univers de sens » au sein du corpus, identifiés par une
série de mots caractéristiques
I- Les méthodes informatisées d’analyse de données qualitatives
1- La lexicométrie
Avantages :
 Caractère exploratoire de l’analyse
 Automatisation : gain de temps, objectivation
 Grande communicabilité des résultats
Inconvénients :
 Analyse fondée uniquement sur les unités lexicales : pas de prise en compte des
polysémies, des connotations, des expressions
 Impossibilité d’utiliser une grille de lecture analytique
 Le logiciel reste une « boite noire »
Risques :
 Confirmation des intuitions
 Création d’artefacts
I- Les méthodes informatisées d’analyse de données qualitatives
2- Le codage de données par CAQDAS
Logiciels courants : Atlas.ti / NVivo
CAQDAS : « Computer Assisted Qualitative Data Analysis Software »
Les fonctions :
 Codage des données
 Recherche de contenu
 Mise en liaison des données
 Requêtes et tris entre codes
 Mise en réseau des codes
 Outils d’annotation et d’écriture
I- Les méthodes informatisées d’analyse de données qualitatives
2- Le codage de données par CAQDAS
Avantages :
 Liberté totale du chercheur : choix des grilles, des indicateurs…
 Grande flexibilité méthodologique
 Aucune automatisation : contrôle total sur le procédé
Inconvénients :
 Aucune automatisation : travail chronophage
 Communicabilité minimale
Risques :
 Confusion méthodologique
 Se perdre dans le codage
II- Une tension méthodologique intrinsèque
Au sein des CAQDAS, deux orientations méthodologiques en tension :
 Une analyse inductive, héritière de la grounded theory
 Une analyse déductive de contenu
II- Une tension méthodologique intrinsèque
1- La méthode inductive, héritière de la grounded theory
Deux ouvrages fondamentaux :
 Barney Glaser, Anselm Strauss, La découverte de la théorie ancrée, 1967
 Anselm Strauss, Juliet Corbin, Les fondements de la recherche qualitative, 1990
Les principes :
 Rompre avec l’approche déductive, analysant la réalité sociale au prisme de théories
élaborées dans l’abstraction.
 Partir de l’analyse de données empiriques, pour dégager une théorisation fondée
empiriquement.
 Replacer le « plaisir » et la « création » au centre de la recherche.
II- Une tension méthodologique intrinsèque
1- La méthode inductive, héritière de la grounded theory
Les CAQDAS, des outils forgés pour l’analyse inductive :
Ces logiciels sont faits pour permettre au chercheur d’avoir une relation im-médiate à ses
données :
 Fonctionnement simplifié
 Objectif de structuration des données
 Codes flexibles pouvant être renommés / découpés / regroupés
 Larges possibilités d’annotation
 Larges possibilités de rédaction
 Le travail de catégorisation / mise en relation / théorisation est fluidifié et simplifié,
en permettant au chercheur de ne jamais perdre contact avec ses données.
II- Une tension méthodologique intrinsèque
2- L’analyse déductive de contenu
Laurence Bardin, L’analyse de contenu, 1977
Les principes :
 Sélection a priori d’une grille de lecture (analyse thématique, analyse de récit…)
 Traduction de la grille en une série de codes
 Structuration du corpus selon une série de variables
 Codage systématique de l’ensemble du corpus
 Analyse statistique (répartition et cooccurrence des codes notamment)
 Analyse quantitative d’un matériau qualitatif selon une démarche hypothéticodéductive, visant généralement à tester des hypothèses de départ.
II- Une tension méthodologique intrinsèque
3- Des méthodologies incompatibles ?
Ces deux méthodologies sont centrées sur une même opération (le codage) et un même
outil (les CAQDAS). Pourtant, il existe entre elles trois tensions fondamentales :
Place du codage dans la méthodologie :
 Déduction : le codage est une étape avant l’analyse des données
 Induction : le codage est le moment de l’analyse des données
Nature des codes :
 Déduction : unidimensionnels et homogènes (pour être statistiquement significatifs)
 Induction : par définition, ils restent longtemps pluridimensionnels et hétérogènes
Déroulement pratique du codage :
 Déduction : codage méthodique et intégral ; nombre de codes limité
 Induction : microanalyse de moments pertinents ; codes nombreux puis resserrés
II- Une tension méthodologique intrinsèque
3- Des méthodologies incompatibles ?
Ces deux méthodes sont ainsi structurellement incompatibles. Néanmoins, en pratique,
frontière ténue entre ces deux démarches.
•Lors d’une analyse déductive, tentation d’ajouter des codes à mesure que l’on identifie
de nouveaux éléments dans les données.
Menace la cohérence de la grille initiale, particulièrement si elle a été dérivée d’un
modèle théorique.
•Lors d’une analyse inductive, tentation de quantifier les catégories émergeantes.
Conduit à une inflation de l’opération de codage.
•Dans les deux cas : Obligation de recoder l’intégralité du corpus.
II- Une tension méthodologique intrinsèque
3- Des méthodologies incompatibles ?
Les méthodologies mixtes sont donc à la fois instinctivement séduisantes et
méthodologiquement problématiques.
Une possibilité de combinaison entre démarches inductive et déductive existe néanmoins
: l’analyse séquentielle.
 Premier codage inductif pour identifier les catégories pertinentes
 Second codage déductif pour évaluer leur distribution au sein du corpus
 C’est la méthode de l’analyse de contenu, au sens large du terme.
II- Une tension méthodologique intrinsèque
4- Dans tous les cas : structurer l’information
Quelle que soit la méthodologie utilisée, in fine, les CAQDAS permettent de structurer,
indexer, référencer et commenter des corpus très étendus.
Il s’agit peut-être, au fond, de leur utilité principale. En ce sens, presque toute recherche
qualitative peut tirer les plus grands bénéfices d’un traitement par CAQDAS.
III- Le logiciel : une affaire de goût… et de méthodologie
Deux logiciels principaux :
 NVivo
 Atlas.ti
III- Le logiciel : une affaire de goût… et de méthodologie
1- Atlas.ti
Logiciel développé avec l’aide d’Anselm Strauss et Juliet Corbin.
 Atlas.ti a été originellement conçu dans la perspective de la grounded theory (même si,
aujourd’hui, les développeurs s’en défendent).
Avantages :
 Fonctionnement simple, intuitif et facile d’accès
 Affichage du codage clair et exhaustif, adapté au travail inductif
 Très grandes possibilités d’annotation
 Peu gourmand en ressources
Inconvénients :
 Peu de possibilités de structuration de l’information
 Faiblesse des outils de quantification intégrés
 L’interface est laide…
III- Le logiciel : une affaire de goût… et de méthodologie
2- NVivo
Avantages :
 L’interface est belle…
Inconvénients :
III- Le logiciel : une affaire de goût… et de méthodologie
2- NVivo
Avantages :
 L’interface est belle…
 Très grande structuration de l’information
 De nombreuses données quantitatives intégrées
Inconvénients :
 Visualisation du codage très limitée
 Plus difficile à prendre en main
 Très gourmand en ressources
 Un outil moins adapté à une analyse purement inductive, mais parfait pour l’analyse
de contenu.
L’analyse qualitative de données
assistée par ordinateur (CAQDAS).
Méthodologies, applications, chausses-trapes.
Clément VIKTOROVITCH
Docteur en science politique
Laboratoire Communication et Politique (IRISSO - CNRS)
Téléchargement