5
Introduction
Dtm-Vic est un logiciel consacré à l'analyse exploratoire multidimensionnelle des
données numériques et textuelles.
L'analyse exploratoire, comme son nom le suggère, est une démarche préliminaire de
contact avec un recueil de données, contact suivi d'investigations, de description, sans
se limiter à un protocole fixé à l'avance. L'exploration suppose que les données sont
complexes, que les connaissances a priori sur ces données sont limitées.
L'analyse multidimensionnelle, elle, s'attache au cas où les dimensions (le plus
souvent: les variables) sont nombreuses, ce qui est un facteur de complexité, et par
conséquent une incitation à commencer par une démarche exploratoire. Une autre
incitation plus technique à utiliser cette démarche concerne le caractère peu réaliste
des hypothèses statistiques distributionnelles dans le cas multidimensionnel, qui rend
malaisée l'utilisation codifiée des tests d'hypothèses.
L'analyse exploratoire multidimensionnelle des données numériques sera un volet
important du logiciel Dtm-Vic. Les outils de base en sont d'une part les méthodes
factorielles (ou analyses en axes principaux) telles que l'analyse en composantes
principales, les analyses des correspondances simples et multiples, d'autre part les
méthodes de classification (classification hiérarchique, méthodes de partitionnement,
cartes auto-organisées). Ces techniques ne s'excluent pas mutuellement, elles sont au
contraire systématiquement utilisées comme des techniques complémentaires
apportant chacune des points de vue indispensables sur la réalité statistique. L'ouvrage
de base qui accompagne les méthodes mises en oeuvre dans Dtm-Vic s’intitule:
"Statistique Exploratoire Multidimensionnelle"
.
Les données textuelles sont, en particulier, des données à la fois multidimensionnelles
et complexes. Elles sont donc des candidats possibles aux traitements proposés par les
analyses exploratoires. Elles sont souvent associées à des données numériques. C'est
le cas emblématique des enquêtes par sondage comportant à la fois des questions
fermées (données numériques continues et variables nominales) et des questions
ouvertes (données textuelles). Ces données d'enquêtes constituent l'exemple-type
autour duquel s'est développé Dtm-Vic. Une partie importante des méthodes mises en
oeuvre dans le volet textuel du logiciel Dtm-Vic sont présentées et commentées dans
l'ouvrage "Statistique textuelle"
(téléchargeable à partir de www.dtmvic.com).
Statistique Exploratoire Multidimensionnelle. Visualisation et Inférence en Fouille de
Données. Ludovic Lebart, Marie Piron, Alain Morineau (2006). 4ème ed. Dunod, Paris.
Statistique textuelle. Ludovic Lebart, André Salem (1994), Dunod, Paris. La version anglaise:
Exploring Textual Data (L. Lebart, A. Salem, E. Berry, 1998, Kluwer, Dordrecht) inclut des
exemples utilisés dans ce manuel.