Techniques d`analyse de l`enquête

publicité
Questions de la méthode et techniques d’analyse de l’enquête
Andrei Mogoutov et Tania Vichnevskaia
Introduction
L’étude « Démographie au seuil de l’an 2000 » a été réalisée par les démographes, pour les
démographes et sur les démographes. Une des questions centrale de l’enquête est la recherche de
la définition d’une communauté de spécialistes de la population. L’appartenance à la population –
cible s’avère un résultat de l’autodéfinition, c’est un produit d’une volonté des membres de la
communauté à répondre. Dans ce cas elle renvoi à une quête identitaire voir une construction
identitaire ou à une stratégie de prise de la parole au sein de la communauté de recherche définie par
quelques repères institutionnels et un certain nombre de mots-clés. Dans cette optique d’un
recensement professionnel d’une communauté dont on ne connaît ni la taille ni la définition, les
questions de la représentativité ne sont pas applicables dans le sens traditionnel.
En d’autres termes l’échantillon est représentatif de soi-même, cet objet est unique et complet dans le
cadre de l ‘étude telles quelle a été menée. Il résulte d’une diffusion de l’information qui a pu être
activé par les moyens des messages électroniques, des annonces lors des conférences et dans les
publications spécialisées, ainsi que sur des portails Internet. Cette structure initiale de communication
peut être considérée comme un réseau social des porteurs de l’information.
On propose un modèle d’un réseau hétérogène qui reflète cet objet. Les nœuds de ce réseau sont
représentés par les personnes, les institutions, les questions et les modalités des réponses aux
questions.
Technique d’analyse
Le statut particulier et la structure complexe de l’objet nous obligent de revoir et d’adapter la portée
d’application des méthodes analytiques et le niveau d’interprétation des résultats. Les indicateurs
issus de l’appareil statistique ne sont pas utilisés en tant que moyen de description statistique de
l’échantillon mais comme un éventuel outil de description et d’exploration d’un réseau hétérogène,
notre modèle de l’objet. Les indicateurs expriment l’importance relative de différentes modalités des
données ainsi que comme une force de lien (la co-occurrence) entre plusieurs questions.
La technique d’analyse des données est construite à partir de l’analyse des co-occurrences des
modalités dans le même questionnaire remplis. Cette approche est complémentaire à une description
quantitative plus traditionnelle exprimé sous une forme d’un tableau de fréquence de tableau croisé et
de différentes mesures statistiques ou des méthodes plus sophistiquées.
1
Nous examinerons dans la partie qui suit la description de la méthodologie suivie des exemples
d’analyse RéseauLu1.
Cartographie relationnelle des données, approche RéseauLu
(modèle, résultats et interprétation)
L’approche relationnelle RéseauLu a été initialement développée pour l’exploration et l’analyse des
réseaux hétérogènes. Cette notion articule toutes données pour lesquelles les notions d’éléments et
de liens entre ces éléments sont définies. Les individus, les institutions, les objets et les propriétés
sont considérés comme éléments à la même échelle sans qu'une hypothèse de structuration soit
définie a priori.
Pour le traitement de la présente enquête chaque questionnaire rempli est considéré comme un
ensemble d’énoncés cohérent qui suit une logique et qui reflète une construction discursive. L’analyse
des données se réalise selon deux approches complémentaires :
a) description structurale - la restitution d’un réseau des entités sémantiques en tant que « structure
du possible » dans le cadre d’analyse d’un discours commun.
b) description quantitative utilisée comme une sorte de pondération, comme les propriétés
quantitatives projetées sur la « structure du possible »
Des algorithmes spécifiques ont été mis en œuvre dans RéseauLu pour permettre l’analyse et la
représentation de la structure des données, la schématisation et la cartographie des entités
analytiques. Les données sont considérées comme un ensemble d’éléments dans l’espace de deux
dimensions. Chaque élément se caractérise par deux aspects : les propriétés de l’élément et ses
liens.
Les propriétés sont exprimées soit par la couleur soit par la forme sur le graphe. Il est possible
d’utiliser des propriétés plus complexes, comme l’appartenance aux clusters lors d’une analyse
multivariée comme nous allons le présenter dans les exemples qui suivent.
La visualisation de liens se réalise à partir des données de la matrice de liens. Des algorithmes des
RéseauLu optimisent le positionnement des éléments sur le plan. La matrice originelle ne peut être
représentée sans déformation que dans un espace multidimensionnel. Pour diminuer la déformation
sur le plan, le logiciel utilise le positionnement dynamique qui simule l’interaction entre les éléments.
Trois niveaux d’optimisations sont réalisés :
1. Positionnement initial global des éléments les uns par rapport aux autres sur le plan
1
RéseauLu est un logiciel et un système analytique qui réunit dans un environnement analytique différents types de données
qualitatives
et
quantitatives:
enquêtes,
entretiens,
bases
de
données,
corpus
de
texts.
Le plan analytique permet de combiner l'analyse de différents aspects de données: relationnelles, temporelles et textuelles.
Trois types d’applications : analyse des données relationnelles, analyse biographique, analyse textuelle
Conception, développement : Andrei Mogoutov IDDN.FR.010 .0087977.000.R.P.2000.030.20000
Distribution AGUIDEL: www.aguidel.com
2
2. Optimisation au niveau micro du positionnement des éléments par rapport à leurs ‘voisins’ sur le
graphe
3. Optimisation du positionnement au niveau meso des groupes des éléments fortement
interconnectés
L’algorithme réalisé dans les versions actuelles du logiciel combine plusieurs approches de simulation
directe de déplacement des éléments géométriques en présence des forces aléatoires, de la
projection non - linéaire sur un plan d’une structure multidimensionnelle, de la mise en échelle des
distances entre les éléments, le calcul des groupes d'éléments et l'ordre de leur apparition dans la
structure.
La représentation finale utilise plusieurs critères
-
tient compte de l’ensemble de liens entre les éléments ;
-
tend à minimiser le nombre de croisements des liens ;
-
place les éléments le plus «lisiblement » possible en minimisant l’intersection des points ;
-
place les éléments le plus symétriquement possible ;
-
place les éléments complètement connectés dans un espace à une densité uniforme ;
-
place les groupes d’éléments fortement connectés «ensemble » sur la carte en formant les amas
des points ;
-
place ensemble sur la carte les éléments avec une forte similitude des positions structurales
L’orientation du réseau final est déterminée par la position des éléments les plus connectés.
Exemple 1a. Cooccurrence des noms des démographes cités comme références.
L’exemple suivant illustre l’analyse des cooccurrences des noms des démographes importants pour
les travaux personnels cités par l’ensemble des répondants. Dans cet exemple les éléments
correspondent aux noms cités et les liens signifient que les deux noms ont étés cités par le même
répondant. Nous avons sélectionné pour l’analyse que les noms dont la fréquence de citation est
supérieure à 1.
L’analyse se produit en deux étapes :
1. construction d’une matrice des liens
2. visualisation des liens
3
La matrice des liens représente un tableau à double entrée, le ‘1’ signifiant que les deux noms ont été
cité par le même répondant et le ‘0’ – qu’ils ne l’ont jamais été. Vous trouverez sur la fig.1 le sous
réseau I qui correspond à la matrice des liens du Tableau 1.
Smith S
Morrison P.
Tayman J.
Swanson D.
Shryock H.S
Notestein
F.W.
Smith S
1
1
1
0
0
1
1
1
0
1
1
0
1
0
Morrison P.
1
Tayman J.
1
1
Swanson D.
1
1
1
Shryock H.S
0
1
1
1
Notestein F.W.
0
0
0
0
1
1
Tableau 1. Extrait d’un tableau de liens de cooccurrence des noms des démographes contemporains
cités comme références pour les travaux personnels des répondants (seuil de fréquence >=2).
4
Sous-réseau II
Sous-réseau III
Morgan P
Coleman J
Watkins S C
Furstenberg F
Birg H
Thomson E
Volkov A
Lieberson S
Borissov V
Darski A
Folbre N
McDonald P
Bourdieu P
Bumpass L
Goldscheider F
Oppenheimer V K
Campbell D T
Mason K
Schoen R
Lee
Nerlove
Perret J
Tapinos G
Sanderson W C
Thomas
Smil V
Castel R
Singer B
Chesnais C
Thornton A
Vaupel J
Keilman N
Boserup E
Manton K
Sous-réseau I
Becker G S
Valentei
Urlanis
B D
Vallin J
Lee R D
Lutz W
Coleman D
Rees P
Champion T
Ryder N
Cleland J Wachter K
Smith S
Sauvy A
Hoem J M
Willekens F
Morrison P
Van de Kaa D
Schultz T
Jejeebhoy
Greenhalgh S
Amarthya Sen
Davis K
Rogers A
Demeny P Léridon H
Preston S H
Lesthaeghe R
Murphy M
Feeney G
Henripin J Keyfitz N
Easterlin R A
Tayman J
Glass D V
Notestein F W
Freedman R
Bogue D
Caldw ell J C
Lee E S
Sw anson D
Coale A
Warnes
Shryock H S
Kish L
Westoff C
Bourgeois-Pichat J
Pressat R
Festy P
Blossfeld H P
Courgeau D
Modell
Roussel L
Bongaarts J
Rohw er
Tsui
Brass W
Siegel J
Hill K
Henry L
Mc Nicoll G
Wunsch G J
Frey W
Knodel J E
Caselli G
Hauser P
Hajnal J
Portes A
Mayer K U
De Jong
Brow n D
Braudel F
Haw ley A
Cox D
Massey D
Salt J
Légaré J
Harvey D
Wrigley E A
Laslett P
McKeow n T
Giddens A
Chasteland J C
Dupaquier J
Kuijstein A
Anderson B
Romaniuc A
Castells M
Palloni A
Livi Bacci M
Biraben J N
Tabutin D
Goubert P
Piché V
Goody J
Todaro M
Locoh T
Calot G
Bardet J P
Reher D
Cosio-Zavala M E
Le Bras H
Uhlenberg P
Poppel V
Elder G
Szreter
Antoine P
Sous-réseau IV
Cabré A
Bozon M
Thumerelle P J
Foucault M
Fig. 1. Cooccurrences des références nominatives des chercheurs contemporains qui représentent
une référence importante pour les travaux personnels des répondants seuil de fréquence >=2.
Extrait d’un commentaire
L’analyse RéseauLu dans cet exemple permet de relever la structure des références déclarées par
l’ensemble des répondants, tout en gardant les caractéristiques quantitatives. La position structurale
reflète les « voisinages » dans les citations tandis que la taille du point associé au nom - la fréquence
de citation dans l’ensemble de l’échantillon.
5
Pour commenter le graphe il est nécessaire de tenir compte des niveaux complémentaires
d’interprétation : le niveau global et le niveau local .
- au niveau global ce graphe a une configuration très centré sur les chercheurs les plus fréquemment
cités comme J.C.Caldwell, A.Coale , R Leastaghe, N.Keyfits, S.Preston,
J.Bongaarts.
W.Brass, L.Henry,
D'autre sous-réseaux sont moins denses mais on distingue, par exemple, le sous-
réseau formé de chercheurs comme Vaupel, Boserup, Chesnais, Vallin, Greenhalgh, Cleland et
Wchter ou celui avec Livi-Bacci, Cox, Massey, Laslett, McKeown, Wrigley.
-
au niveau local sur le graphe dans les sous-réseau II de la fig.1 on cherche l’entourage proche
de l’élément. Par exemple Pressat est positionnée dans l'entourage de J.C. Caldwell, A. Coale,
P.Festy, Bourgeois-Pichat, J.Bongaarts et L.Roussel
Exemple 1b. Références nominatives des chercheurs contemporains qui représentent une
référence importante pour les travaux personnels des répondants selon la région de
naissance
Dans l’exemple suivant les noms des chercheurs contemporains qui représentent une référence
importante pour les données personnelles sont croisés avec la région de naissance des répondants.
Cet exemple est plus complexe, la visualisation des liens entre les modalités de deux variables est
précédée par une sélection des liens les plus spécifiques selon une procédure décrite en détail dans
l’exemple 2a.
6
Willekens F
Bogue D
Caldw ell J C
Asie+Océanie non australienne
Keyfitz N
Easterlin R A
Rogers A
McKeow n T
Lesthaeghe R
Demeny P
Lee R D
Australie, Nouvelle-Zélande
Davis K
Bumpass L
Van de Kaa D
Livi Bacci M
Le Bras H
Bourgeois-Pichat J
Salt J
Roussel L
Hajnal J
Léridon H
Freedman R
Westoff C
Urlanis B
Goldscheider F
Moyen-Orient
Europe
Wrigley E A
Ryder N
Amérique du Nord
Calot G
Preston S H
Shryock H S
Massey D
Sauvy A
Thumerelle P J
Siegel J
Coale A
Dupaquier J
Valentei D
Braudel F
Pressat R
Portes A
Vaupel J
Cleland J
Japon
Bongaarts J
Hoem J M
Boserup E
Laslett P
Henry L
Amérique Latine
Vallin J
Lutz W
Manton K
Chesnais C
Afrique
Bourdieu P
Giddens A
Amarthya Sen
Courgeau D
Brass W
Keilman N
Greenhalgh S
Schultz T
Becker G S
Fig. 2. Références nominatives des chercheurs contemporains qui représentent une référence
importante pour les travaux personnels des répondants selon la région de naissance, seuil de
fréquence >=3, 50% de liens les plus spécifiques.
Au niveau global la première lecture fait ressortir deux pôles: européen et américain, le fait que les
spécialistes en population européens et américains ne soient pas influencés par les mêmes
chercheurs. Quelques groupes de chercheurs indiqués par les cercles sur le graphe dont l'influence
est "partagée" entre les ressortissants de différentes régions sont à distinguer. La deuxième lecture
propose de rechercher les personnes de référence pour les ressortissants de différentes régions.
Coale, par exemple, se trouve lié à l'Amérique du Nord, l'Afrique et le Moyen Orient, et BourgeoisPichat se positionne entre les Européens et les ressortissants du Moyen Orient et Australie-Nouvelle
Zélande
Exemple 2a.
Analyse des disciplines de formation des répondants selon
la région de
naissance.
L'exemple suivant représente une analyse des réponses à la question « Quelles sont les principales
disciplines de votre formation universitaire » pour sept groupes de pays. Le résultat de cette analyse
est une projection d’une sélection des liens entre les modalités des deux variables. La visualisation est
précédée par une sélection des liens les plus spécifiques. L’analyse se réalise en deux étapes
utilisant deux groupes d’algorithmes différents :
1. Construction d’une matrice d’association
7
2. Visualisation des liens spécifiques
1. Construction d’une matrice d’association
L’analyse débute par la construction d’un simple tableau croisé des données. Le tableau 1 représente
le croisement des régions de naissance des répondants avec les disciplines de formations qu’ils ont
suivi.
Trois étapes de transformation sont réalisées à partir de cette matrice
1. construction d’une matrice des valeurs pondérées
2. construction d’une matrice des valeurs attendues
3. construction d’une matrice d’associations
Du tableau 2 de fréquence on passe à la matrice d’association du tableau 3.
A5 / A3
Anthropologie sociale,
ethnologie
Biologie, biométrie,
anthropologie physique
Commerce, marketing,
management
Démographie
Afrique
3
Amérique
du Nord
5
1
Amérique
Latine
4
Asie+Océanie
non
australienne
Australie,
NouvelleZélande
2
1
Europe
1
9
1
3
3
41
91
30
2
Économie
18
31
Génétique
2
1
1
Géographie
8
2
5
2
Histoire
3
10
5
2
51
Informatique
10
3
7
4
34
Mathématiques et
statistique
Médecine, épidémiologie
25
24
17
10
2
6
3
4
5
4
2
12
6
3
4
2
2
3
2
14
77
20
13
3
4
7
2
Préhistoire, paléontologie
Psychologie, psychologie
sociale
Science politique,
administration publique
Sciences de l'actuariat,
assurances
Sciences de
l'environnement, écologie
Sociologie
Urbanisme, aménagement
du territoire
MoyenOrient
22
2
Droit
Japon
1
14
30
9
202
1
1
1
11
11
3
21
117
9
1
1
4
9
2
2
1
65
1
1
2
1
134
1
3
19
1
1
7
1
1
2
2
9
1
33
1
4
1
10
1
115
25
1
4
2
Tableau 2. Tableau croisé de fréquence des disciplines de formation des répondants selon les régions
de naissance.
Lors de la deuxième étape la matrice des valeurs attendues correspondants à l’hypothèse « 0 » d’une
indépendance statistique des colonnes et des lignes du tableau est crée. Les valeurs des cellules sont
8
remplacées par une combinaison des valeurs marginales (multiplication des totaux correspondant des
lignes et des colonnes divisé par le total général)
La construction de la matrice d’association résume la 3me étape. Les valeurs des cellules sont
calculées comme la différence entre les valeurs observées et les valeurs attendus selon la formule
(Vo-Va)/(sqr(Va))
A5 / A3
Afrique Amérique Amérique Asie+Océanie Australie, Europe Japon Moyendu Nord
Latine
non
NouvelleOrient
australienne
Zélande
Anthropologie sociale,
ethnologie
Biologie, biométrie,
anthropologie physique
Commerce, marketing,
management
Démographie
-0,17
-0,61
0,57
0,11
-0,65
0,25
-0,43
0,24
-0,07
-1,46
0,02
-0,78
-0,37
0,86
-0,25
1,47
-0,04
-0,53
0,82
-1,07
1,45
0,29
-0,34
-0,70
0,63
2,03
-0,65
2,02
2,00
-2,09
0,64
0,05
Droit
-1,56
-1,27
-0,81
-0,30
1,26
1,48
-0,37
0,56
Économie
0,17
-0,55
-1,19
0,43
-1,48
0,78
0,03
-0,06
Génétique
0,77
-0,86
-0,06
-0,81
-0,38
0,62
-0,26
-0,53
Géographie
0,14
-3,37
-0,73
-1,10
1,06
2,47
-0,65
-0,60
-1,41
-0,86
-0,42
-0,89
-0,91
1,44
1,03
0,34
2,05
-2,31
1,00
0,61
-0,82
0,13
-0,54
-0,23
-0,75
Histoire
Informatique
Mathématiques et statistique
1,28
-2,31
-0,14
-0,25
-0,28
1,11
-0,08
Médecine, épidémiologie
-0,51
0,14
0,24
-1,27
-0,60
0,22
2,10
0,39
Préhistoire, paléontologie
-0,85
-1,19
0,43
-0,63
-0,30
1,17
-0,20
-0,41
1,26
0,36
1,46
-0,19
-0,52
-1,23
-0,35
0,68
-1,32
0,72
0,72
-1,66
0,48
0,36
-0,53
-0,16
1,31
0,69
0,61
1,34
-0,42
-1,67
-0,28
1,13
0,30
-0,11
0,44
-0,95
-0,45
-0,05
-0,30
1,00
-1,71
5,05
-0,01
0,19
-0,46
-2,01
-0,21
-0,54
-0,43
-1,31
1,87
-0,11
-0,70
0,15
-0,46
1,13
Psychologie, psychologie
sociale
Science politique, administration
publique
Sciences de l'actuariat,
assurances
Sciences de l'environnement,
écologie
Sociologie
Urbanisme, aménagement du
territoire
Tableau 3. Matrice d’association
On considère un pourcentage des valeurs positives les plus élevées de cette matrice. Cette procédure
est réalisée par un module du système RéseauLu selon un seuil indiqué suivi par le module de
visualisation décrit ci-dessus.
9
Informatique
Sciences de l'environnement,écologie
Psychologie, psychologie sociale
II
Urbanisme, aménagement du territoire
Génétique
Amérique Latine
Moyen-Orient
Afrique
Science politique, administration publique
Médecine, épidémiologie
Sciences de l'actuariat, assurances
Mathématiques et statistique
Biologie, biométrie, anthropologie physique
Japon
Amérique du Nord
Commerce, marketing, management
Asie+Océanie non australienne
Sociologie
Histoire
III
Europe
Démographie
Australie, Nouvelle-Zélande
I
Géographie
Préhistoire, paléontologie
Droit
Économie
Fig. 3. Les disciplines de formation des répondants selon la région de naissance, 30% des liens les
plus spécifiques (les lignes continues représentent les liens les plus spécifiques qui correspondent
15% des liens les plus spécifiques, les 15% des liens suivant sont représenté par des pointillées)
Extrait d'un commentaire.
Pour commenter le graphe il est nécessaire de tenir compte de trois niveaux complémentaires
d’interprétation : niveau global, niveau local et niveau intermédiaire.
Au niveau global on distingue trois groupes de régions avec les disciplines qui leurs sont spécifiques
I. Europe ;
II. Afrique, Amérique Latine et le Moyen-Orient ;
III. Etats-Unis, Australie, Nouvelle Zélande et Asie+Océanie non australienne.
Au niveau local sur le graphe on cherche l’entourage proche de l’élément, par exemple dans le
présent exemple l’économie s’est avéré spécifique comme discipline de formation pour l’Europe, la
sociologie – pour l’Amérique du Nord et la démographie pour les Etats-Unis, l’Australie, Nouvelle
Zélande et l’Asie+Océanie non australienne.
10
Au niveau intermédiaire il est important de tenir compte des points de transition ? qui sont en même
temps le lien entre les sous réseaux et qui se trouvent à la frontière, comme, par exemple les sciences
de l’actuariat et les sciences politiques et administration publique entre le groupe II et III
Exemple 2b. Combinaison et comparaison des méthodes: cartographie relationnelle et analyse
factorielle
D’habitude dans les projets réels il est recommandé de construire plusieurs cartes avec différents
niveaux de seuil afin de trouver les valeurs optimales. Dans certains cas il s’avère utile de combiner
plusieurs méthodes d’analyse, tel que analyse factorielle des correspondances, classification
automatique, analyse multidimensionnel etc. Certain de ces algorithmes font partie du système
RéseauLu.
L’exemple qui suit permet d’illustrer cette utilisation combinée de plusieurs techniques sur les mêmes
données.
La figure 4 représente le premier plan des résultats de l’analyse factorielle des correspondances2 des
disciplines de la formation professionnelle et des régions de naissances des répondants.
2
Réalisé avec XLSTAT version 5.1 - Analyse Factorielle des Correspondances (AFC) - Pour cette
analyse le test d'indépendance entre les lignes et les colonnes actives du tableau de contingence est
le suivant :
Valeur observée du khi² (ddl = 126) : 171,785
P-value associée : 0,004 Le test étant unilatéral, la p-value est comparée au seuil de signification :
alpha= 0,050
Valeur critique du khi² (ddl = 126) : 153,202
Valeurs propres et pourcentage de variance :
F1
F2
F3
F4
Valeur propre
0,055
0,021
0,012
0,008
% variance
51,295
19,162
11,505
7,438
11
A5 / A3 (axes F1 et F2 : 70 %)
0,7
Sciences de l'actuariat, assurances
0,6
0,5
0,4
Afrique
Informatique
Psychologie, psychologie sociale
0,3
axe 2 (19 %)
Asie+Océanie non australienne
0,2
0,1
Urbanisme, aménagement du
territoire
Génétique
Amérique Latine
Moyen-Orient
Mathématiques et statistique
Anthropologie sociale, ethnologie
0
Démographie
Sciences de l'environnement,
écologie
Économie
Biologie, biométrie, anthropologie
physique
Amérique du Nord
Europe
Géographie
-0,1
Commerce, marketing, management
Sociologie
Australie, Nouvelle-Zélande
-0,2
Histoire
Médecine, épidémiologie
Japon
-0,3
-0,4
-0,8
Préhistoire, paléontologie
-0,6
Science politique, administration
publique
Droit
-0,4
-0,2
0
0,2
0,4
0,6
axe 1 (51 %)
Fig. 4 Premier plan des résultats de l’analyse des correspondances des disciplines de la formation
professionnelle et des régions de naissances des répondants
Afrique
Amérique du Nord
Amérique Latine
Asie+Océanie non australienne
Australie, Nouvelle-Zélande
Europe
Japon
Moyen-Orient
F1
0,528
67,462
0,002
5,157
0,136
26,342
0,370
0,004
F2
54,500
6,639
4,614
17,998
1,500
12,193
1,487
1,069
Tableau 3. Contribution des points - colonnes (%) de l'analyse factorielle des correspondances des
disciplines de la formation professionnelle et des régions de naissances des répondants.
Anthropologie
ethnologie
Biologie,
F1
sociale, 0,461
F2
0,215
biométrie, 3,794
0,017
12
anthropologie physique
Commerce, marketing,
management
Démographie
Droit
Economie
Génétique
Géographie
Histoire
Informatique
Mathématiques et statistique
Médecine, épidémiologie
Préhistoire, paléontologie
Psychologie, psychologie sociale
Science politique, administration
publique
Sciences
de
l'actuariat,
assurances
Sciences de l'environnement,
écologie
Sociologie
Urbanisme, aménagement du
territoire
0,715
0,704
12,089
3,428
0,778
1,904
20,958
2,602
4,681
7,885
0,024
3,225
0,666
0,015
3,467
8,685
0,025
0,184
1,187
9,469
21,795
2,958
3,804
2,378
8,583
10,343
2,946
15,705
0,122
0,074
32,109
1,599
9,388
1,021
Tableau 4. Contributions des points-lignes (%) : de l'analyse factorielle des correspondance des
disciplines de la formation professionnelle et des régions de naissances des répondants.
Le premier axe exprime l’opposition en termes des régions de l’Europe par rapport au reste du monde
(surtout des Etats-Unis si on tient compte de la contribution. Il met en opposition la sociologie et la
démographie par rapport aux sciences naturelles comme géographie, biologie, biométrie,
anthropologie physique, génétique.
Deuxième axe reflète l’opposition de l’Europe par rapport aux pays à l’Asie et l’Afrique. La séparation
des disciplines les sciences sociales sont opposées aux disciplines techniques ou appliquées.
13
Informatique
Sciences de l'environnement,écologie
Psychologie, psychologie sociale
Urbanisme, aménagement du territoire
Génétique
Amérique Latine
Moyen-Orient
Afrique
Médecine, épidémiologie
Science politique, administration publique
Sciences de l'actuariat, assurances
Mathématiques et statistique
Biologie, biométrie, anthropologie physique
Japon
Amérique du Nord
Commerce, marketing, management
Asie+Océanie non australienne
Sociologie
Histoire
Europe
Démographie
Préhistoire, paléontologie
Géographie
Australie, Nouvelle-Zélande
Droit
Économie
Fig. 5 Les disciplines de formation des répondants selon la région de naissance, 30% des liens les
plus forts. Ce réseau est une reprise de la fig. 3 qui contient quelques éléments de l’analyse
factorielle. La direction des triangles correspond aux axes de l'analyse factorielle.
Les résultats de l’analyse RéseauLu ne contredisent pas les résultats de l’analyse factorielle. Mais ils
permettent de donner une lecture complémentaire qui n’est pas basée sur le principe des oppositions
mais sur celui de cooccurrence. La formation des démographes européens se veut très classiques et
générales avec des grandes disciplines comme Histoire, Géographie, Economie, Droit ; Les
disciplines des sciences sociales et d’études de population comme démographie, sociologie et
sciences politiques sont spécifiques aux régions regroupées autour du Pacifique ; Les disciplines plus
spécialisées
et moins
académiques
comme psychologie,
psychologie
sociale,
urbanisme,
aménagement du territoire, sciences de l’environnement sont spécifiques à l’Afrique, l’Amérique Latine
et Moyen Orient
RéseauLu ne nécessite pas de définition de nombre de pôles et d’opposition a priori. Par rapport à
l’analyse factorielle avec son raisonnement binaire des oppositions, RéseauLu donne une certaine
souplesse dans la recherche des associations plutôt que des oppositions. Le nombre de centres de
gravités n’est pas défini a priori.
L’interprétation de position des entités analytiques hétérogènes ou intermédiaires sur le plan factoriel
est toujours problématique, voir impossible. A l’inverse, les algorithmes de RéseauLu tiennent à les
associer, les garder dans la configuration et de laisser la possibilité d’interprétation. Ce type d’entité
14
hétérogène ou intermédiaire est souvent le plus intéressant et le moins évident, devenant un
précurseur de changement et de comportement émergent.
Indications bibliographiques
Méthodologie
Michel Callon, ‘Les méthodes d’analyse des grands nombres peuvent-elles contribuer à
l’enrichissement de la sociologie du travail?’, in Pouchet, Amélie (ed.), Sociologies du travail:
quarante ans après (Paris: Elsevier, 2001), 335-54.
Mogoutov A., Données Relationnelles en sciences sociales: essai de minimalisme
méthodologique., Pratiques de formation, 141-148, Université de Paris VIII, 1998
Mogoutov A. ‘Réseau-Lu 6.13, Sistema di esplorazione di dati relazionali’, in Antonio M. Chiesi (ed.),
L’analisi dei reticoli (Milano: Franco Angeli, 1999), 221-5;
Réseaux hétérogènes
Alberto CAMBROSIO Peter KEATING Andrei MOGOUTOV MAPPING COLLABORATIVE WORK
AND INNOVATION IN BIOMEDICINE: A COMPUTER-ASSISTED ANALYSIS OF ANTIBODY
REAGENT WORKSHOPS Social Studies of Science à paraitre en 2003
A Comparative Analysis of Public, Semi-Public and Recently Privatised Research Centres
Methodological Report , Prepared by PREST, University of Manchester on behalf of the project
consortium, March 2002, Working paper 2002·12, http://www.sister.nu/pdf/wp_12.pdf, ISSN 16503821
Nicolas Dodier and Janine Barbot, ‘Le temps des tensions épistémiques. Le développement
des essais thérapheutiques dans le cadre du sida (1982-1996)’, Revue française de sociologie,
Vol. 41 (2000), 79-118.
Rabeharisoa, V. et Callon, M., 1999, Le pouvoir des malades. L'Association française contre les
myopathies et la Recherche, Paris : Presses de l'Ecole des mines.
Réseaux sociaux
Catherine Bonvalet et Tania Vichnevskaia. La sociabilité des femmes : une étude des
réseaux egocentrés. Dans : Vivre plus longtemps, avoir moins d'enfants, quelles
implications ? : actes du [10e] colloque international de l'AIDELF, 10-13 octobre 2002,
Byblos- Jbeil, Liban.- Paris: Presses universitaires de France, 2002, p. 383-396
Analyse biographique
Bruno LATOUR, La Fabrique du droit. Une ethnographie du Conseil d'Etat, La Découverte, 2002,
Eva Lelièvre et Géraldine Vivier. Evaluation d'une collecte à la croisée du quantitatif et du
qualitatif : l'enquête Biographies et entourage Population, revue de l'INED, n° 6,
novembre-décembre 2001, p. 1043-1073
15
Tichit C., Pour une autre approche des biographies
"configurationnelle"Rapport de recherche du CEPED 23
:
de
la
collecte
a
l’analyse
Analyse textuelle
Yara MAKDESSI, Andréi MOGOUTOV avec Tania VICHNEVSKAIA "Le choix des maux et de la
langue pour parler de soi." Dans : « L’éloge de la différence : la voix de l’Autre » (Beyrouth, 11-13
novembre 1999). Sous la direction de André Colas 239-252
Glossaire
Réseau – ensemble d’éléments avec des liens entre eux.
Sous réseau – sous ensemble d’éléments avec des liens entre eux.
Parcours – suite des nœuds connectés
Elément – nœud d’un graphe, objet graphique qui correspond à une modalité d’une variable ou à un
nom. Sa taille est proportionnelle à une valeur numérique (nombre de liens, fréquence, etc.)
Lien – se définit selon le contexte de l’étude (co-occurrence, lien directe, etc.) graphiquement
représenté par un trait deux objets graphiques. L’épaisseur est proportionnelle à une valeur
numérique (fréquence de liens)
16
Téléchargement