Questions de la méthode et techniques d’analyse de l’enquête Andrei Mogoutov et Tania Vichnevskaia Introduction L’étude « Démographie au seuil de l’an 2000 » a été réalisée par les démographes, pour les démographes et sur les démographes. Une des questions centrale de l’enquête est la recherche de la définition d’une communauté de spécialistes de la population. L’appartenance à la population – cible s’avère un résultat de l’autodéfinition, c’est un produit d’une volonté des membres de la communauté à répondre. Dans ce cas elle renvoi à une quête identitaire voir une construction identitaire ou à une stratégie de prise de la parole au sein de la communauté de recherche définie par quelques repères institutionnels et un certain nombre de mots-clés. Dans cette optique d’un recensement professionnel d’une communauté dont on ne connaît ni la taille ni la définition, les questions de la représentativité ne sont pas applicables dans le sens traditionnel. En d’autres termes l’échantillon est représentatif de soi-même, cet objet est unique et complet dans le cadre de l ‘étude telles quelle a été menée. Il résulte d’une diffusion de l’information qui a pu être activé par les moyens des messages électroniques, des annonces lors des conférences et dans les publications spécialisées, ainsi que sur des portails Internet. Cette structure initiale de communication peut être considérée comme un réseau social des porteurs de l’information. On propose un modèle d’un réseau hétérogène qui reflète cet objet. Les nœuds de ce réseau sont représentés par les personnes, les institutions, les questions et les modalités des réponses aux questions. Technique d’analyse Le statut particulier et la structure complexe de l’objet nous obligent de revoir et d’adapter la portée d’application des méthodes analytiques et le niveau d’interprétation des résultats. Les indicateurs issus de l’appareil statistique ne sont pas utilisés en tant que moyen de description statistique de l’échantillon mais comme un éventuel outil de description et d’exploration d’un réseau hétérogène, notre modèle de l’objet. Les indicateurs expriment l’importance relative de différentes modalités des données ainsi que comme une force de lien (la co-occurrence) entre plusieurs questions. La technique d’analyse des données est construite à partir de l’analyse des co-occurrences des modalités dans le même questionnaire remplis. Cette approche est complémentaire à une description quantitative plus traditionnelle exprimé sous une forme d’un tableau de fréquence de tableau croisé et de différentes mesures statistiques ou des méthodes plus sophistiquées. 1 Nous examinerons dans la partie qui suit la description de la méthodologie suivie des exemples d’analyse RéseauLu1. Cartographie relationnelle des données, approche RéseauLu (modèle, résultats et interprétation) L’approche relationnelle RéseauLu a été initialement développée pour l’exploration et l’analyse des réseaux hétérogènes. Cette notion articule toutes données pour lesquelles les notions d’éléments et de liens entre ces éléments sont définies. Les individus, les institutions, les objets et les propriétés sont considérés comme éléments à la même échelle sans qu'une hypothèse de structuration soit définie a priori. Pour le traitement de la présente enquête chaque questionnaire rempli est considéré comme un ensemble d’énoncés cohérent qui suit une logique et qui reflète une construction discursive. L’analyse des données se réalise selon deux approches complémentaires : a) description structurale - la restitution d’un réseau des entités sémantiques en tant que « structure du possible » dans le cadre d’analyse d’un discours commun. b) description quantitative utilisée comme une sorte de pondération, comme les propriétés quantitatives projetées sur la « structure du possible » Des algorithmes spécifiques ont été mis en œuvre dans RéseauLu pour permettre l’analyse et la représentation de la structure des données, la schématisation et la cartographie des entités analytiques. Les données sont considérées comme un ensemble d’éléments dans l’espace de deux dimensions. Chaque élément se caractérise par deux aspects : les propriétés de l’élément et ses liens. Les propriétés sont exprimées soit par la couleur soit par la forme sur le graphe. Il est possible d’utiliser des propriétés plus complexes, comme l’appartenance aux clusters lors d’une analyse multivariée comme nous allons le présenter dans les exemples qui suivent. La visualisation de liens se réalise à partir des données de la matrice de liens. Des algorithmes des RéseauLu optimisent le positionnement des éléments sur le plan. La matrice originelle ne peut être représentée sans déformation que dans un espace multidimensionnel. Pour diminuer la déformation sur le plan, le logiciel utilise le positionnement dynamique qui simule l’interaction entre les éléments. Trois niveaux d’optimisations sont réalisés : 1. Positionnement initial global des éléments les uns par rapport aux autres sur le plan 1 RéseauLu est un logiciel et un système analytique qui réunit dans un environnement analytique différents types de données qualitatives et quantitatives: enquêtes, entretiens, bases de données, corpus de texts. Le plan analytique permet de combiner l'analyse de différents aspects de données: relationnelles, temporelles et textuelles. Trois types d’applications : analyse des données relationnelles, analyse biographique, analyse textuelle Conception, développement : Andrei Mogoutov IDDN.FR.010 .0087977.000.R.P.2000.030.20000 Distribution AGUIDEL: www.aguidel.com 2 2. Optimisation au niveau micro du positionnement des éléments par rapport à leurs ‘voisins’ sur le graphe 3. Optimisation du positionnement au niveau meso des groupes des éléments fortement interconnectés L’algorithme réalisé dans les versions actuelles du logiciel combine plusieurs approches de simulation directe de déplacement des éléments géométriques en présence des forces aléatoires, de la projection non - linéaire sur un plan d’une structure multidimensionnelle, de la mise en échelle des distances entre les éléments, le calcul des groupes d'éléments et l'ordre de leur apparition dans la structure. La représentation finale utilise plusieurs critères - tient compte de l’ensemble de liens entre les éléments ; - tend à minimiser le nombre de croisements des liens ; - place les éléments le plus «lisiblement » possible en minimisant l’intersection des points ; - place les éléments le plus symétriquement possible ; - place les éléments complètement connectés dans un espace à une densité uniforme ; - place les groupes d’éléments fortement connectés «ensemble » sur la carte en formant les amas des points ; - place ensemble sur la carte les éléments avec une forte similitude des positions structurales L’orientation du réseau final est déterminée par la position des éléments les plus connectés. Exemple 1a. Cooccurrence des noms des démographes cités comme références. L’exemple suivant illustre l’analyse des cooccurrences des noms des démographes importants pour les travaux personnels cités par l’ensemble des répondants. Dans cet exemple les éléments correspondent aux noms cités et les liens signifient que les deux noms ont étés cités par le même répondant. Nous avons sélectionné pour l’analyse que les noms dont la fréquence de citation est supérieure à 1. L’analyse se produit en deux étapes : 1. construction d’une matrice des liens 2. visualisation des liens 3 La matrice des liens représente un tableau à double entrée, le ‘1’ signifiant que les deux noms ont été cité par le même répondant et le ‘0’ – qu’ils ne l’ont jamais été. Vous trouverez sur la fig.1 le sous réseau I qui correspond à la matrice des liens du Tableau 1. Smith S Morrison P. Tayman J. Swanson D. Shryock H.S Notestein F.W. Smith S 1 1 1 0 0 1 1 1 0 1 1 0 1 0 Morrison P. 1 Tayman J. 1 1 Swanson D. 1 1 1 Shryock H.S 0 1 1 1 Notestein F.W. 0 0 0 0 1 1 Tableau 1. Extrait d’un tableau de liens de cooccurrence des noms des démographes contemporains cités comme références pour les travaux personnels des répondants (seuil de fréquence >=2). 4 Sous-réseau II Sous-réseau III Morgan P Coleman J Watkins S C Furstenberg F Birg H Thomson E Volkov A Lieberson S Borissov V Darski A Folbre N McDonald P Bourdieu P Bumpass L Goldscheider F Oppenheimer V K Campbell D T Mason K Schoen R Lee Nerlove Perret J Tapinos G Sanderson W C Thomas Smil V Castel R Singer B Chesnais C Thornton A Vaupel J Keilman N Boserup E Manton K Sous-réseau I Becker G S Valentei Urlanis B D Vallin J Lee R D Lutz W Coleman D Rees P Champion T Ryder N Cleland J Wachter K Smith S Sauvy A Hoem J M Willekens F Morrison P Van de Kaa D Schultz T Jejeebhoy Greenhalgh S Amarthya Sen Davis K Rogers A Demeny P Léridon H Preston S H Lesthaeghe R Murphy M Feeney G Henripin J Keyfitz N Easterlin R A Tayman J Glass D V Notestein F W Freedman R Bogue D Caldw ell J C Lee E S Sw anson D Coale A Warnes Shryock H S Kish L Westoff C Bourgeois-Pichat J Pressat R Festy P Blossfeld H P Courgeau D Modell Roussel L Bongaarts J Rohw er Tsui Brass W Siegel J Hill K Henry L Mc Nicoll G Wunsch G J Frey W Knodel J E Caselli G Hauser P Hajnal J Portes A Mayer K U De Jong Brow n D Braudel F Haw ley A Cox D Massey D Salt J Légaré J Harvey D Wrigley E A Laslett P McKeow n T Giddens A Chasteland J C Dupaquier J Kuijstein A Anderson B Romaniuc A Castells M Palloni A Livi Bacci M Biraben J N Tabutin D Goubert P Piché V Goody J Todaro M Locoh T Calot G Bardet J P Reher D Cosio-Zavala M E Le Bras H Uhlenberg P Poppel V Elder G Szreter Antoine P Sous-réseau IV Cabré A Bozon M Thumerelle P J Foucault M Fig. 1. Cooccurrences des références nominatives des chercheurs contemporains qui représentent une référence importante pour les travaux personnels des répondants seuil de fréquence >=2. Extrait d’un commentaire L’analyse RéseauLu dans cet exemple permet de relever la structure des références déclarées par l’ensemble des répondants, tout en gardant les caractéristiques quantitatives. La position structurale reflète les « voisinages » dans les citations tandis que la taille du point associé au nom - la fréquence de citation dans l’ensemble de l’échantillon. 5 Pour commenter le graphe il est nécessaire de tenir compte des niveaux complémentaires d’interprétation : le niveau global et le niveau local . - au niveau global ce graphe a une configuration très centré sur les chercheurs les plus fréquemment cités comme J.C.Caldwell, A.Coale , R Leastaghe, N.Keyfits, S.Preston, J.Bongaarts. W.Brass, L.Henry, D'autre sous-réseaux sont moins denses mais on distingue, par exemple, le sous- réseau formé de chercheurs comme Vaupel, Boserup, Chesnais, Vallin, Greenhalgh, Cleland et Wchter ou celui avec Livi-Bacci, Cox, Massey, Laslett, McKeown, Wrigley. - au niveau local sur le graphe dans les sous-réseau II de la fig.1 on cherche l’entourage proche de l’élément. Par exemple Pressat est positionnée dans l'entourage de J.C. Caldwell, A. Coale, P.Festy, Bourgeois-Pichat, J.Bongaarts et L.Roussel Exemple 1b. Références nominatives des chercheurs contemporains qui représentent une référence importante pour les travaux personnels des répondants selon la région de naissance Dans l’exemple suivant les noms des chercheurs contemporains qui représentent une référence importante pour les données personnelles sont croisés avec la région de naissance des répondants. Cet exemple est plus complexe, la visualisation des liens entre les modalités de deux variables est précédée par une sélection des liens les plus spécifiques selon une procédure décrite en détail dans l’exemple 2a. 6 Willekens F Bogue D Caldw ell J C Asie+Océanie non australienne Keyfitz N Easterlin R A Rogers A McKeow n T Lesthaeghe R Demeny P Lee R D Australie, Nouvelle-Zélande Davis K Bumpass L Van de Kaa D Livi Bacci M Le Bras H Bourgeois-Pichat J Salt J Roussel L Hajnal J Léridon H Freedman R Westoff C Urlanis B Goldscheider F Moyen-Orient Europe Wrigley E A Ryder N Amérique du Nord Calot G Preston S H Shryock H S Massey D Sauvy A Thumerelle P J Siegel J Coale A Dupaquier J Valentei D Braudel F Pressat R Portes A Vaupel J Cleland J Japon Bongaarts J Hoem J M Boserup E Laslett P Henry L Amérique Latine Vallin J Lutz W Manton K Chesnais C Afrique Bourdieu P Giddens A Amarthya Sen Courgeau D Brass W Keilman N Greenhalgh S Schultz T Becker G S Fig. 2. Références nominatives des chercheurs contemporains qui représentent une référence importante pour les travaux personnels des répondants selon la région de naissance, seuil de fréquence >=3, 50% de liens les plus spécifiques. Au niveau global la première lecture fait ressortir deux pôles: européen et américain, le fait que les spécialistes en population européens et américains ne soient pas influencés par les mêmes chercheurs. Quelques groupes de chercheurs indiqués par les cercles sur le graphe dont l'influence est "partagée" entre les ressortissants de différentes régions sont à distinguer. La deuxième lecture propose de rechercher les personnes de référence pour les ressortissants de différentes régions. Coale, par exemple, se trouve lié à l'Amérique du Nord, l'Afrique et le Moyen Orient, et BourgeoisPichat se positionne entre les Européens et les ressortissants du Moyen Orient et Australie-Nouvelle Zélande Exemple 2a. Analyse des disciplines de formation des répondants selon la région de naissance. L'exemple suivant représente une analyse des réponses à la question « Quelles sont les principales disciplines de votre formation universitaire » pour sept groupes de pays. Le résultat de cette analyse est une projection d’une sélection des liens entre les modalités des deux variables. La visualisation est précédée par une sélection des liens les plus spécifiques. L’analyse se réalise en deux étapes utilisant deux groupes d’algorithmes différents : 1. Construction d’une matrice d’association 7 2. Visualisation des liens spécifiques 1. Construction d’une matrice d’association L’analyse débute par la construction d’un simple tableau croisé des données. Le tableau 1 représente le croisement des régions de naissance des répondants avec les disciplines de formations qu’ils ont suivi. Trois étapes de transformation sont réalisées à partir de cette matrice 1. construction d’une matrice des valeurs pondérées 2. construction d’une matrice des valeurs attendues 3. construction d’une matrice d’associations Du tableau 2 de fréquence on passe à la matrice d’association du tableau 3. A5 / A3 Anthropologie sociale, ethnologie Biologie, biométrie, anthropologie physique Commerce, marketing, management Démographie Afrique 3 Amérique du Nord 5 1 Amérique Latine 4 Asie+Océanie non australienne Australie, NouvelleZélande 2 1 Europe 1 9 1 3 3 41 91 30 2 Économie 18 31 Génétique 2 1 1 Géographie 8 2 5 2 Histoire 3 10 5 2 51 Informatique 10 3 7 4 34 Mathématiques et statistique Médecine, épidémiologie 25 24 17 10 2 6 3 4 5 4 2 12 6 3 4 2 2 3 2 14 77 20 13 3 4 7 2 Préhistoire, paléontologie Psychologie, psychologie sociale Science politique, administration publique Sciences de l'actuariat, assurances Sciences de l'environnement, écologie Sociologie Urbanisme, aménagement du territoire MoyenOrient 22 2 Droit Japon 1 14 30 9 202 1 1 1 11 11 3 21 117 9 1 1 4 9 2 2 1 65 1 1 2 1 134 1 3 19 1 1 7 1 1 2 2 9 1 33 1 4 1 10 1 115 25 1 4 2 Tableau 2. Tableau croisé de fréquence des disciplines de formation des répondants selon les régions de naissance. Lors de la deuxième étape la matrice des valeurs attendues correspondants à l’hypothèse « 0 » d’une indépendance statistique des colonnes et des lignes du tableau est crée. Les valeurs des cellules sont 8 remplacées par une combinaison des valeurs marginales (multiplication des totaux correspondant des lignes et des colonnes divisé par le total général) La construction de la matrice d’association résume la 3me étape. Les valeurs des cellules sont calculées comme la différence entre les valeurs observées et les valeurs attendus selon la formule (Vo-Va)/(sqr(Va)) A5 / A3 Afrique Amérique Amérique Asie+Océanie Australie, Europe Japon Moyendu Nord Latine non NouvelleOrient australienne Zélande Anthropologie sociale, ethnologie Biologie, biométrie, anthropologie physique Commerce, marketing, management Démographie -0,17 -0,61 0,57 0,11 -0,65 0,25 -0,43 0,24 -0,07 -1,46 0,02 -0,78 -0,37 0,86 -0,25 1,47 -0,04 -0,53 0,82 -1,07 1,45 0,29 -0,34 -0,70 0,63 2,03 -0,65 2,02 2,00 -2,09 0,64 0,05 Droit -1,56 -1,27 -0,81 -0,30 1,26 1,48 -0,37 0,56 Économie 0,17 -0,55 -1,19 0,43 -1,48 0,78 0,03 -0,06 Génétique 0,77 -0,86 -0,06 -0,81 -0,38 0,62 -0,26 -0,53 Géographie 0,14 -3,37 -0,73 -1,10 1,06 2,47 -0,65 -0,60 -1,41 -0,86 -0,42 -0,89 -0,91 1,44 1,03 0,34 2,05 -2,31 1,00 0,61 -0,82 0,13 -0,54 -0,23 -0,75 Histoire Informatique Mathématiques et statistique 1,28 -2,31 -0,14 -0,25 -0,28 1,11 -0,08 Médecine, épidémiologie -0,51 0,14 0,24 -1,27 -0,60 0,22 2,10 0,39 Préhistoire, paléontologie -0,85 -1,19 0,43 -0,63 -0,30 1,17 -0,20 -0,41 1,26 0,36 1,46 -0,19 -0,52 -1,23 -0,35 0,68 -1,32 0,72 0,72 -1,66 0,48 0,36 -0,53 -0,16 1,31 0,69 0,61 1,34 -0,42 -1,67 -0,28 1,13 0,30 -0,11 0,44 -0,95 -0,45 -0,05 -0,30 1,00 -1,71 5,05 -0,01 0,19 -0,46 -2,01 -0,21 -0,54 -0,43 -1,31 1,87 -0,11 -0,70 0,15 -0,46 1,13 Psychologie, psychologie sociale Science politique, administration publique Sciences de l'actuariat, assurances Sciences de l'environnement, écologie Sociologie Urbanisme, aménagement du territoire Tableau 3. Matrice d’association On considère un pourcentage des valeurs positives les plus élevées de cette matrice. Cette procédure est réalisée par un module du système RéseauLu selon un seuil indiqué suivi par le module de visualisation décrit ci-dessus. 9 Informatique Sciences de l'environnement,écologie Psychologie, psychologie sociale II Urbanisme, aménagement du territoire Génétique Amérique Latine Moyen-Orient Afrique Science politique, administration publique Médecine, épidémiologie Sciences de l'actuariat, assurances Mathématiques et statistique Biologie, biométrie, anthropologie physique Japon Amérique du Nord Commerce, marketing, management Asie+Océanie non australienne Sociologie Histoire III Europe Démographie Australie, Nouvelle-Zélande I Géographie Préhistoire, paléontologie Droit Économie Fig. 3. Les disciplines de formation des répondants selon la région de naissance, 30% des liens les plus spécifiques (les lignes continues représentent les liens les plus spécifiques qui correspondent 15% des liens les plus spécifiques, les 15% des liens suivant sont représenté par des pointillées) Extrait d'un commentaire. Pour commenter le graphe il est nécessaire de tenir compte de trois niveaux complémentaires d’interprétation : niveau global, niveau local et niveau intermédiaire. Au niveau global on distingue trois groupes de régions avec les disciplines qui leurs sont spécifiques I. Europe ; II. Afrique, Amérique Latine et le Moyen-Orient ; III. Etats-Unis, Australie, Nouvelle Zélande et Asie+Océanie non australienne. Au niveau local sur le graphe on cherche l’entourage proche de l’élément, par exemple dans le présent exemple l’économie s’est avéré spécifique comme discipline de formation pour l’Europe, la sociologie – pour l’Amérique du Nord et la démographie pour les Etats-Unis, l’Australie, Nouvelle Zélande et l’Asie+Océanie non australienne. 10 Au niveau intermédiaire il est important de tenir compte des points de transition ? qui sont en même temps le lien entre les sous réseaux et qui se trouvent à la frontière, comme, par exemple les sciences de l’actuariat et les sciences politiques et administration publique entre le groupe II et III Exemple 2b. Combinaison et comparaison des méthodes: cartographie relationnelle et analyse factorielle D’habitude dans les projets réels il est recommandé de construire plusieurs cartes avec différents niveaux de seuil afin de trouver les valeurs optimales. Dans certains cas il s’avère utile de combiner plusieurs méthodes d’analyse, tel que analyse factorielle des correspondances, classification automatique, analyse multidimensionnel etc. Certain de ces algorithmes font partie du système RéseauLu. L’exemple qui suit permet d’illustrer cette utilisation combinée de plusieurs techniques sur les mêmes données. La figure 4 représente le premier plan des résultats de l’analyse factorielle des correspondances2 des disciplines de la formation professionnelle et des régions de naissances des répondants. 2 Réalisé avec XLSTAT version 5.1 - Analyse Factorielle des Correspondances (AFC) - Pour cette analyse le test d'indépendance entre les lignes et les colonnes actives du tableau de contingence est le suivant : Valeur observée du khi² (ddl = 126) : 171,785 P-value associée : 0,004 Le test étant unilatéral, la p-value est comparée au seuil de signification : alpha= 0,050 Valeur critique du khi² (ddl = 126) : 153,202 Valeurs propres et pourcentage de variance : F1 F2 F3 F4 Valeur propre 0,055 0,021 0,012 0,008 % variance 51,295 19,162 11,505 7,438 11 A5 / A3 (axes F1 et F2 : 70 %) 0,7 Sciences de l'actuariat, assurances 0,6 0,5 0,4 Afrique Informatique Psychologie, psychologie sociale 0,3 axe 2 (19 %) Asie+Océanie non australienne 0,2 0,1 Urbanisme, aménagement du territoire Génétique Amérique Latine Moyen-Orient Mathématiques et statistique Anthropologie sociale, ethnologie 0 Démographie Sciences de l'environnement, écologie Économie Biologie, biométrie, anthropologie physique Amérique du Nord Europe Géographie -0,1 Commerce, marketing, management Sociologie Australie, Nouvelle-Zélande -0,2 Histoire Médecine, épidémiologie Japon -0,3 -0,4 -0,8 Préhistoire, paléontologie -0,6 Science politique, administration publique Droit -0,4 -0,2 0 0,2 0,4 0,6 axe 1 (51 %) Fig. 4 Premier plan des résultats de l’analyse des correspondances des disciplines de la formation professionnelle et des régions de naissances des répondants Afrique Amérique du Nord Amérique Latine Asie+Océanie non australienne Australie, Nouvelle-Zélande Europe Japon Moyen-Orient F1 0,528 67,462 0,002 5,157 0,136 26,342 0,370 0,004 F2 54,500 6,639 4,614 17,998 1,500 12,193 1,487 1,069 Tableau 3. Contribution des points - colonnes (%) de l'analyse factorielle des correspondances des disciplines de la formation professionnelle et des régions de naissances des répondants. Anthropologie ethnologie Biologie, F1 sociale, 0,461 F2 0,215 biométrie, 3,794 0,017 12 anthropologie physique Commerce, marketing, management Démographie Droit Economie Génétique Géographie Histoire Informatique Mathématiques et statistique Médecine, épidémiologie Préhistoire, paléontologie Psychologie, psychologie sociale Science politique, administration publique Sciences de l'actuariat, assurances Sciences de l'environnement, écologie Sociologie Urbanisme, aménagement du territoire 0,715 0,704 12,089 3,428 0,778 1,904 20,958 2,602 4,681 7,885 0,024 3,225 0,666 0,015 3,467 8,685 0,025 0,184 1,187 9,469 21,795 2,958 3,804 2,378 8,583 10,343 2,946 15,705 0,122 0,074 32,109 1,599 9,388 1,021 Tableau 4. Contributions des points-lignes (%) : de l'analyse factorielle des correspondance des disciplines de la formation professionnelle et des régions de naissances des répondants. Le premier axe exprime l’opposition en termes des régions de l’Europe par rapport au reste du monde (surtout des Etats-Unis si on tient compte de la contribution. Il met en opposition la sociologie et la démographie par rapport aux sciences naturelles comme géographie, biologie, biométrie, anthropologie physique, génétique. Deuxième axe reflète l’opposition de l’Europe par rapport aux pays à l’Asie et l’Afrique. La séparation des disciplines les sciences sociales sont opposées aux disciplines techniques ou appliquées. 13 Informatique Sciences de l'environnement,écologie Psychologie, psychologie sociale Urbanisme, aménagement du territoire Génétique Amérique Latine Moyen-Orient Afrique Médecine, épidémiologie Science politique, administration publique Sciences de l'actuariat, assurances Mathématiques et statistique Biologie, biométrie, anthropologie physique Japon Amérique du Nord Commerce, marketing, management Asie+Océanie non australienne Sociologie Histoire Europe Démographie Préhistoire, paléontologie Géographie Australie, Nouvelle-Zélande Droit Économie Fig. 5 Les disciplines de formation des répondants selon la région de naissance, 30% des liens les plus forts. Ce réseau est une reprise de la fig. 3 qui contient quelques éléments de l’analyse factorielle. La direction des triangles correspond aux axes de l'analyse factorielle. Les résultats de l’analyse RéseauLu ne contredisent pas les résultats de l’analyse factorielle. Mais ils permettent de donner une lecture complémentaire qui n’est pas basée sur le principe des oppositions mais sur celui de cooccurrence. La formation des démographes européens se veut très classiques et générales avec des grandes disciplines comme Histoire, Géographie, Economie, Droit ; Les disciplines des sciences sociales et d’études de population comme démographie, sociologie et sciences politiques sont spécifiques aux régions regroupées autour du Pacifique ; Les disciplines plus spécialisées et moins académiques comme psychologie, psychologie sociale, urbanisme, aménagement du territoire, sciences de l’environnement sont spécifiques à l’Afrique, l’Amérique Latine et Moyen Orient RéseauLu ne nécessite pas de définition de nombre de pôles et d’opposition a priori. Par rapport à l’analyse factorielle avec son raisonnement binaire des oppositions, RéseauLu donne une certaine souplesse dans la recherche des associations plutôt que des oppositions. Le nombre de centres de gravités n’est pas défini a priori. L’interprétation de position des entités analytiques hétérogènes ou intermédiaires sur le plan factoriel est toujours problématique, voir impossible. A l’inverse, les algorithmes de RéseauLu tiennent à les associer, les garder dans la configuration et de laisser la possibilité d’interprétation. Ce type d’entité 14 hétérogène ou intermédiaire est souvent le plus intéressant et le moins évident, devenant un précurseur de changement et de comportement émergent. Indications bibliographiques Méthodologie Michel Callon, ‘Les méthodes d’analyse des grands nombres peuvent-elles contribuer à l’enrichissement de la sociologie du travail?’, in Pouchet, Amélie (ed.), Sociologies du travail: quarante ans après (Paris: Elsevier, 2001), 335-54. Mogoutov A., Données Relationnelles en sciences sociales: essai de minimalisme méthodologique., Pratiques de formation, 141-148, Université de Paris VIII, 1998 Mogoutov A. ‘Réseau-Lu 6.13, Sistema di esplorazione di dati relazionali’, in Antonio M. Chiesi (ed.), L’analisi dei reticoli (Milano: Franco Angeli, 1999), 221-5; Réseaux hétérogènes Alberto CAMBROSIO Peter KEATING Andrei MOGOUTOV MAPPING COLLABORATIVE WORK AND INNOVATION IN BIOMEDICINE: A COMPUTER-ASSISTED ANALYSIS OF ANTIBODY REAGENT WORKSHOPS Social Studies of Science à paraitre en 2003 A Comparative Analysis of Public, Semi-Public and Recently Privatised Research Centres Methodological Report , Prepared by PREST, University of Manchester on behalf of the project consortium, March 2002, Working paper 2002·12, http://www.sister.nu/pdf/wp_12.pdf, ISSN 16503821 Nicolas Dodier and Janine Barbot, ‘Le temps des tensions épistémiques. Le développement des essais thérapheutiques dans le cadre du sida (1982-1996)’, Revue française de sociologie, Vol. 41 (2000), 79-118. Rabeharisoa, V. et Callon, M., 1999, Le pouvoir des malades. L'Association française contre les myopathies et la Recherche, Paris : Presses de l'Ecole des mines. Réseaux sociaux Catherine Bonvalet et Tania Vichnevskaia. La sociabilité des femmes : une étude des réseaux egocentrés. Dans : Vivre plus longtemps, avoir moins d'enfants, quelles implications ? : actes du [10e] colloque international de l'AIDELF, 10-13 octobre 2002, Byblos- Jbeil, Liban.- Paris: Presses universitaires de France, 2002, p. 383-396 Analyse biographique Bruno LATOUR, La Fabrique du droit. Une ethnographie du Conseil d'Etat, La Découverte, 2002, Eva Lelièvre et Géraldine Vivier. Evaluation d'une collecte à la croisée du quantitatif et du qualitatif : l'enquête Biographies et entourage Population, revue de l'INED, n° 6, novembre-décembre 2001, p. 1043-1073 15 Tichit C., Pour une autre approche des biographies "configurationnelle"Rapport de recherche du CEPED 23 : de la collecte a l’analyse Analyse textuelle Yara MAKDESSI, Andréi MOGOUTOV avec Tania VICHNEVSKAIA "Le choix des maux et de la langue pour parler de soi." Dans : « L’éloge de la différence : la voix de l’Autre » (Beyrouth, 11-13 novembre 1999). Sous la direction de André Colas 239-252 Glossaire Réseau – ensemble d’éléments avec des liens entre eux. Sous réseau – sous ensemble d’éléments avec des liens entre eux. Parcours – suite des nœuds connectés Elément – nœud d’un graphe, objet graphique qui correspond à une modalité d’une variable ou à un nom. Sa taille est proportionnelle à une valeur numérique (nombre de liens, fréquence, etc.) Lien – se définit selon le contexte de l’étude (co-occurrence, lien directe, etc.) graphiquement représenté par un trait deux objets graphiques. L’épaisseur est proportionnelle à une valeur numérique (fréquence de liens) 16