Variables, mécanismes et simulations : une synthèse des

Gianluca MANZO
Variables, mécanismes et simulations :
une synthèse des trois méthodes est-elle possible ?
Une analyse critique de la littérature
RÉSUMÉ
L’article présente une analyse critique de quatre débats sociologiques contemporains.
L’analyse systématique de cette littérature suggère l’existence d’un projet de reformulation
des fondements méthodologiques de la sociologie empirique quantitative. Notre reconstruc-
tion montre l’émergence de l’idée suivante : afin de résoudre certaines impasses de la socio-
logie empirique quantitative « standard », une alliance entre l’analyse par variables, la
méthodologie des mécanismes et les techniques de simulation serait largement bénéfique et
profitable. L’article teste ensuite cette thèse dans le cadre de la sociologie quantitative de la
mobilité sociale en montrant que celle-ci présente des signes incontestables allant dans le
sens d’une acceptation de cette idée. En conclusion, nous établissons un lien entre ces
débats récents et des propositions similaires plus anciennes en nous interrogeant notamment
sur les raisons qui ont amené à ne reconnaître le bien-fondé de ces dernières que si récem-
ment.
Des travaux récents discutent certaines des difficultés « chroniques » de
notre discipline. On dénonce la séparation parfois radicale entre théorie et
recherche (Boudon, 1997 ; Cuin, 2000 ; Goldthorpe, 2000c ; Hedstrom et
Swedberg, 1996, 1998b) ; on souligne la faiblesse de la théorie sociologique
(Coleman, 1990 ; Van den Berg, 1998) ; on interroge les fondements de la
recherche empirique (Ragin et Becker, 1992) ; on questionne le statut scienti-
fique même de l’analyse sociologique (Cuin, 2000, 2004 ; Passeron, 1991 ;
Raynaud, 2004). L’échange entre Raymond Boudon (2002c) et John
Goldthorpe (2003a) autour de la « sociologie qui compte » synthétise bien
cette phase d’« effervescence réflexive » de la sociologie contemporaine.
Des soucis méthodologiques analogues sont à l’origine de cet article : notre
réflexion ne porte pourtant pas sur la sociologie en général mais sur une tradi-
tion de recherche spécifique, celle de la « sociologie empirique quantita-
tive » (1).
37
R. franç. sociol., 46-1, 2005, 37-74
(1) On trouve en littérature plusieurs
étiquettes pour indiquer cette approche :
«variable centred methodology » (Abell,
1984), « variable-oriented approach » (Ragin,
1987, chap. 4), « variable based-approach »
(Abbott, 1992a, p. 441), « standard positivist
analysis » (Abbott, 1992b, p. 62), « variable
sociology » (Esser, 1996), « quantitative analysis
Ce courant particulier de l’analyse sociologique n’a pas non plus été
épargné par de vivants débats critiques visant le dépassement de certaines de
ses limitations majeures. Que des travaux importants tels que ceux de Stanley
Lieberson (1985), de Charles Ragin (1987) ou de Ray Pawson (1989) n’aient
pas suffit à limiter les « dangers » potentiels découlant d’une utilisation naïve
de techniques dont la sophistication augmente de plus en plus, cela est bien
montré par la reprise virulente du débat au cours des années quatre-vingt-dix
(Clogg et Haritou, 1997 ; Esser, 1996 ; Sociological methodology, 1991, 21,
pp. 291-358 ; Sorensen, 1998). Ces discussions critiques commencent par
ailleurs à déboucher sur des propositions méthodologiques précises d’amen-
dement : Hans-Peter Blossfeld (1996, 1998) prône l’extension de l’utilisation
de données quantitatives longitudinales et leur traitement à l’aide des techni-
ques d’« event history analysis » afin d’augmenter la micro-fondation de la
sociologie empirique quantitative ; Andrew Abbott (1992a, 1992b, 1995,
2000 ; Abbott et Hrycak, 1990 ; Abbott et Tsay, 2000) propose une implé-
mentation de la notion de « narrative » à l’aide d’une technique issue de la
biologie, l’« optimal matching analysis » ; Peter Abell (1984, 1998, 2003),
enfin, partage l’idée de substituer la notion de « narrative » à celle de
«variable » mais il propose, à la différence d’Abbott, une méthode d’implé-
mentation de nature algébrique et non pas métrique (2).
Cet article propose une analyse de la littérature récente alimentant le débat
sur les limites de la sociologie empirique quantitative et sa possible reformu-
lation dans le sens d’une extension de son pouvoir explicatif. Nous centrerons
notre attention sur quatre types de contributions scientifiques : 1) les contribu-
tions qui discutent les problèmes propres à cette approche ; 2) celles qui ont
trait à la notion d’action sociale et de rationalité ; 3) les travaux sur le concept
de mécanismes générateurs ; 4) les publications sur l’application des
méthodes de simulation en sociologie. Il est possible de montrer que ces
quatre types de productions sociologiques se renvoient l’un à l’autre : notre
38
Revue française de sociologie
(suite note 1)
of large-scale data sets » (Goldthorpe, 1996a),
«sociologie quantitative » (Corbetta, 1999),
«sociologie positiviste » (Cherkaoui, 2000,
2003a). Nous préférons parler de sociologie
empirique quantitative dans le but de rappeler
que la « variable sociology » n’épuise pas la
sociologie quantitative : il existe aussi une
forme de sociologie quantitative purement
théorique – à savoir, la sociologie mathéma-
tique – qui a son propre statut et sa propre
légitimité (Collins, 1992, pp. 619-640 ; Fararo,
1984, p. 219, 1997, p. 91 ; Edling, 2002, p. 202).
Sans en vouloir nier pour autant l’importance,
nous ne pouvons pas aborder ici la question
suivante : est-il fondé de parler de « sociologie
quantitative » ? Le débat épistémologique
portant sur les ambiguïtés de la distinction
« approche quantitative/approche qualitative »
mériterait sans doute plus d’attention que nous
ne pouvons lui accorder ici (voir, par exemple,
Agodi, 1996 ; Cannavo, 1988 ; Cardano, 1991).
(2) Le débat sur les potentialités de ces
propositions est actuellement en cours.
S’agissant des propos d’Abbott, on peut
consulter Halpin et Chan (1998), Levine
(2000), Santoro (2003), Wu (2000). Pour ce qui
est d’Abell, un numéro spécial de The journal
of mathematical sociology (1993, 18, 2-3) a été
consacré à ses travaux. Ce qui semble certain,
au moins pour le moment, c’est que ces tenta-
tives d’amendement sont fort partielles en ce
sens qu’elles ne sont pas en mesure de
surmonter le descriptivisme propre à la socio-
logie des variables ; la notion même de
«narrative », ensuite, pose plus de problèmes
qu’elle n’en résout, aspect déjà souligné par
Hempel (1965, pp. 447-453).
travail suggère que leur intersection constitue précisément un projet méthodo-
logique qui reformule la sociologie empirique quantitative.
Anticipant sur les conclusions : les trois derniers axes du débat fournissent
des solutions générales aux problèmes posés par le premier. En d’autres
termes, la littérature récente commence à dessiner un type de sociologie empi-
rique quantitative selon lequel l’analyse par variables décrit, la modélisation
par mécanismes (construit en termes d’individualisme méthodologique)
explique et la simulation anime (et teste) dynamiquement les mécanismes
supposés être à la base des relations statistiques observées. Nous ne mécon-
naissons pas que, ainsi formulée, seule une partie limitée de la littérature
soutient cette idée ; de plus, certains aspects de ces débats – la production sur
la « social simulation », surtout – sont encore largement ignorés par la plupart
des sociologues. Ce point de vue est toutefois conforté par quelques rares arti-
cles où les liens discutés ici sont explicitement rassemblés : il convient de
signaler à ce sujet un texte de John Goldthorpe (1999) et quelques travaux de
sociologie mathématique (Edling, 2002 ; Fararo et Hummon, 1995 ; Fararo,
1997 ; Fararo et Butts, 1999).
Il est clair ainsi que notre texte privilégie le débat « interne » à l’approche
quantitative, c’est-à-dire celui alimenté par des auteurs qui ne lui sont pas a
priori hostiles et qui prônent pour son amendement plutôt que son abandon.
Ce choix nous paraît justifiable. Comme le reconnaît Ray Pawson (1989,
chap. 1), maintes attaques à cette approche n’ont en effet bien souvent cons-
titué qu’un moyen pour forger sa propre identité sociologique sans qu’à la
critique aient suivi des propositions constructives : la manifestation la plus
claire de cette attitude se trouve du côté des sociologies dites « interpréta-
tives » (voir, par exemple, Berger, 2002 ; Blumer, 1956) (3). Ce choix pour-
rait toutefois alimenter une équivoque en ce sens qu’il pourrait transmettre au
lecteur une vision dichotomique du débat épistémologique et méthodologique
contemporain : d’une part, les sociologies dites « interprétatives » ou « cons-
tructivistes », d’autre part, les approches quantitatives à visée « nomothé-
tique ». Nous avons conscience de cette ambiguïté : nous espérons toutefois
que la pluralité d’auteurs et de contributions discutés au cours de notre
reconstruction suffira à effacer cette équivoque et à repousser une opposition
stérile qui n’est aucunement la nôtre.
Nous procéderons en trois moments. La première partie de cet article est
consacrée à la littérature récente qui discute les limites principales de
l’analyse par variables : ce débat étant mieux connu que les autres, nous n’en
présenterons que les éléments essentiels. La deuxième a trait à la manière
dont la sociologie empirique quantitative peut tirer profit d’une combinaison
avec un point de vue actionniste, une stratégie explicative fondée sur les
mécanismes générateurs et l’analyse par simulation. La troisième partie
39
Gianluca Manzo
(3) Reconnaître ceci n’équivaut pas pour
autant à nier l’importance de ces « critiques
externes » : de telles attaques ont en effet
contribué à sensibiliser les « sociologues
quantitatifs » aux limites de leurs analyses et,
par ce biais, à alimenter le « débat interne » à
l’approche quantitative.
discute un domaine sociologique précis – la sociologie de la mobilité sociale –
dans lequel la littérature récente montre des évolutions importantes qui vont
dans le sens d’une reformulation et d’un enrichissement de l’approche quanti-
tative « standard ». Notre analyse se conclura en suggérant la proximité entre
ces débats contemporains et des idées plus anciennes : nous esquisserons une
réponse à la question de savoir pourquoi ces dernières n’ont été pleinement
reçues que très tardivement.
Trois problèmes majeurs de l’« analyse par variables »
Le pouvoir explicatif reste contenu face à une sophistication technique
croissante : la littérature récente la plus attentive n’a plus de peine à admettre
cette limite majeure de l’utilisation des méthodes statistiques multivariées
dans l’analyse des phénomènes sociaux (Freedman, 1991a, 1991b).
Il est possible de reconnaître trois groupes de problèmes qui contribuent à
rendre compte de ce « décalage structurel » propre à la sociologie empirique
quantitative : 1) son caractère a-théorique ; 2) sa conception réductrice de la
causalité ; 3) son traitement partiel de la pluralité de niveaux caractérisant les
phénomènes sociaux.
«Quantitative sociology remains very theory-poor » (Sorensen, 1998,
p. 238) : Freedman (1991a) suggère qu’une telle pauvreté théorique concerne
plusieurs moments du processus de recherche quantitative. Le premier est la
phase de définition du modèle, à savoir la structure des relations entre les
variables à tester (Goldthorpe, 1996a ; Sorensen, 1998) (4). Le deuxième
concerne le moment crucial de sélection et acceptation du modèle : de
nombreux chercheurs remarquent désormais que le choix du « meilleur
modèle » ne peut pas se résoudre correctement, à supposer qu’il puisse l’être,
sur une base purement statistique (Aish-Van Vaerenbergh, 1994, p. 115 ;
Bohrnstedt et Knoke, 1998 ; Cobalti, 1992, p. 123 ; Cherkaoui, 2000, p. 141 ;
Wunsch, 1994, p. 37). En troisième lieu, la sociologie empirique quantitative
sous-estime souvent le rôle de la théorie durant l’analyse des « variables de
contrôle », qu’il s’agisse de choisir les variables à insérer (5) ou d’interpréter
les effets d’interaction éventuellement mis en évidence (Sorensen, 1998) (6).
Enfin, un manque de théorie caractérise la justification des conditions (forme
40
Revue française de sociologie
(4) Goldthorpe écrit : « It is in turn
generally agreed that, far from theory being
output from causal path and suchlike analyses,
it is rather necessary input to them. » (1996a,
p. 98). Sorensen déclare : «Unfortunately,
sociologists over the last decades have become
less, rather than more, competent at translating
theoretical ideas into models to be estimated by
statistical techniques » (1998, p. 239).
(5) À ce propos, Cherkaoui (2000, pp. 139-
140) et Wunsch (1994, p. 30) constatent que,
faute de raisonnement théorique, tant
l’« hypothèse de clôture forte » que de « clôture
faible » sont, la première davantage que la
seconde, difficilement justifiables.
(6) Sorensen affirme : « The introduction
of independent variables as controls in a multi-
variate statistical model is not usually seen as
specifying a theory. » (1998, pp. 243-244). La
conséquence est que « the result is a conceptually
meaningless list of variables preventing any kind
of substantive conclusion »(ibid., p. 243).
des distributions des variables, de la structure des erreurs et de la relation
entre les variables) que tout « modèle statistique » doit satisfaire pour qu’il
soit raisonnablement applicable et correctement estimable (Freedman,
1991a) (7). Les nombreux tests statistiques désormais disponibles à cet égard
ne résolvent pas entièrement le problème : justification statistique et justifica-
tion sociologique ne coïncident pas forcement. Cela est particulièrement
évident s’agissant de l’une des conditions de validité la plus généralement
supposée en sociologie empirique quantitative, à savoir l’hypothèse de linéa-
rité (Clogg et Haritou, 1997, p. 88, p. 93 ; Abbott, 1992a, p. 433, p. 434). On
la justifie habituellement en se fondant sur le principe de parcimonie sans
préciser que celle-ci n’est le plus souvent que computationnelle et non pas
sociologique (Sorensen, 1998, p. 249). Le caractère a-théorique de l’analyse
par variables assume une dernière forme : Ray Pawson (1989) insiste particu-
lièrement sur l’insuffisance de la réflexion théorique dans le choix et la justi-
fication du niveau de mesure des variables à insérer dans un modèle.
La conception de la causalité propre à la sociologie empirique quantitative
est le deuxième aspect le plus mis en question. Le noyau logique de l’analyse
multivariée – tel qu’il a été conceptualisé par Paul Lazarsfeld dès les années
cinquante – consiste à étudier les variations de l’intensité du lien entre deux
variables X etYàlalumière de l’insertion progressive d’une série de varia-
bles additionnelles Wn: le degré de stabilité de cette intensité est considéré
comme le signe que les variables Wnn’agissent ni comme variables « inter-
médiaires » ni comme « variables parasites ». La qualification de causal du
lien entre X et Y repose en sociologie empirique quantitative sur ce
« processus de contrôle » : compte tenu des effets de Wn,siXY « résiste »,
l’hypothèse d’une simple corrélation peut s’écarter en faveur de l’hypothèse
de causalité (H. S. Becker, 1992, p. 206 ; Ragin, 1987, pp. 58-61). Cette
conception de la « causalité comme dépendance robuste » – en empruntant
l’expression à John Goldthorpe (1999, pp. 138-142 ; voir aussi Hedstrom,
2003) – comporte une limite majeure : cette procédure de « contrôle statis-
tique », à la différence du contrôle expérimental fondé sur l’assignation aléa-
toire des cas aux groupes, n’assure pas que toutes les variables susceptibles
d’influencer la variable dépendante Y soient prises en compte (Lieberson,
1985 [8], chap. 2, 6 ; Ragin, 1987, pp. 61-67). Clogg et Haritou (1997) ont
récemment tiré toutes les conséquences de ce constat : puisqu’il est impos-
sible de tester au moyen des données que l’on est en train d’analyser l’hypo-
thèse selon laquelle les variables pertinentes non mesurées ne sont pas
corrélées aux variables indépendantes, toute variante du « modèle linéaire
généralisé » est incapable de dire quoi que ce soit sur la nature causale des
relations étudiées (9).
41
Gianluca Manzo
(7) Voici les mots de David Freedman :
«Typically, the assumptions in a statistical
model are quite hard to prove or disprove, and
little effort is spent in that direction. » (1991a,
p. 311).
(8) Voir Vallet (2004) pour une discussion
précise de cet ouvrage remarquable.
(9) Voici leur thèse principale : « We
cannot know whether the causal effect is large
or small, positive or negative, present or absent
without additional knowledge that cannot be
obtained from the data. » (Clogg et Haritou,
1997, pp. 105-106). Des affirmations analogues
se trouvent aux pages 94, 96, 100, 103, 104.
1 / 38 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !