Colloque international - Paris 25, 26 et 27 mai 1993 Les techniques

publicité
Colloque international - Paris 25, 26 et 27 mai 1993
Les techniques psychologiques d'évaluation des personnes
Opérationnalisation et recherche de validation:
une alternative?
Jacques Juhel*
* Groupe de recherche en psychologie différentielle
Laboratoire de psychologie expérimentale
Université de Rennes 2
6, Avenue Gaston Berger, 35043 Rennes Cedex
«La science recherche ses objets, elle les construit,
elle les élabore; elle ne les trouve pas «tout faits»,
tout donnés dans la perception ou l'expérience
immédiate.» (Ullmo, 1969, p. 23)
S'il est une question que ne peut éviter de se poser le psychologue qui fait de
l'expérimentation - ce terme étant pris ici dans un sens très large - c'est à dire qui soumet ses
hypothèses explicatives à l'épreuve de faits recueillis en laboratoire ou dans des situations dites
«naturelles» (Matalon, 1988), c'est bien celle de la validité des conclusions qu'il formule. Comme
tous les scientifiques, le pychologue qui choisit d'utiliser, après l'avoir décrit, «un procédé régulier
pour repérer, mesurer, plus généralement atteindre et identifier le concept défini.» (Ullmo, 1969, p.
25) n'est pas sans savoir que la validité de l'ensemble du dispositif de mesure utilisé s'accompagne
de certaines formes d'invalidité qui limitent la portée théorique et pratique de ses conclusions.
Ce problème de validité est fondamental. Il naît de la distance, du décalage inévitable entre
l'entité conceptuelle que l'on évoque à des fins d'explication ou de prédiction et l'univers des
définitions opérationnelles ou opératoires que l'on choisit d'en donner. La recherche de validation
peut ainsi être considérée comme une tentative sans cesse réitérée ayant pour objectif de préciser le
concept en cernant les limites d'une incertitude à laquelle nous savons ne pouvoir échapper.
Caractérisons brièvement ce passage de l'entité conceptuelle à son opérationnalisation.
Le passage de l'entité conceptuelle à son opérationnalisation.
1) Le psychologue part d'une notion hypothétique, d'une ébauche intuitive, d'«une réalité
dont la langue commune détient l'image» (Reuchlin, 1992, p. 90). Dans le langage commun, est par
exemple impulsif celui qui agit de manière irréfléchie, qui résiste difficilement à une force, un
instinct, un mouvement qu'il ne contrôle pas. On voit que le critère d'existence de la notion
d'impulsivité est lié à un processus d'abstraction qui s'appuie sur le constat dans des circonstances
très variées de la relative stabilité «d'une forme définie d'organisation entre les variations des
conditions de milieu et les variations du comportement» (Reuchlin, 1962, p. 73).
2) Le psychologue en donne ensuite une définition opératoire. Cette définition nécessairement arbitraire bien que dépendante de pré-supposés théoriques - «réalise» la notion
hypothétique, lui donne un contenu empirique. L'objectivité est ici réalisation pratique, Des
échelles d'impulsivité comme celles de Barratt (BIS-10: Barratt, 1985), d'Eysenck (I.7: Eysenck,
Pearson, Easting & Allsopp, 1985), un test comme le Matching Familiar Figures Test de Kagan
(1966) sont des exemples - parmi d'autres - de tels dispositifs de mesure. Des techniques
permettent, à des fins pratiques, d'évaluer les qualités métrologiques de ces dispositifs (voir par
exemple Cronbach, 1990).
3) L'interprètation des données recueillies impose cependant de passer à «d'autres critères
d'existence» (Reuchlin, 1962, p. 69) en étudiant la validité empirique du dispositif de mesure. On
peut s'appuyer alors sur des critères externes comme par exemple le comportement observé dans
une situation autre que celle que réalise le dispositif de mesure, ce dernier étant considéré comme
d'autant plus valide que son pouvoir «prédictif» est important. Stanford & Barratt (1992) mesurent
ainsi chez 72 détenus adultes un score d'impulsivité à l'aide d'un questionnaire (le BIS-10) et
obtiennent une corrélation de 0.26 (p=0.03) entre l'impulsivité motrice mesurée par le questionnaire
et la difficulté à se contrôler évaluée par différents indicateurs comportementaux (la consommation
d'alcool, la dépendance à l'égard de la drogue, la fréquence des conduites agressives...). On peut
aussi évaluer la capacité de ce dispositif à atteindre le concept en comparant les données qu'il
permet de recueillir à celles fournies par un ou plusieurs autres dispositifs considérés comme
mesurant la même entité conceptuelle. Luengo, Carrillo-de-la-Pena & Otero (1991) rapportent par
exemple une corrélation de 0.72 (n=307) entre l'échelle d'impulsivité de Barratt (BIS-10) et celle
d'Eysenck (I.7).
Cette étape interprètative est sans doute importante mais nul n'ignore que les patterns de
corrélations sont bien souvent loin de présenter une rassurante cohérence (Fiske, 1973). Comment
par exemple intégrer aux résultats précédents ceux de Block, Gjerde & Block (1986) qui observent
des corrélations tout à fait contradictoires entre latences, erreurs au MFFT et des évaluations
psychométriques de la personnalité ou ceux de Van den Broeck & Bradshaw (1993) qui constatent
l'absence de corrélation entre l'impulsivité mesurée par l'échelle de Barratt (BIS-10) et l'impulsivité
mesurée par le Matching Familiar Figures Test de Kagan? On peut bien sûr refuser de dire avec les
premiers que l'interprètation du MFFT en termes d'impulsivité-réflexion n'est pas légitime ou
admettre l'interprètation multicomponentielle que font les seconds du concept d'impulsivité (style
cognitif ou tempo personnel mesuré par le MFFT, trait de la dimension psychotisme d'Eysenck
mesuré par l'I.7, impulsivités motrice, cognitive et «non-planifiante» mesurées par le BIS-10 de
Barratt), voire même opter pour une interprètation multicomponentielle des composantes du
concept... C'est au psychologue bien évidemment qu'il appartient de lire ces résultats en évitant
néanmoins le «biais confirmationniste» qui pourrait l'amèner à ne retenir que ceux validant
l'interprètation du dispositif qu'il a choisi d'utiliser.
On peut aussi estimer que si elle est la mise à l'épreuve d'un certain nombre d'hypothèses
structurales déduites d'un modèle théorique susceptible de soutenir l'explication psychologique, la
recherche de validation gagnera en pertinence. Cronbach & Meehl en 1955 ont proposé une telle
stratégie méthodologique - connue sous le nom de recherche de validation conceptuelle,
hypothético-déductive ou nomologique (construct validity) - et dont l'objectif est d'«inventer des
constructions psychologiques et de façonner un réseau de lois permettant la prédiction» (Cronbach,
1957, p. 681).
La recherche de validation nomologique.
L'épistémologie sous-jacente à la démarche de validation nomologique est néo-positiviste;
Cronbach & Meehl (1955) font ainsi référence à des auteurs comme Rudolph Carnap ou Herbert
Feigl et acceptent la théorie de la «correspondance» de la vérité avec les faits c'est à dire l'idée que
«la vérité n'est pas un produit social mais est ordonnée par la nature des choses» (Chalmers, 1987,
p. 203). Toute théorie scientifique étant pour eux un système hypothético-déductif, ils font reposer
leur méthodologie analytique sur ce qu'ils appellent le réseau nomologique. Dans un tel système de
lois sont exprimées les relations entre variables observables, entre constructions psychologiques
(constructs) et observables (par l'intermédiaire de définitions opératoires, de règles de
correspondance...) ou entre constructions psychologiques. La signification des constructions
psychologiques tient aux relations systématiques qu'elles entretiennent dans le réseau nomologique.
Comme l'écrivent les auteurs, «la construction psychologique n'est pas réduite aux observations,
mais associée à d'autres constructions du réseau afin de permettre d'énoncer des prédictions» (p.
290). Explication et prédiction apparaissent ainsi symétriques et de nature déductive-nomologique.
La construction psychologique: empirique ou théorique? - Précisons le terme de
construction psychologique car il peut renvoyer à plusieurs définitions. Une construction
psychologique peut être une variable «intermédiaire» empirique c'est à dire une variable construite
par abstraction des relations empiriques entre variable indépendante et variable dépendante, en
négligeant certains aspects de l'expérience et en classant des phénomènes restreints du point de vue
de leurs propriétés. Pour Hull par exemple, la généralisation empirique est une hypothèse dans ce
sens qu'elle décrit des observations pas encore faites mais elle ne porte pas sur l'existence d'entités
non observées. Elle est alors construction logique permettant d'économiser des efforts descriptifs.
Le score à un test, tel qu'il peut être défini dans les théories psychométriques du trait latent (Lord &
Novick, 1968), est un exemple de variable intermédiaire empirique. Ce score résume l'organisation
des réponses aux items en fonction d'un modèle de mesure spécifié par avance (par exemple le
modèle de Rasch) et dont l'ajustement aux données a été antérieurement éprouvé. Une telle variable
empirique n'a par définition pas de contenu factuel additionnel aux fonctions empiriques qu'elle
résume.
La construction psychologique peut être aussi une variable «intermédiaire» théorique au
sens de Tolman (1938), les déterminants environnementaux, biologiques déterminant les
constructions psychologiques (lois de type F-2), les constructions psychologiques influençant les
comportements (lois de type F-3). MacCorquodale & Meehl (1948), Cronbach & Meehl (1955)
font de cette construction psychologique une alternative à la variable intermédiaire des empiristes
logiques en rendant la conceptualisation prioritaire. Ne pouvant être définies sans invoquer une
théorie, les constructions théoriques font bien sûr référence à des variables empiriques mais
contrairement à ces dernières, elles peuvent être incomplètement explicitées. Cette conception
apparait ainsi plus libérale que celle de l'empiriste logique qui distinguerait - mais ne s'agit-il pas
d'une pseudo-distinction? - la construction théorique de la construction dite hypothétique parce que
renvoyant à des phénomènes non totalement réductibles aux phénomènes observés (Roskam,
1991). Pour reprendre l'exemple précédent, lorsqu'il est interprèté comme un score d'impulsivité
dans le cadre de la théorie neuropsychologique de Barratt, le score à un test comme le BIS-10
devient une construction théorique définie implicitement par le réseau nomologique l'incluant.
L'interprètation de ce score permet de générer de nouvelles prédictions qui donnent à la
construction théorique un certain «contenu additionnel» (Reuchlin, 1969, 1990).
L'opérationnalisme multiple - La construction théorique ne peut être seulement définie par
l'opération. Des arguments à la fois théoriques (l'opération de mesure met en jeu des processus qui
doivent être spécifiés par rapport à de nombreux paramètres théoriques) et pratiques (on valide nos
mesures à l'aide d'autres mesures invalides) s'y opposent. Pour éviter l'assimilation de la notion
opérationnalisée à la construction théorique, Campbell (1960) a recommandé il y a déjà longtemps
d'opter pour une stratégie d'opérationnisme multiple dans laquelle la construction théorique est le
résumé inductif des relations entre variables observées (le facteur commun). «La force de la
construction théorique, écrit ainsi Campbell, repose sur la convergence des faiblesses de chacun
des dispositifs de mesure». Utilisable dans la recherche de validation nomologique cette stratégie
constructiviste (Messick, 1981) permet d'étudier la validité d'une variable observée en tant que
mesure de la construction théorique. Rappelons que Campbell & Fiske (1959) ont proposé une
technique utilisable dans la recherche de validation nomologique, l'analyse des matrices multitraitsmultiméthodes, qui consiste à étudier simultanément - principalement à l'aide d'analyses factorielles
confirmatoires - la convergence de dispositifs différents supposés mesurer une même construction
théorique (la validité de trait) par rapport à la divergence entre contenus empiriques sous hypothèse
de constructions théoriques distinctes (Bacher, 1986; Schmitt & Stults, 1986). Sous certaines
conditions autorisant ces comparaisons, il est ainsi possible de déterminer par exemple si un
dispositif est mieux adapté qu'un autre pour mesurer une construction théorique donnée.
Existence (et réalité) de la construction théorique - Le statut «existentiel» de ces
constructions théoriques varie selon que le psychologue considère que le monde existe
indépendamment de l'expérience humaine (réalisme transcendental, ontologique) ou non. D'un
point de vue épistémologique, différentes formes de réalisme sont à distinguer. Le réaliste
opérationniste assimile les constructions théoriques à des entités psychologiques «réelles»; dans
cette perspective, des principes d'explication comme par exemple le trait d'extraversion ou le
facteur g sont considérés comme réels. Pour le réaliste critique (le phénoménaliste critique), les
constructions théoriques sont plutôt des sortes de filtres révisables en permanence qui donnent une
existence objective à des entités qu'il est impossible d'appréhender directement. Cronbach & Meehl
définissent ainsi la construction théorique comme une caractéristique individuelle («qualitative»,
«quantitative» ou «structurale») ayant une existence objective (1955, p. 283). L'instrumentaliste - le
fictionniste dirait Meehl (1991) - rejette au contraire la réalité de ces entités; la construction
théorique est alors vue comme une fiction commode, comme un moyen servant un but pratique.
Humphreys (1979) voit ainsi dans le facteur g une unité fonctionnelle, une abstraction qui résume
le fonctionnement général du système et qui présente l'avantage de possèder un certain caractère de
prédiction.
La stratégie de validation nomologique, on le voit, vise autant à déterminer la validité de la
construction psychologique qu'à tester formellement des propositions nomothétiques - et cette
démarche est nécessairement sans fin - afin d'expliciter, d'enrichir et d'épurer le réseau
nomologique dans lequel le psychologue inscrit cette construction. La prédiction et le contrôle des
faits sont en quelque sorte la voie épistémique de l'élaboration théorique. La validité nomologique
est d'autant mieux établie que «le savoir théorique mis à contribution sera important» (Chalmers,
1987, p. 53). En aucun cas enfin, une des définitions opératoires d'une construction psychologique
ne peut être extraite de son réseau nomologique de référence: «le réseau nomologique doit être
suffisamment spécifié et explicite pour qu'on puisse l'accepter ou le rejeter. L'utilisateur qui rejette
la théorie de l'auteur ne peut accepter sa validation.» (Cronbach & Meehl, 1955, p. 291).
La recherche de validation à l'épreuve de l'évolution des idées en philosophie des sciences.
Il n'est pas besoin de rappeler que depuis les années 50, les idées ont très sensiblement
évolué en philosophie des sciences; nombreuses ont été les interrogations sur la fragilité de la base
fournie par l'expérience, sur le caractère non symétrique de l'explication et de la prédiction, sur
l'incommensurabilité des théories scientifiques...(voir par exemple Jacob, 1980). Certains
philosophes, tout en croyant à quelque base sûre d'observations, ont questionné le statut de la
preuve dans la construction du savoir scientifique. Une théorie scientifique ne peut être prouvée à
jamais affirme Popper; les faits ne peuvent servir qu'à corroborer des hypothèses théoriques
audacieuses ou à falsifier des hypothèses théoriques prudentes. Suivant une voie plus radicale,
d'autres philosophes ont affirmé que les énoncés d'observation sont dépendants de la théorie, que
les faits sont «impurs». Si la base fournie par l'observation est aussi faillible que la théorie avec
laquelle elle est en symbiose, peut-elle alors, comme le prétendent les fondationnistes, servir de
fondement à la science? Si les faits empiriques peuvent ne pas être épistémologiquement pertinents
ou les données mal traduire les faits, la stratégie falsificationniste ne risque-t-elle pas de conduire, à
tort, au rejet d'une théorie? Plus fondamentalement peut-être, tous s'accordent pour reconnaitre que
la nature des choses n'est pas simple, qu'elle n'est que simplifiée. La non-réductibilité de tout
système complexe est-elle alors compatible avec la condition de clôture et son corollaire, l'idée
instrumentaliste de symétrie entre explication et prédiction?
La psychologie scientifique n'est bien sûr pas restée à l'abri de cette remise en cause de la
conception «standard», néo-positiviste, de la science, conception désormais jugée comme de plus
en plus irréaliste. On connait le succès dans notre discipline de l'idée de falsifiabilité d'une
hypothèse théorique et beaucoup d'empiristes se réclament désormais du «falsificationnisme
sophistiqué» de Popper. Ajoutons pourtant, ainsi que le notent Greenwald, Pratkanis, Leippe &
Baumgardner (1986), que le test d'hypothèse s'avère plus souvent être confirmation de conjectures
prudentes que falsification d'«hypothèses rivales plausibles» (Campbell, 1957). Choisissant avec
Kuhn de définir la science comme une activité sociale sous l'influence de normes, de principes, de
paradigmes..., d'autres psychologues ont adopté une attitude plutôt relativiste, les plus sceptiques
d'entre eux allant même jusqu'à nier la démarcation entre science et pseudo-science.
On retrouve la marque de cette évolution des idées chez des psychologues comme Meehl,
Campbell ou Cronbach qui ont exprimé une certaine insatisfaction par rapport aux objectifs initiaux
de la recherche de validation nomologique et considèrent que le positivisme logique ne peut être
une reconstruction rationnelle du statut logique des sciences. Meehl estime ainsi qu'il s'est montré
«beaucoup trop positiviste» dans sa discussion du réseau nomologique. Il est vrai que le fait de ne
pouvoir prouver la véracité d'une théorie questionne pour le moins l'affirmation selon laquelle «le
travail de la construction théorique, c'est qu'elle soit "vraie"» (MacCorquodale & Meehl, 1948, p.
104). Meehl propose d'ailleurs de remplacer le questionnement sur la «vérité» de la théorie par une
interrogation sur son degré de vérisimilarité, concept emprunté à la méthodologie des programmes
de recherche de Lakatos qui, on le sait, affaiblit le critère de démarcation popperien. Campbell
(1990) considère de son côté qu'il serait bon d'abandonner tout jugement discrétionnaire à l'égard
des déductions tirées de la théorie ainsi qu'à l'égard de l'établissement des «faits» et qu'un certain
relativisme est souhaitable. Mais le premier comme le second acceptent une version «aménagée»
de la distinction positiviste entre faits et théorie. Le bilan que dresse Cronbach est beaucoup plus
pessimiste. «C'est sans doute, écrit-il, une erreur tactique que d'avoir lié la recherche de validation
nomologique à l'idéal positiviste» (1986a, p. 159). Dés 1975, Cronbach juge les résultats de
l'approche Aptitude-Traitement-Interaction très décevants par rapport à l'objectif initial
d'identification de réseaux de lois. La complexité des interactions entre les effets de l'instruction et
les caractéristiques individuelles lui paraît telle qu'il estime impossible de répliquer les résultats.
Dans un texte plus récent, Cronbach (1986b) prône même un certain pluralisme et recommande de
complèter l'approche scientifique traditionnelle par des méthodes qui ne sont pas les siennes et
généralement utilisées dans une tradition humaniste de la psychologie.
Opérationnalisation et recherche de validation: quelle alternative?
Les réflexions précédentes montrent à l'évidence que la croyance en la solidité des
hypothèses et des méthodes empiriques traditionnelles est désormais moins assurée qu'elle n'a pu le
paraître par le passé. Faut-il pour autant, comme Cronbach, déçu qu'on ne puisse «assembler de
manière ultime des généralisations et des constructions théoriques dans un réseau» (1975, p. 123),
considérer comme illusoire le projet d'une recherche de validation de type causal, voire même
abandonner les méthodes traditionnelles de la psychologie scientifique (Cronbach, 1986b)? Une
telle attitude aussi extrême ne peut qu'alerter; elle prouve que le problème de la recherche de
validation doit être reconsidéré. C'est d'ailleurs cette nécessité que nous avons voulu marquer par
l'interrogation posée dans le titre de cette note. Or le développement de certaines stratégies de
recherche en psychologie permet de penser que des voies autres que celle recommandée par
Cronbach peuvent être suivies sous réserve cependant que l'on accepte l'idée, somme toute
raisonnable, que les faits peuvent être une base relativement sûre - c'est à dire objective mais non
infaillible - d'observations (Chalmers, 1991).
Les faits peuvent être une base d'observations d'autant plus sûre que la représentation
quantitative ou qualitative que le psychologue donne de la structure des observations s'appuie sur
un modèle de mesure spécifié permettant de justifier du respect d'une certaine axiomatique.
Quoique non suffisante, cette condition est me semble-t-il nécessaire; une telle formalisation sert à
définir la correspondance entre les observables et les paramètres du modèle de mesure. Certains
modèles, par exemple probabilistes, permettent ainsi de spécifier à l'aide d'un ou de plusieurs
paramètres la probabilité pour que se produise un évènement déterminé (le choix d'une réponse à
un item de questionnaire par exemple). On voit donc que du point de vue de l'opérationnalisation,
ce qui est mesuré est défini - au moins en partie - par le modèle de mesure et sa correspondance
avec le domaine empirique des observations (Roskam, 1989).
Le problème de la validation se pose si, partant du concept, on estime, comme par exemple
Embretson (1983, 1985), que l'analyse théorique des structures et des mécanismes est de nature à
nourrir l'interprètation des faits; l'objectif est alors d'identifier ces mécanismes théoriques et
d'étudier la validité des épreuves dont on fait l'hypothèse qu'elles les mettent en œuvre. Mais si,
plus radicalement, on considère avec Guttman (1982) ou Roskam (1989, 1990) que les observations
ne servent pas à comprendre les concepts mais que ces derniers servent à exprimer notre
compréhension des observations, le problème de la validation se pose différemment; le modèle de
mesure définit de manière exclusive ce qui est mesuré et l'objectif est d'expliquer une classe
d'évènements comportementaux renvoyant à un domaine spécifié. Illustrons ces deux stratégies à
l'aide d'exemples.
Distinguant la «représentation de la construction théorique» (processus, stratégies,
structures de connaissance impliqués dans la résolution des items d'un test) de «l'empan
nomothétique» (l'utilité du test dans la mesure des différences individuelles), Embretson (1983),
suggère que la validité conceptuelle du test dépend «de l'influence relative des variables cognitives
sous-jacentes» (1985, p. 198). Pour «décomposer» cette validité, elle utilise une technique de
modèlisation en traits latents (Multicomponent Latent Trait Modeling) permettant de spécifier la
relation entre les caractéristiques de l'item et l'aptitude de l'individu. Très brièvement, ce modèle
combine un modèle psychométrique d'analyse des différences individuelles (modèle précisant de
manière formelle comment les différences entre items et celles entre individus peuvent être mises
en rapport avec chacune des composantes de l'item) à un modèle mathématique permettant de
déterminer la probabilité de réponse à l'item en fonction de la probabilité de réponse à chacune de
ses composantes. La procédure utilisée s'inspire de la méthodologie d'analyse des composantes de
la cognition (Sternberg, 1977). Elle consiste à administrer une tâche (analogies, classifications
verbales) de deux manières: sous forme de test classique et décomposée en sous-tâches. Dans ce
second cas, Embretson estime à partir de la performance mesurée au niveau componentiel et à
l'aide du modèle MLTM, les paramètres individuels correspondants. Des analyses structurales de
type Lisrel permettent d'étudier la validité des composantes sous l'angle des différences
individuelles d'aptitude (pour la classification verbale, la composante «évaluation de la réponse» a
par exemple plus de poids que la composante «élaboration de la règle»), d'analyser
componentiellement la validité prédictive des tests, d'étudier le degré de généralité des
composantes en fonction des tâches. Intègrant les perspectives générale et différentielle, ce type de
modèlisation pourrait être plus largement utilisé dans le développement de tests, notamment dans le
domaine cognitif. La stratégie méthodologique reste cependant la même que celle de la recherche
de validation nomologique.
Suggérée par Roskam (1989, 1990), une autre voie à suivre pourrait être de chercher en
premier lieu à caractériser aussi précisément que possible la classe des évènements
comportementaux à laquelle le psychologue s'intéresse. Précisons bien qu'il ne s'agit là ni de fournir
une description exhaustive de tous les évènements susceptibles d'être associés à une entité
notionnelle - comment cela pourrait-il être en effet possible? - ni, et ce serait là tomber dans le
piège opérationnaliste et perdre toute possibilité d'explication, de définir le concept par l'opération
(Reuchlin,1992). L'idée fondamentale est de considérer que les énoncés d'observations ne
dépendent pas du caractère «vrai» ou «faux» de la théorie mais de la «nature des choses». La
perspective, on le comprend, n'est pas essentialiste; il ne s'agit pas d'arriver à une description vraie
du monde mais plus modestement d'enrichir, grâce à la méthode empirique, la compréhension d'un
phénomène. La théorie en facetttes pourrait par exemple servir à cette caractérisation du domaine
empirique en aidant à la spécification de l'univers des évènements observables constituant l'objet de
la recherche (Canter, 1985). Roskam propose ainsi qu'une donnée d'observation - une catégorie de
base permettant l'étude du comportement - soit le choix d'un individu parmi plusieurs alternatives,
choix à la fois déterminé par des caractéristiques individuelles et situationnelles. Un plan en
facettes définit l'observation sous forme de triplet {Situation, Individu, Réponse} en dressant
l'inventaire des catégories observables. Prenons l'exemple du domaine «comportement de
motivation» dans une situation consistant à générer des mots à partir de lettres; on pourrait par
exemple avoir le plan en facettes suivant:
Un triplet {S,I,R} appartient à l'univers des évènements observables du domaine
«comportement de motivation» si et seulement si dans la situation S dans laquelle on
définit A {une règle, un objectif, un critère} évoque une réponse préférentielle ordonnée
A1 {très positive,..., très négative} et si l'individu choisit un niveau de difficulté A2
{très élevé,..., très faible} et/ou choisit de courir un risque A3 {très élevé,...,très faible}
par rapport à la facette A.
Le point essentiel est que le domaine empirique ne peut être analysé que si on dispose d'un
modèle en traits latents permettant d'analyser les réponses. Il s'agit en effet de savoir s'il existe une
structure latente sous-tendant la structure empirique correspondant au plan en facettes, l'objectif
théorique étant de trouver quelles caractéristiques des individus et de la situation sont mises en jeu.
Sous hypothèse que cette structure est unidimensionnelle, on peut analyser les données au moyen
par exemple du modèle de Rasch qui présente la caractéristique de fournir une représentation de la
structure empirique permettant une comparaison entre individus (resp. entre items) indépendante de
la sélection des items (resp. des individus). Si tel est le cas, l'analyse en trait latent fournit des
renseignements à la fois d'ordre général et différentiel. Ajoutons que des hypothèses plus
complexes en termes de dimensionnalité de la structure latente peuvent être faites (Fischer, 1983).
On voit que dans cette conception, théoriser le concept n'est pas le prendre comme objet
d'analyse.mais c'est spécifier, dans un domaine d'observations, les déterminants personnels et
situationnels ainsi que la relation fonctionnelle qui les relie, permettant de déterminer la probabilité
avec laquelle peut survenir un évènement donné.
Se distinguant selon que l'accent est mis sur l'analyse conceptuelle ou sur la définition a
priori du domaine empirique, ces deux stratégies partagent une même hypothèse: celle qu''un
modèle formel puisse représenter la structure latente des données empiriques. Bien qu'abordant
toutes les deux différemment le problème de la validation, elles ne sont peut être pas antagonistes
et pourraient très bien être utilisées à des moments différents d'une même recherche. Mais le fait
que les observables ne puissent être dissociés à la fois du cadre conceptuel qu'ils présupposent, du
modèle de mesure qui leur correspond et du contexte - au sens large - qui les détermine rend très
certainement nécessaire qu'on ne s'en tienne pas là. L'objectif de la recherche de validation
conceptuelle gagnerait alors à être fixé à un niveau moins ambitieux: tenter - en précisant le niveau
d'approximation choisi - de dresser un catalogue d'effets locaux en déterminant par exemple dans
quel domaine empirique, dans quelles conditions de réalisation la théorie pré-supposée ou explicite
dans laquelle on inscrit le concept tient ou ne tient pas.
BIBLIOGRAPHIE
Bacher, F. (1986). Variables théoriques et variables observées: L'approche multitraitsmultiméthodes. Revue de Psychologie Appliquée, 36, 469-490.
Barratt, E,S. (1985). Impulsiveness subtraits: Arousal and information processing. In J.T. Spence &
C.E. Izard (Eds.), Motivation, emotion, and personality (pp. 137-146). North Holland,
Elsevier.
Block, J., Gjerde, Per F., & Block, J.H. (1986). More misgivings about the Matching Familiar
Figures Test as a measure of reflection-Impulsivity: Absence of construct validity in
preadolescence. Developmental Psychology, 22, 820-831.
Campbell, D.T. (1960). Recommendations for APA test standards regarding construct, trait or
discriminant validity. American Psychologist, 15, 546-553.
Campbell, D.T. (1988). Methodology and epistemology for social sciences: selected papers. E.S.
Overman (Ed.), Chicgo: University of Chicago Press.
Campbell, D.T. (1990). The Meehlian corroboration-verisimilitude theory of science.
Psychological Inquiry, 1, 142-147.
Campbell, D.T., & Fiske, D.W. (1959). Convergent and discriminant validity in the multitraitmultimethod matrix. Psychological Bulletin, 56, 81-105.
Canter, D. (1985). Facet theory: Approaches to social research. New York: Springer.
Cronbach, L.J. (1957). The two disciplines of scientific psychology. American Psychologist, 12,
671-684.
Cronbach, L.J. (1975). Beyond the two disciplines of scientific psychology. American Psychologist,
30, 116-127.
Cronbach, L.J. (1986a). Construct validation after thirty years. In R.L. Linn (Ed.), Intelligence:
Measurement, theory and public policy (pp. 147-171). Chicago: University of Illinois Press.
Cronbach, L.J., (1986b). Social inquiry by and for earthlings. In D.W. Fiske a R.A. Shweder (Eds.),
Metatheory in social science: Pluralisms and subjectivities (pp. 83-107). Chicago: University
of Chicago Press.
Cronbach, L.J. (1990). Essentials of psychological testing (5th ed.). N.Y.: Harper & Row
Cronbach, L.J., & Meehl, P.E. (1955). Construct validity in psychological tests. Psychological
Bulletin, 52, 281-302.
Embretson, S. (1983). Construct validity: Construct representation versus nomothetic span.
Psychological Bulletin, 93, 179-197.
Eysenck, S.B.G., Pearson, P.R., Easting, G., & Allsopp, J.F. (1985). Age norms for impulsiveness,
venturesomeness and empathy in adults. Personality and Individual Differences, 6, 613-619.
Feigl, H. (1950). Existential hypotheses: Realistic versus phenomenalistic interpretations.
Philosophy of Science, 17, 35-62.
Fischer, G.H. (1983). Logistic Latent Trait Models with linear constraints. Psychometrika, 48, 3-26.
Fiske, D.W. (1973). Can a personality construct be validated empirically? Psychological Bulletin,
80, 89-92.
Guttman, L. (1982). What is not what in theory construction. In R.M. Hauser, D. Mechanic, & A.
Haller (Eds.), Social structure and behavior (pp. 331-348). New York: Academic Press.
Humphreys, L.G. (1979). The construct of general intelligence. Intelligence, 3, 105-120.
Kagan, J. (1966). Reflexion-Impulsivity: the generality of dynamics of conceptual tempo. Journal
of Abnormal Psychology, 93, 133-140.
Kuhn, T.S. (1983). La structure des révolutions scientifiques. Paris: Flammarion.
Lord, F.M., & Novick, M.R. (1968). Statistical theories of mental test scores. Reading,
Massachussetts: Addison-Wesley.
Luengo, M.A., Carrillo-de-la-Pena M.T., & Otero, J.M. (1991). The components of impulsivenes:
A comparison of the I.7 Impulsiveness Questionnaire and the Barratt Impulsiveness Scale.
Personality and Individual Differences, 12, 657-667.
MacCorquodale, K., & Meehl, P.E. (1948). On a distinction between hypothetical constructs and
intervening variables. Psychological Review, 55 95-107.
McGuire, W.J. (1989). A perspectivist approach to the strategic planning of programmatic
scientific research. In B. Gholson, W.R. Shadish, R.A. Neimeyer, & A.C. Houts (Eds.),
Psychology of science: Contributions to metascience (pp. 214-245). Cambridge: Cambridge
University Press.
Manicas, P.T., & Secord, P.F. (1983). Implications for psychology of the new philosophy of
science. American Psychologist, 38, 399-413.
Matalon, B. (1988). Décrire, expliquer, prévoir: démarches expérimentales et terrain. Paris: A.
Colin.
Meehl, P.E. (1990). Appraising and amending theories: The strategy of Lakatosian defense and two
principles that warrant it. Psychological Inquiry, 1, 108-141.
Meehl, P.E. (1991). Four queries about factor reality. History and Philosophy of Psychology
Bulletin, 3, 16-18.
Messick, S. (1981). Constructs and their vicissitudes in educational and psychological
measurement. Psychological Bulletin, 575-588.
Mook, D.G. (1983). In defense of external validity. American Psychologist, 38, 379-387.
Popper, K.R. (1968-A, 1973-F). La logique de la découverte scientifique. Paris: Payot.
Reuchlin, M. (1962-1, 1975-2). Les méthodes quantitatives en psychologie. Paris: PUF.
Reuchlin, M. (1969-1, 1990-5). La psychologie différentielle. Paris: PUF.
Reuchlin, M. (1992). Introduction à la recherche en psychologie. Paris: Nathan.
Roskam, E.E. (1989). Operationalization, a superfluous concept. Quality and Quantity, 23,237-275.
Roskam, E.E. (1990). Formalized theory and the explanation of empirical phenomena. In J.J. Hox
& J. de Jong-Gierveld (Eds.), Operationalization and research strategy (pp. 179-198).
Amsterdam, Swets & Zeitlinger.
Schmitt, N., & Stults, D.M. (1986). Methodology review: Analysis of multitrait-multimethodes
matrices. Applied Psychological Measurement, 10, 1-22
Stanford, M.S., & Barratt, E.S. (1992). Impulsivity and the multi-impulsive personlity disorder.
Personality and Individual Differences, 13, 831-834.
Sternberg, R.J. (1977). Intelligence, information processing, and analogical reasoning: The
componential analysis of human abilities. Hillsdale, N.J.: Erlbaum.
Tolman, E.C. (1938). The determiners of behavior at a choice point. Psychological Review, 45, 141.
Ullmo, J. (1958,1969). La pensée scientifique moderne. Paris: Flammarion.
van den Broek, & Bradshaw, C.M. (1993). An inivestigation of the relationship between
perseveration and impulsiveness. Personality and Individual Differences, 14, 531-534..
Téléchargement