Colloque international - Paris 25, 26 et 27 mai 1993 Les techniques

Colloque international - Paris 25, 26 et 27 mai 1993
Les techniques psychologiques d'évaluation des personnes
Opérationnalisation et recherche de validation:
une alternative?
Jacques Juhel*
* Groupe de recherche en psychologie différentielle
Laboratoire de psychologie expérimentale
Université de Rennes 2
6, Avenue Gaston Berger, 35043 Rennes Cedex
«La science recherche ses objets, elle les construit,
elle les élabore; elle ne les trouve pas «tout faits»,
tout donnés dans la perception ou l'expérience
immédiate.» (Ullmo, 1969, p. 23)
S'il est une question que ne peut éviter de se poser le psychologue qui fait de
l'expérimentation - ce terme étant pris ici dans un sens très large - c'est à dire qui soumet ses
hypothèses explicatives à l'épreuve de faits recueillis en laboratoire ou dans des situations dites
«naturelles» (Matalon, 1988), c'est bien celle de la validité des conclusions qu'il formule. Comme
tous les scientifiques, le pychologue qui choisit d'utiliser, après l'avoir décrit, «un procédé régulier
pour repérer, mesurer, plus généralement atteindre et identifier le concept défini.» (Ullmo, 1969, p.
25) n'est pas sans savoir que la validité de l'ensemble du dispositif de mesure utilisé s'accompagne
de certaines formes d'invalidité qui limitent la portée théorique et pratique de ses conclusions.
Ce problème de validité est fondamental. Il naît de la distance, du décalage inévitable entre
l'entité conceptuelle que l'on évoque à des fins d'explication ou de prédiction et l'univers des
définitions opérationnelles ou opératoires que l'on choisit d'en donner. La recherche de validation
peut ainsi être considérée comme une tentative sans cesse réitérée ayant pour objectif de préciser le
concept en cernant les limites d'une incertitude à laquelle nous savons ne pouvoir échapper.
Caractérisons brièvement ce passage de l'entité conceptuelle à son opérationnalisation.
Le passage de l'entité conceptuelle à son opérationnalisation.
1) Le psychologue part d'une notion hypothétique, d'une ébauche intuitive, d'«une réalité
dont la langue commune détient l'image» (Reuchlin, 1992, p. 90). Dans le langage commun, est par
exemple impulsif celui qui agit de manière irréfléchie, qui résiste difficilement à une force, un
instinct, un mouvement qu'il ne contrôle pas. On voit que le critère d'existence de la notion
d'impulsivité est lié à un processus d'abstraction qui s'appuie sur le constat dans des circonstances
très variées de la relative stabilité «d'une forme définie d'organisation entre les variations des
conditions de milieu et les variations du comportement» (Reuchlin, 1962, p. 73).
2) Le psychologue en donne ensuite une définition opératoire. Cette définition -
nécessairement arbitraire bien que dépendante de pré-supposés théoriques - «réalise» la notion
hypothétique, lui donne un contenu empirique. L'objectivité est ici réalisation pratique, Des
échelles d'impulsivité comme celles de Barratt (BIS-10: Barratt, 1985), d'Eysenck (I.7: Eysenck,
Pearson, Easting & Allsopp, 1985), un test comme le Matching Familiar Figures Test de Kagan
(1966) sont des exemples - parmi d'autres - de tels dispositifs de mesure. Des techniques
permettent, à des fins pratiques, d'évaluer les qualités métrologiques de ces dispositifs (voir par
exemple Cronbach, 1990).
3) L'interprètation des données recueillies impose cependant de passer à «d'autres critères
d'existence» (Reuchlin, 1962, p. 69) en étudiant la validité empirique du dispositif de mesure. On
peut s'appuyer alors sur des critères externes comme par exemple le comportement observé dans
une situation autre que celle que réalise le dispositif de mesure, ce dernier étant considéré comme
d'autant plus valide que son pouvoir «prédictif» est important. Stanford & Barratt (1992) mesurent
ainsi chez 72 détenus adultes un score d'impulsivité à l'aide d'un questionnaire (le BIS-10) et
obtiennent une corrélation de 0.26 (p=0.03) entre l'impulsivité motrice mesurée par le questionnaire
et la difficulté à se contrôler évaluée par différents indicateurs comportementaux (la consommation
d'alcool, la dépendance à l'égard de la drogue, la fréquence des conduites agressives...). On peut
aussi évaluer la capacité de ce dispositif à atteindre le concept en comparant les données qu'il
permet de recueillir à celles fournies par un ou plusieurs autres dispositifs considérés comme
mesurant la même entité conceptuelle. Luengo, Carrillo-de-la-Pena & Otero (1991) rapportent par
exemple une corrélation de 0.72 (n=307) entre l'échelle d'impulsivité de Barratt (BIS-10) et celle
d'Eysenck (I.7).
Cette étape interprètative est sans doute importante mais nul n'ignore que les patterns de
corrélations sont bien souvent loin de présenter une rassurante cohérence (Fiske, 1973). Comment
par exemple intégrer aux résultats précédents ceux de Block, Gjerde & Block (1986) qui observent
des corrélations tout à fait contradictoires entre latences, erreurs au MFFT et des évaluations
psychométriques de la personnalité ou ceux de Van den Broeck & Bradshaw (1993) qui constatent
l'absence de corrélation entre l'impulsivité mesurée par l'échelle de Barratt (BIS-10) et l'impulsivité
mesurée par le Matching Familiar Figures Test de Kagan? On peut bien sûr refuser de dire avec les
premiers que l'interprètation du MFFT en termes d'impulsivité-réflexion n'est pas légitime ou
admettre l'interprètation multicomponentielle que font les seconds du concept d'impulsivité (style
cognitif ou tempo personnel mesuré par le MFFT, trait de la dimension psychotisme d'Eysenck
mesuré par l'I.7, impulsivités motrice, cognitive et «non-planifiante» mesurées par le BIS-10 de
Barratt), voire même opter pour une interprètation multicomponentielle des composantes du
concept... C'est au psychologue bien évidemment qu'il appartient de lire ces résultats en évitant
néanmoins le «biais confirmationniste» qui pourrait l'amèner à ne retenir que ceux validant
l'interprètation du dispositif qu'il a choisi d'utiliser.
On peut aussi estimer que si elle est la mise à l'épreuve d'un certain nombre d'hypothèses
structurales déduites d'un modèle théorique susceptible de soutenir l'explication psychologique, la
recherche de validation gagnera en pertinence. Cronbach & Meehl en 1955 ont proposé une telle
stratégie méthodologique - connue sous le nom de recherche de validation conceptuelle,
hypothético-déductive ou nomologique (construct validity) - et dont l'objectif est d'«inventer des
constructions psychologiques et de façonner un réseau de lois permettant la prédiction» (Cronbach,
1957, p. 681).
La recherche de validation nomologique.
L'épistémologie sous-jacente à la démarche de validation nomologique est néo-positiviste;
Cronbach & Meehl (1955) font ainsi référence à des auteurs comme Rudolph Carnap ou Herbert
Feigl et acceptent la théorie de la «correspondance» de la vérité avec les faits c'est à dire l'idée que
«la vérité n'est pas un produit social mais est ordonnée par la nature des choses» (Chalmers, 1987,
p. 203). Toute théorie scientifique étant pour eux un système hypothético-déductif, ils font reposer
leur méthodologie analytique sur ce qu'ils appellent le réseau nomologique. Dans un tel système de
lois sont exprimées les relations entre variables observables, entre constructions psychologiques
(constructs) et observables (par l'intermédiaire de définitions opératoires, de règles de
correspondance...) ou entre constructions psychologiques. La signification des constructions
psychologiques tient aux relations systématiques qu'elles entretiennent dans le réseau nomologique.
Comme l'écrivent les auteurs, «la construction psychologique n'est pas réduite aux observations,
mais associée à d'autres constructions du réseau afin de permettre d'énoncer des prédictions» (p.
290). Explication et prédiction apparaissent ainsi symétriques et de nature déductive-nomologique.
La construction psychologique: empirique ou théorique? - Précisons le terme de
construction psychologique car il peut renvoyer à plusieurs définitions. Une construction
psychologique peut être une variable «intermédiaire» empirique c'est à dire une variable construite
par abstraction des relations empiriques entre variable indépendante et variable dépendante, en
négligeant certains aspects de l'expérience et en classant des phénomènes restreints du point de vue
de leurs propriétés. Pour Hull par exemple, la généralisation empirique est une hypothèse dans ce
sens qu'elle décrit des observations pas encore faites mais elle ne porte pas sur l'existence d'entités
non observées. Elle est alors construction logique permettant d'économiser des efforts descriptifs.
Le score à un test, tel qu'il peut être défini dans les théories psychométriques du trait latent (Lord &
Novick, 1968), est un exemple de variable intermédiaire empirique. Ce score résume l'organisation
des réponses aux items en fonction d'un modèle de mesure spécifié par avance (par exemple le
modèle de Rasch) et dont l'ajustement aux données a été antérieurement éprouvé. Une telle variable
empirique n'a par définition pas de contenu factuel additionnel aux fonctions empiriques qu'elle
résume.
La construction psychologique peut être aussi une variable «intermédiaire» théorique au
sens de Tolman (1938), les déterminants environnementaux, biologiques déterminant les
constructions psychologiques (lois de type F-2), les constructions psychologiques influençant les
comportements (lois de type F-3). MacCorquodale & Meehl (1948), Cronbach & Meehl (1955)
font de cette construction psychologique une alternative à la variable intermédiaire des empiristes
logiques en rendant la conceptualisation prioritaire. Ne pouvant être définies sans invoquer une
théorie, les constructions théoriques font bien sûr référence à des variables empiriques mais
contrairement à ces dernières, elles peuvent être incomplètement explicitées. Cette conception
apparait ainsi plus libérale que celle de l'empiriste logique qui distinguerait - mais ne s'agit-il pas
d'une pseudo-distinction? - la construction théorique de la construction dite hypothétique parce que
renvoyant à des phénomènes non totalement réductibles aux phénomènes observés (Roskam,
1991). Pour reprendre l'exemple précédent, lorsqu'il est interprèté comme un score d'impulsivité
dans le cadre de la théorie neuropsychologique de Barratt, le score à un test comme le BIS-10
devient une construction théorique définie implicitement par le réseau nomologique l'incluant.
L'interprètation de ce score permet de générer de nouvelles prédictions qui donnent à la
construction théorique un certain «contenu additionnel» (Reuchlin, 1969, 1990).
L'opérationnalisme multiple - La construction théorique ne peut être seulement définie par
l'opération. Des arguments à la fois théoriques (l'opération de mesure met en jeu des processus qui
doivent être spécifiés par rapport à de nombreux paramètres théoriques) et pratiques (on valide nos
mesures à l'aide d'autres mesures invalides) s'y opposent. Pour éviter l'assimilation de la notion
opérationnalisée à la construction théorique, Campbell (1960) a recommandé il y a déjà longtemps
d'opter pour une stratégie d'opérationnisme multiple dans laquelle la construction théorique est le
résumé inductif des relations entre variables observées (le facteur commun). «La force de la
construction théorique, écrit ainsi Campbell, repose sur la convergence des faiblesses de chacun
des dispositifs de mesure». Utilisable dans la recherche de validation nomologique cette stratégie
constructiviste (Messick, 1981) permet d'étudier la validité d'une variable observée en tant que
mesure de la construction théorique. Rappelons que Campbell & Fiske (1959) ont proposé une
technique utilisable dans la recherche de validation nomologique, l'analyse des matrices multitraits-
multiméthodes, qui consiste à étudier simultanément - principalement à l'aide d'analyses factorielles
confirmatoires - la convergence de dispositifs différents supposés mesurer une même construction
théorique (la validité de trait) par rapport à la divergence entre contenus empiriques sous hypothèse
de constructions théoriques distinctes (Bacher, 1986; Schmitt & Stults, 1986). Sous certaines
conditions autorisant ces comparaisons, il est ainsi possible de déterminer par exemple si un
dispositif est mieux adapté qu'un autre pour mesurer une construction théorique donnée.
Existence (et réalité) de la construction théorique - Le statut «existentiel» de ces
constructions théoriques varie selon que le psychologue considère que le monde existe
1 / 13 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !