Colloque international - Paris 25, 26 et 27 mai 1993 Les techniques psychologiques d'évaluation des personnes Opérationnalisation et recherche de validation: une alternative? Jacques Juhel* * Groupe de recherche en psychologie différentielle Laboratoire de psychologie expérimentale Université de Rennes 2 6, Avenue Gaston Berger, 35043 Rennes Cedex «La science recherche ses objets, elle les construit, elle les élabore; elle ne les trouve pas «tout faits», tout donnés dans la perception ou l'expérience immédiate.» (Ullmo, 1969, p. 23) S'il est une question que ne peut éviter de se poser le psychologue qui fait de l'expérimentation - ce terme étant pris ici dans un sens très large - c'est à dire qui soumet ses hypothèses explicatives à l'épreuve de faits recueillis en laboratoire ou dans des situations dites «naturelles» (Matalon, 1988), c'est bien celle de la validité des conclusions qu'il formule. Comme tous les scientifiques, le pychologue qui choisit d'utiliser, après l'avoir décrit, «un procédé régulier pour repérer, mesurer, plus généralement atteindre et identifier le concept défini.» (Ullmo, 1969, p. 25) n'est pas sans savoir que la validité de l'ensemble du dispositif de mesure utilisé s'accompagne de certaines formes d'invalidité qui limitent la portée théorique et pratique de ses conclusions. Ce problème de validité est fondamental. Il naît de la distance, du décalage inévitable entre l'entité conceptuelle que l'on évoque à des fins d'explication ou de prédiction et l'univers des définitions opérationnelles ou opératoires que l'on choisit d'en donner. La recherche de validation peut ainsi être considérée comme une tentative sans cesse réitérée ayant pour objectif de préciser le concept en cernant les limites d'une incertitude à laquelle nous savons ne pouvoir échapper. Caractérisons brièvement ce passage de l'entité conceptuelle à son opérationnalisation. Le passage de l'entité conceptuelle à son opérationnalisation. 1) Le psychologue part d'une notion hypothétique, d'une ébauche intuitive, d'«une réalité dont la langue commune détient l'image» (Reuchlin, 1992, p. 90). Dans le langage commun, est par exemple impulsif celui qui agit de manière irréfléchie, qui résiste difficilement à une force, un instinct, un mouvement qu'il ne contrôle pas. On voit que le critère d'existence de la notion d'impulsivité est lié à un processus d'abstraction qui s'appuie sur le constat dans des circonstances très variées de la relative stabilité «d'une forme définie d'organisation entre les variations des conditions de milieu et les variations du comportement» (Reuchlin, 1962, p. 73). 2) Le psychologue en donne ensuite une définition opératoire. Cette définition nécessairement arbitraire bien que dépendante de pré-supposés théoriques - «réalise» la notion hypothétique, lui donne un contenu empirique. L'objectivité est ici réalisation pratique, Des échelles d'impulsivité comme celles de Barratt (BIS-10: Barratt, 1985), d'Eysenck (I.7: Eysenck, Pearson, Easting & Allsopp, 1985), un test comme le Matching Familiar Figures Test de Kagan (1966) sont des exemples - parmi d'autres - de tels dispositifs de mesure. Des techniques permettent, à des fins pratiques, d'évaluer les qualités métrologiques de ces dispositifs (voir par exemple Cronbach, 1990). 3) L'interprètation des données recueillies impose cependant de passer à «d'autres critères d'existence» (Reuchlin, 1962, p. 69) en étudiant la validité empirique du dispositif de mesure. On peut s'appuyer alors sur des critères externes comme par exemple le comportement observé dans une situation autre que celle que réalise le dispositif de mesure, ce dernier étant considéré comme d'autant plus valide que son pouvoir «prédictif» est important. Stanford & Barratt (1992) mesurent ainsi chez 72 détenus adultes un score d'impulsivité à l'aide d'un questionnaire (le BIS-10) et obtiennent une corrélation de 0.26 (p=0.03) entre l'impulsivité motrice mesurée par le questionnaire et la difficulté à se contrôler évaluée par différents indicateurs comportementaux (la consommation d'alcool, la dépendance à l'égard de la drogue, la fréquence des conduites agressives...). On peut aussi évaluer la capacité de ce dispositif à atteindre le concept en comparant les données qu'il permet de recueillir à celles fournies par un ou plusieurs autres dispositifs considérés comme mesurant la même entité conceptuelle. Luengo, Carrillo-de-la-Pena & Otero (1991) rapportent par exemple une corrélation de 0.72 (n=307) entre l'échelle d'impulsivité de Barratt (BIS-10) et celle d'Eysenck (I.7). Cette étape interprètative est sans doute importante mais nul n'ignore que les patterns de corrélations sont bien souvent loin de présenter une rassurante cohérence (Fiske, 1973). Comment par exemple intégrer aux résultats précédents ceux de Block, Gjerde & Block (1986) qui observent des corrélations tout à fait contradictoires entre latences, erreurs au MFFT et des évaluations psychométriques de la personnalité ou ceux de Van den Broeck & Bradshaw (1993) qui constatent l'absence de corrélation entre l'impulsivité mesurée par l'échelle de Barratt (BIS-10) et l'impulsivité mesurée par le Matching Familiar Figures Test de Kagan? On peut bien sûr refuser de dire avec les premiers que l'interprètation du MFFT en termes d'impulsivité-réflexion n'est pas légitime ou admettre l'interprètation multicomponentielle que font les seconds du concept d'impulsivité (style cognitif ou tempo personnel mesuré par le MFFT, trait de la dimension psychotisme d'Eysenck mesuré par l'I.7, impulsivités motrice, cognitive et «non-planifiante» mesurées par le BIS-10 de Barratt), voire même opter pour une interprètation multicomponentielle des composantes du concept... C'est au psychologue bien évidemment qu'il appartient de lire ces résultats en évitant néanmoins le «biais confirmationniste» qui pourrait l'amèner à ne retenir que ceux validant l'interprètation du dispositif qu'il a choisi d'utiliser. On peut aussi estimer que si elle est la mise à l'épreuve d'un certain nombre d'hypothèses structurales déduites d'un modèle théorique susceptible de soutenir l'explication psychologique, la recherche de validation gagnera en pertinence. Cronbach & Meehl en 1955 ont proposé une telle stratégie méthodologique - connue sous le nom de recherche de validation conceptuelle, hypothético-déductive ou nomologique (construct validity) - et dont l'objectif est d'«inventer des constructions psychologiques et de façonner un réseau de lois permettant la prédiction» (Cronbach, 1957, p. 681). La recherche de validation nomologique. L'épistémologie sous-jacente à la démarche de validation nomologique est néo-positiviste; Cronbach & Meehl (1955) font ainsi référence à des auteurs comme Rudolph Carnap ou Herbert Feigl et acceptent la théorie de la «correspondance» de la vérité avec les faits c'est à dire l'idée que «la vérité n'est pas un produit social mais est ordonnée par la nature des choses» (Chalmers, 1987, p. 203). Toute théorie scientifique étant pour eux un système hypothético-déductif, ils font reposer leur méthodologie analytique sur ce qu'ils appellent le réseau nomologique. Dans un tel système de lois sont exprimées les relations entre variables observables, entre constructions psychologiques (constructs) et observables (par l'intermédiaire de définitions opératoires, de règles de correspondance...) ou entre constructions psychologiques. La signification des constructions psychologiques tient aux relations systématiques qu'elles entretiennent dans le réseau nomologique. Comme l'écrivent les auteurs, «la construction psychologique n'est pas réduite aux observations, mais associée à d'autres constructions du réseau afin de permettre d'énoncer des prédictions» (p. 290). Explication et prédiction apparaissent ainsi symétriques et de nature déductive-nomologique. La construction psychologique: empirique ou théorique? - Précisons le terme de construction psychologique car il peut renvoyer à plusieurs définitions. Une construction psychologique peut être une variable «intermédiaire» empirique c'est à dire une variable construite par abstraction des relations empiriques entre variable indépendante et variable dépendante, en négligeant certains aspects de l'expérience et en classant des phénomènes restreints du point de vue de leurs propriétés. Pour Hull par exemple, la généralisation empirique est une hypothèse dans ce sens qu'elle décrit des observations pas encore faites mais elle ne porte pas sur l'existence d'entités non observées. Elle est alors construction logique permettant d'économiser des efforts descriptifs. Le score à un test, tel qu'il peut être défini dans les théories psychométriques du trait latent (Lord & Novick, 1968), est un exemple de variable intermédiaire empirique. Ce score résume l'organisation des réponses aux items en fonction d'un modèle de mesure spécifié par avance (par exemple le modèle de Rasch) et dont l'ajustement aux données a été antérieurement éprouvé. Une telle variable empirique n'a par définition pas de contenu factuel additionnel aux fonctions empiriques qu'elle résume. La construction psychologique peut être aussi une variable «intermédiaire» théorique au sens de Tolman (1938), les déterminants environnementaux, biologiques déterminant les constructions psychologiques (lois de type F-2), les constructions psychologiques influençant les comportements (lois de type F-3). MacCorquodale & Meehl (1948), Cronbach & Meehl (1955) font de cette construction psychologique une alternative à la variable intermédiaire des empiristes logiques en rendant la conceptualisation prioritaire. Ne pouvant être définies sans invoquer une théorie, les constructions théoriques font bien sûr référence à des variables empiriques mais contrairement à ces dernières, elles peuvent être incomplètement explicitées. Cette conception apparait ainsi plus libérale que celle de l'empiriste logique qui distinguerait - mais ne s'agit-il pas d'une pseudo-distinction? - la construction théorique de la construction dite hypothétique parce que renvoyant à des phénomènes non totalement réductibles aux phénomènes observés (Roskam, 1991). Pour reprendre l'exemple précédent, lorsqu'il est interprèté comme un score d'impulsivité dans le cadre de la théorie neuropsychologique de Barratt, le score à un test comme le BIS-10 devient une construction théorique définie implicitement par le réseau nomologique l'incluant. L'interprètation de ce score permet de générer de nouvelles prédictions qui donnent à la construction théorique un certain «contenu additionnel» (Reuchlin, 1969, 1990). L'opérationnalisme multiple - La construction théorique ne peut être seulement définie par l'opération. Des arguments à la fois théoriques (l'opération de mesure met en jeu des processus qui doivent être spécifiés par rapport à de nombreux paramètres théoriques) et pratiques (on valide nos mesures à l'aide d'autres mesures invalides) s'y opposent. Pour éviter l'assimilation de la notion opérationnalisée à la construction théorique, Campbell (1960) a recommandé il y a déjà longtemps d'opter pour une stratégie d'opérationnisme multiple dans laquelle la construction théorique est le résumé inductif des relations entre variables observées (le facteur commun). «La force de la construction théorique, écrit ainsi Campbell, repose sur la convergence des faiblesses de chacun des dispositifs de mesure». Utilisable dans la recherche de validation nomologique cette stratégie constructiviste (Messick, 1981) permet d'étudier la validité d'une variable observée en tant que mesure de la construction théorique. Rappelons que Campbell & Fiske (1959) ont proposé une technique utilisable dans la recherche de validation nomologique, l'analyse des matrices multitraitsmultiméthodes, qui consiste à étudier simultanément - principalement à l'aide d'analyses factorielles confirmatoires - la convergence de dispositifs différents supposés mesurer une même construction théorique (la validité de trait) par rapport à la divergence entre contenus empiriques sous hypothèse de constructions théoriques distinctes (Bacher, 1986; Schmitt & Stults, 1986). Sous certaines conditions autorisant ces comparaisons, il est ainsi possible de déterminer par exemple si un dispositif est mieux adapté qu'un autre pour mesurer une construction théorique donnée. Existence (et réalité) de la construction théorique - Le statut «existentiel» de ces constructions théoriques varie selon que le psychologue considère que le monde existe indépendamment de l'expérience humaine (réalisme transcendental, ontologique) ou non. D'un point de vue épistémologique, différentes formes de réalisme sont à distinguer. Le réaliste opérationniste assimile les constructions théoriques à des entités psychologiques «réelles»; dans cette perspective, des principes d'explication comme par exemple le trait d'extraversion ou le facteur g sont considérés comme réels. Pour le réaliste critique (le phénoménaliste critique), les constructions théoriques sont plutôt des sortes de filtres révisables en permanence qui donnent une existence objective à des entités qu'il est impossible d'appréhender directement. Cronbach & Meehl définissent ainsi la construction théorique comme une caractéristique individuelle («qualitative», «quantitative» ou «structurale») ayant une existence objective (1955, p. 283). L'instrumentaliste - le fictionniste dirait Meehl (1991) - rejette au contraire la réalité de ces entités; la construction théorique est alors vue comme une fiction commode, comme un moyen servant un but pratique. Humphreys (1979) voit ainsi dans le facteur g une unité fonctionnelle, une abstraction qui résume le fonctionnement général du système et qui présente l'avantage de possèder un certain caractère de prédiction. La stratégie de validation nomologique, on le voit, vise autant à déterminer la validité de la construction psychologique qu'à tester formellement des propositions nomothétiques - et cette démarche est nécessairement sans fin - afin d'expliciter, d'enrichir et d'épurer le réseau nomologique dans lequel le psychologue inscrit cette construction. La prédiction et le contrôle des faits sont en quelque sorte la voie épistémique de l'élaboration théorique. La validité nomologique est d'autant mieux établie que «le savoir théorique mis à contribution sera important» (Chalmers, 1987, p. 53). En aucun cas enfin, une des définitions opératoires d'une construction psychologique ne peut être extraite de son réseau nomologique de référence: «le réseau nomologique doit être suffisamment spécifié et explicite pour qu'on puisse l'accepter ou le rejeter. L'utilisateur qui rejette la théorie de l'auteur ne peut accepter sa validation.» (Cronbach & Meehl, 1955, p. 291). La recherche de validation à l'épreuve de l'évolution des idées en philosophie des sciences. Il n'est pas besoin de rappeler que depuis les années 50, les idées ont très sensiblement évolué en philosophie des sciences; nombreuses ont été les interrogations sur la fragilité de la base fournie par l'expérience, sur le caractère non symétrique de l'explication et de la prédiction, sur l'incommensurabilité des théories scientifiques...(voir par exemple Jacob, 1980). Certains philosophes, tout en croyant à quelque base sûre d'observations, ont questionné le statut de la preuve dans la construction du savoir scientifique. Une théorie scientifique ne peut être prouvée à jamais affirme Popper; les faits ne peuvent servir qu'à corroborer des hypothèses théoriques audacieuses ou à falsifier des hypothèses théoriques prudentes. Suivant une voie plus radicale, d'autres philosophes ont affirmé que les énoncés d'observation sont dépendants de la théorie, que les faits sont «impurs». Si la base fournie par l'observation est aussi faillible que la théorie avec laquelle elle est en symbiose, peut-elle alors, comme le prétendent les fondationnistes, servir de fondement à la science? Si les faits empiriques peuvent ne pas être épistémologiquement pertinents ou les données mal traduire les faits, la stratégie falsificationniste ne risque-t-elle pas de conduire, à tort, au rejet d'une théorie? Plus fondamentalement peut-être, tous s'accordent pour reconnaitre que la nature des choses n'est pas simple, qu'elle n'est que simplifiée. La non-réductibilité de tout système complexe est-elle alors compatible avec la condition de clôture et son corollaire, l'idée instrumentaliste de symétrie entre explication et prédiction? La psychologie scientifique n'est bien sûr pas restée à l'abri de cette remise en cause de la conception «standard», néo-positiviste, de la science, conception désormais jugée comme de plus en plus irréaliste. On connait le succès dans notre discipline de l'idée de falsifiabilité d'une hypothèse théorique et beaucoup d'empiristes se réclament désormais du «falsificationnisme sophistiqué» de Popper. Ajoutons pourtant, ainsi que le notent Greenwald, Pratkanis, Leippe & Baumgardner (1986), que le test d'hypothèse s'avère plus souvent être confirmation de conjectures prudentes que falsification d'«hypothèses rivales plausibles» (Campbell, 1957). Choisissant avec Kuhn de définir la science comme une activité sociale sous l'influence de normes, de principes, de paradigmes..., d'autres psychologues ont adopté une attitude plutôt relativiste, les plus sceptiques d'entre eux allant même jusqu'à nier la démarcation entre science et pseudo-science. On retrouve la marque de cette évolution des idées chez des psychologues comme Meehl, Campbell ou Cronbach qui ont exprimé une certaine insatisfaction par rapport aux objectifs initiaux de la recherche de validation nomologique et considèrent que le positivisme logique ne peut être une reconstruction rationnelle du statut logique des sciences. Meehl estime ainsi qu'il s'est montré «beaucoup trop positiviste» dans sa discussion du réseau nomologique. Il est vrai que le fait de ne pouvoir prouver la véracité d'une théorie questionne pour le moins l'affirmation selon laquelle «le travail de la construction théorique, c'est qu'elle soit "vraie"» (MacCorquodale & Meehl, 1948, p. 104). Meehl propose d'ailleurs de remplacer le questionnement sur la «vérité» de la théorie par une interrogation sur son degré de vérisimilarité, concept emprunté à la méthodologie des programmes de recherche de Lakatos qui, on le sait, affaiblit le critère de démarcation popperien. Campbell (1990) considère de son côté qu'il serait bon d'abandonner tout jugement discrétionnaire à l'égard des déductions tirées de la théorie ainsi qu'à l'égard de l'établissement des «faits» et qu'un certain relativisme est souhaitable. Mais le premier comme le second acceptent une version «aménagée» de la distinction positiviste entre faits et théorie. Le bilan que dresse Cronbach est beaucoup plus pessimiste. «C'est sans doute, écrit-il, une erreur tactique que d'avoir lié la recherche de validation nomologique à l'idéal positiviste» (1986a, p. 159). Dés 1975, Cronbach juge les résultats de l'approche Aptitude-Traitement-Interaction très décevants par rapport à l'objectif initial d'identification de réseaux de lois. La complexité des interactions entre les effets de l'instruction et les caractéristiques individuelles lui paraît telle qu'il estime impossible de répliquer les résultats. Dans un texte plus récent, Cronbach (1986b) prône même un certain pluralisme et recommande de complèter l'approche scientifique traditionnelle par des méthodes qui ne sont pas les siennes et généralement utilisées dans une tradition humaniste de la psychologie. Opérationnalisation et recherche de validation: quelle alternative? Les réflexions précédentes montrent à l'évidence que la croyance en la solidité des hypothèses et des méthodes empiriques traditionnelles est désormais moins assurée qu'elle n'a pu le paraître par le passé. Faut-il pour autant, comme Cronbach, déçu qu'on ne puisse «assembler de manière ultime des généralisations et des constructions théoriques dans un réseau» (1975, p. 123), considérer comme illusoire le projet d'une recherche de validation de type causal, voire même abandonner les méthodes traditionnelles de la psychologie scientifique (Cronbach, 1986b)? Une telle attitude aussi extrême ne peut qu'alerter; elle prouve que le problème de la recherche de validation doit être reconsidéré. C'est d'ailleurs cette nécessité que nous avons voulu marquer par l'interrogation posée dans le titre de cette note. Or le développement de certaines stratégies de recherche en psychologie permet de penser que des voies autres que celle recommandée par Cronbach peuvent être suivies sous réserve cependant que l'on accepte l'idée, somme toute raisonnable, que les faits peuvent être une base relativement sûre - c'est à dire objective mais non infaillible - d'observations (Chalmers, 1991). Les faits peuvent être une base d'observations d'autant plus sûre que la représentation quantitative ou qualitative que le psychologue donne de la structure des observations s'appuie sur un modèle de mesure spécifié permettant de justifier du respect d'une certaine axiomatique. Quoique non suffisante, cette condition est me semble-t-il nécessaire; une telle formalisation sert à définir la correspondance entre les observables et les paramètres du modèle de mesure. Certains modèles, par exemple probabilistes, permettent ainsi de spécifier à l'aide d'un ou de plusieurs paramètres la probabilité pour que se produise un évènement déterminé (le choix d'une réponse à un item de questionnaire par exemple). On voit donc que du point de vue de l'opérationnalisation, ce qui est mesuré est défini - au moins en partie - par le modèle de mesure et sa correspondance avec le domaine empirique des observations (Roskam, 1989). Le problème de la validation se pose si, partant du concept, on estime, comme par exemple Embretson (1983, 1985), que l'analyse théorique des structures et des mécanismes est de nature à nourrir l'interprètation des faits; l'objectif est alors d'identifier ces mécanismes théoriques et d'étudier la validité des épreuves dont on fait l'hypothèse qu'elles les mettent en œuvre. Mais si, plus radicalement, on considère avec Guttman (1982) ou Roskam (1989, 1990) que les observations ne servent pas à comprendre les concepts mais que ces derniers servent à exprimer notre compréhension des observations, le problème de la validation se pose différemment; le modèle de mesure définit de manière exclusive ce qui est mesuré et l'objectif est d'expliquer une classe d'évènements comportementaux renvoyant à un domaine spécifié. Illustrons ces deux stratégies à l'aide d'exemples. Distinguant la «représentation de la construction théorique» (processus, stratégies, structures de connaissance impliqués dans la résolution des items d'un test) de «l'empan nomothétique» (l'utilité du test dans la mesure des différences individuelles), Embretson (1983), suggère que la validité conceptuelle du test dépend «de l'influence relative des variables cognitives sous-jacentes» (1985, p. 198). Pour «décomposer» cette validité, elle utilise une technique de modèlisation en traits latents (Multicomponent Latent Trait Modeling) permettant de spécifier la relation entre les caractéristiques de l'item et l'aptitude de l'individu. Très brièvement, ce modèle combine un modèle psychométrique d'analyse des différences individuelles (modèle précisant de manière formelle comment les différences entre items et celles entre individus peuvent être mises en rapport avec chacune des composantes de l'item) à un modèle mathématique permettant de déterminer la probabilité de réponse à l'item en fonction de la probabilité de réponse à chacune de ses composantes. La procédure utilisée s'inspire de la méthodologie d'analyse des composantes de la cognition (Sternberg, 1977). Elle consiste à administrer une tâche (analogies, classifications verbales) de deux manières: sous forme de test classique et décomposée en sous-tâches. Dans ce second cas, Embretson estime à partir de la performance mesurée au niveau componentiel et à l'aide du modèle MLTM, les paramètres individuels correspondants. Des analyses structurales de type Lisrel permettent d'étudier la validité des composantes sous l'angle des différences individuelles d'aptitude (pour la classification verbale, la composante «évaluation de la réponse» a par exemple plus de poids que la composante «élaboration de la règle»), d'analyser componentiellement la validité prédictive des tests, d'étudier le degré de généralité des composantes en fonction des tâches. Intègrant les perspectives générale et différentielle, ce type de modèlisation pourrait être plus largement utilisé dans le développement de tests, notamment dans le domaine cognitif. La stratégie méthodologique reste cependant la même que celle de la recherche de validation nomologique. Suggérée par Roskam (1989, 1990), une autre voie à suivre pourrait être de chercher en premier lieu à caractériser aussi précisément que possible la classe des évènements comportementaux à laquelle le psychologue s'intéresse. Précisons bien qu'il ne s'agit là ni de fournir une description exhaustive de tous les évènements susceptibles d'être associés à une entité notionnelle - comment cela pourrait-il être en effet possible? - ni, et ce serait là tomber dans le piège opérationnaliste et perdre toute possibilité d'explication, de définir le concept par l'opération (Reuchlin,1992). L'idée fondamentale est de considérer que les énoncés d'observations ne dépendent pas du caractère «vrai» ou «faux» de la théorie mais de la «nature des choses». La perspective, on le comprend, n'est pas essentialiste; il ne s'agit pas d'arriver à une description vraie du monde mais plus modestement d'enrichir, grâce à la méthode empirique, la compréhension d'un phénomène. La théorie en facetttes pourrait par exemple servir à cette caractérisation du domaine empirique en aidant à la spécification de l'univers des évènements observables constituant l'objet de la recherche (Canter, 1985). Roskam propose ainsi qu'une donnée d'observation - une catégorie de base permettant l'étude du comportement - soit le choix d'un individu parmi plusieurs alternatives, choix à la fois déterminé par des caractéristiques individuelles et situationnelles. Un plan en facettes définit l'observation sous forme de triplet {Situation, Individu, Réponse} en dressant l'inventaire des catégories observables. Prenons l'exemple du domaine «comportement de motivation» dans une situation consistant à générer des mots à partir de lettres; on pourrait par exemple avoir le plan en facettes suivant: Un triplet {S,I,R} appartient à l'univers des évènements observables du domaine «comportement de motivation» si et seulement si dans la situation S dans laquelle on définit A {une règle, un objectif, un critère} évoque une réponse préférentielle ordonnée A1 {très positive,..., très négative} et si l'individu choisit un niveau de difficulté A2 {très élevé,..., très faible} et/ou choisit de courir un risque A3 {très élevé,...,très faible} par rapport à la facette A. Le point essentiel est que le domaine empirique ne peut être analysé que si on dispose d'un modèle en traits latents permettant d'analyser les réponses. Il s'agit en effet de savoir s'il existe une structure latente sous-tendant la structure empirique correspondant au plan en facettes, l'objectif théorique étant de trouver quelles caractéristiques des individus et de la situation sont mises en jeu. Sous hypothèse que cette structure est unidimensionnelle, on peut analyser les données au moyen par exemple du modèle de Rasch qui présente la caractéristique de fournir une représentation de la structure empirique permettant une comparaison entre individus (resp. entre items) indépendante de la sélection des items (resp. des individus). Si tel est le cas, l'analyse en trait latent fournit des renseignements à la fois d'ordre général et différentiel. Ajoutons que des hypothèses plus complexes en termes de dimensionnalité de la structure latente peuvent être faites (Fischer, 1983). On voit que dans cette conception, théoriser le concept n'est pas le prendre comme objet d'analyse.mais c'est spécifier, dans un domaine d'observations, les déterminants personnels et situationnels ainsi que la relation fonctionnelle qui les relie, permettant de déterminer la probabilité avec laquelle peut survenir un évènement donné. Se distinguant selon que l'accent est mis sur l'analyse conceptuelle ou sur la définition a priori du domaine empirique, ces deux stratégies partagent une même hypothèse: celle qu''un modèle formel puisse représenter la structure latente des données empiriques. Bien qu'abordant toutes les deux différemment le problème de la validation, elles ne sont peut être pas antagonistes et pourraient très bien être utilisées à des moments différents d'une même recherche. Mais le fait que les observables ne puissent être dissociés à la fois du cadre conceptuel qu'ils présupposent, du modèle de mesure qui leur correspond et du contexte - au sens large - qui les détermine rend très certainement nécessaire qu'on ne s'en tienne pas là. L'objectif de la recherche de validation conceptuelle gagnerait alors à être fixé à un niveau moins ambitieux: tenter - en précisant le niveau d'approximation choisi - de dresser un catalogue d'effets locaux en déterminant par exemple dans quel domaine empirique, dans quelles conditions de réalisation la théorie pré-supposée ou explicite dans laquelle on inscrit le concept tient ou ne tient pas. BIBLIOGRAPHIE Bacher, F. (1986). Variables théoriques et variables observées: L'approche multitraitsmultiméthodes. Revue de Psychologie Appliquée, 36, 469-490. Barratt, E,S. (1985). Impulsiveness subtraits: Arousal and information processing. In J.T. Spence & C.E. Izard (Eds.), Motivation, emotion, and personality (pp. 137-146). North Holland, Elsevier. Block, J., Gjerde, Per F., & Block, J.H. (1986). More misgivings about the Matching Familiar Figures Test as a measure of reflection-Impulsivity: Absence of construct validity in preadolescence. Developmental Psychology, 22, 820-831. Campbell, D.T. (1960). Recommendations for APA test standards regarding construct, trait or discriminant validity. American Psychologist, 15, 546-553. Campbell, D.T. (1988). Methodology and epistemology for social sciences: selected papers. E.S. Overman (Ed.), Chicgo: University of Chicago Press. Campbell, D.T. (1990). The Meehlian corroboration-verisimilitude theory of science. Psychological Inquiry, 1, 142-147. Campbell, D.T., & Fiske, D.W. (1959). Convergent and discriminant validity in the multitraitmultimethod matrix. Psychological Bulletin, 56, 81-105. Canter, D. (1985). Facet theory: Approaches to social research. New York: Springer. Cronbach, L.J. (1957). The two disciplines of scientific psychology. American Psychologist, 12, 671-684. Cronbach, L.J. (1975). Beyond the two disciplines of scientific psychology. American Psychologist, 30, 116-127. Cronbach, L.J. (1986a). Construct validation after thirty years. In R.L. Linn (Ed.), Intelligence: Measurement, theory and public policy (pp. 147-171). Chicago: University of Illinois Press. Cronbach, L.J., (1986b). Social inquiry by and for earthlings. In D.W. Fiske a R.A. Shweder (Eds.), Metatheory in social science: Pluralisms and subjectivities (pp. 83-107). Chicago: University of Chicago Press. Cronbach, L.J. (1990). Essentials of psychological testing (5th ed.). N.Y.: Harper & Row Cronbach, L.J., & Meehl, P.E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52, 281-302. Embretson, S. (1983). Construct validity: Construct representation versus nomothetic span. Psychological Bulletin, 93, 179-197. Eysenck, S.B.G., Pearson, P.R., Easting, G., & Allsopp, J.F. (1985). Age norms for impulsiveness, venturesomeness and empathy in adults. Personality and Individual Differences, 6, 613-619. Feigl, H. (1950). Existential hypotheses: Realistic versus phenomenalistic interpretations. Philosophy of Science, 17, 35-62. Fischer, G.H. (1983). Logistic Latent Trait Models with linear constraints. Psychometrika, 48, 3-26. Fiske, D.W. (1973). Can a personality construct be validated empirically? Psychological Bulletin, 80, 89-92. Guttman, L. (1982). What is not what in theory construction. In R.M. Hauser, D. Mechanic, & A. Haller (Eds.), Social structure and behavior (pp. 331-348). New York: Academic Press. Humphreys, L.G. (1979). The construct of general intelligence. Intelligence, 3, 105-120. Kagan, J. (1966). Reflexion-Impulsivity: the generality of dynamics of conceptual tempo. Journal of Abnormal Psychology, 93, 133-140. Kuhn, T.S. (1983). La structure des révolutions scientifiques. Paris: Flammarion. Lord, F.M., & Novick, M.R. (1968). Statistical theories of mental test scores. Reading, Massachussetts: Addison-Wesley. Luengo, M.A., Carrillo-de-la-Pena M.T., & Otero, J.M. (1991). The components of impulsivenes: A comparison of the I.7 Impulsiveness Questionnaire and the Barratt Impulsiveness Scale. Personality and Individual Differences, 12, 657-667. MacCorquodale, K., & Meehl, P.E. (1948). On a distinction between hypothetical constructs and intervening variables. Psychological Review, 55 95-107. McGuire, W.J. (1989). A perspectivist approach to the strategic planning of programmatic scientific research. In B. Gholson, W.R. Shadish, R.A. Neimeyer, & A.C. Houts (Eds.), Psychology of science: Contributions to metascience (pp. 214-245). Cambridge: Cambridge University Press. Manicas, P.T., & Secord, P.F. (1983). Implications for psychology of the new philosophy of science. American Psychologist, 38, 399-413. Matalon, B. (1988). Décrire, expliquer, prévoir: démarches expérimentales et terrain. Paris: A. Colin. Meehl, P.E. (1990). Appraising and amending theories: The strategy of Lakatosian defense and two principles that warrant it. Psychological Inquiry, 1, 108-141. Meehl, P.E. (1991). Four queries about factor reality. History and Philosophy of Psychology Bulletin, 3, 16-18. Messick, S. (1981). Constructs and their vicissitudes in educational and psychological measurement. Psychological Bulletin, 575-588. Mook, D.G. (1983). In defense of external validity. American Psychologist, 38, 379-387. Popper, K.R. (1968-A, 1973-F). La logique de la découverte scientifique. Paris: Payot. Reuchlin, M. (1962-1, 1975-2). Les méthodes quantitatives en psychologie. Paris: PUF. Reuchlin, M. (1969-1, 1990-5). La psychologie différentielle. Paris: PUF. Reuchlin, M. (1992). Introduction à la recherche en psychologie. Paris: Nathan. Roskam, E.E. (1989). Operationalization, a superfluous concept. Quality and Quantity, 23,237-275. Roskam, E.E. (1990). Formalized theory and the explanation of empirical phenomena. In J.J. Hox & J. de Jong-Gierveld (Eds.), Operationalization and research strategy (pp. 179-198). Amsterdam, Swets & Zeitlinger. Schmitt, N., & Stults, D.M. (1986). Methodology review: Analysis of multitrait-multimethodes matrices. Applied Psychological Measurement, 10, 1-22 Stanford, M.S., & Barratt, E.S. (1992). Impulsivity and the multi-impulsive personlity disorder. Personality and Individual Differences, 13, 831-834. Sternberg, R.J. (1977). Intelligence, information processing, and analogical reasoning: The componential analysis of human abilities. Hillsdale, N.J.: Erlbaum. Tolman, E.C. (1938). The determiners of behavior at a choice point. Psychological Review, 45, 141. Ullmo, J. (1958,1969). La pensée scientifique moderne. Paris: Flammarion. van den Broek, & Bradshaw, C.M. (1993). An inivestigation of the relationship between perseveration and impulsiveness. Personality and Individual Differences, 14, 531-534..