INTRODUCTION AUX THÉORIES ET AUX MÉTHODES DE LA MESURE EN SCIENCES PSYCHOLOGIQUES ET EN SCIENCES DE L'ÉDUCATION Marc Demeuse Institut d‘Administration scolaire, Université de Mons-Hainaut et Institut de Recherche sur l’Education (IREDU), CNRS/Université de Bourgogne Janvier 2004 REMERCIEMENTS La préparation de cette version de l’Introduction aux théories et aux méthodes de la mesure en sciences de l’éducation a été rendue possible grâce à une bourse offerte par le Conseil général de la Région de Bourgogne (France) et à un séjour à l’Institut de Recherche sur l’Education (IREDU, CNRS/Université de Bourgogne). La mise en page et la présentation finale du document ont été assurées par Anne-Marie Alestra (Service de Pédagogie théorique et expérimentale de l’Université de Liège, Belgique). Le texte a été revu par Christian Monseur (Service de Pédagogie théorique et expérimentale de l’Université de Liège, Belgique). Introduction Demeuse Introduction INTRODUCTION Le domaine de la mesure en psychologie et en sciences de l’éducation est un domaine extrêmement vaste et dont les techniques sont particulièrement variées. Ce texte envisage le problème de la mesure de manière principalement théorique, même s’il est illustré d’exemples ou d’exercices. Sa vocation n’est pas de se limiter à la théorie des tests en psychologie 1. Le terrain de la psychophysique et de l’observation directe du comportement sont ainsi également abordés, de même que la mesure en éducation, aussi appelée « édumétrie ». Ce dernier domaine comporte ses propres spécificités, mais il repose en partie sur les développements historiques de la psychométrie2. Il semblait donc particulièrement économique de rédiger un ouvrage d’ensemble, notamment dans un pays où la formation de premier cycle est commune aux psychologues et aux futurs spécialistes de l’éducation. Il existe très peu d’ouvrages en langue française sur la mesure dans ces deux disciplines, en dehors de la théorie des tests, dont au moins l’un des trois ouvrages les plus connus (Anastasi, 1994 ; Dikes, Tournois, Flieller et Kop, 1994 ; Bernier & Pietrulewicz, 1997) est une traduction partielle du texte rédigé en anglais par Anne Anastasi 3. Dans le domaine de la psychophysique, il n’existe guère plus de ressources francophones, en dehors du manuel de Claude Bonnet (1986). Lui-même signale cette absence, y compris en langue anglaise, depuis la publication des ouvrages de Woodworth (1949) et de Guilford (1954)4. C’est notamment à ce dernier ouvrage que nous devons notre intérêt pour ce domaine et nous en suivrons une partie de l’agencement. Nous laisserons d’ailleurs la parole à son auteur dans la première partie où nous reproduisons son premier chapitre, traduit en langue française. Comme le signale Larencelle (1998, p. 14), la distinction entre évaluation et mesure prend généralement peu d'importance en sciences et dans le monde des laboratoires scientifiques. Les mesures y sont pour la plupart physiques, purement matérielles, et ne donnent en ellesmêmes que peu de champ à l'interprétation subjective. Au contraire en psychologie, 1 2 3 4 Piéron (1979, p. 363) définit la psychométrie comme l’ensemble des méthodes de mesure utilisées dans le domaine psychologique. Elle comprend la sensorimétrie, et constitue la base de la psychotechnique. Nous aborderons ces deux aspects, respectivement dans la troisième partie, consacrée à la psychophysique, et dans la quatrième partie, consacrée à la théorie des tests. Il semble cependant important de prendre aussi en compte d’autres aspects, comme la mesure directe du comportement (partie 2) et la mise en œuvre d’échelles de mesure (d’attitudes) (partie 4). Dans une note de bas de page de leur article intitulé « La psychométrie sensorielle au XIXe siècle », Nicolas et Ferrand (2001) précisent « qu’au cours du temps, le terme « psychométrie » a changé de signification. Dans sa signification courante actuelle, la psychométrie a trait à la mesure des différences individuelles au moyen des tests et des techniques similaires ». Cette acception est bien plus limitée dans sa portée que celle de Piéron, que nous avons adoptée. A titre purement anecdotique, il convient de signaler un usage particulier du terme « psychométrie » en dehors du domaine de la psychologie scientifique. Dans leur ouvrage intitulé « Voyance, psychométrie et radiesthésie. Comment développer visions, perceptions et sensations du passé, présent et futur », paru en 1999 aux Editions Servranx (Bruxelles), F. et W. Servranx et leurs collaborateurs définissent ce terme de la manière suivante : « C’est la faculté qu’ont certaines personnes de décrire les sensations qu’elles éprouvent au contact des objets. Ces sensations consistent en malaises, images, impressions diverses, idées subites, voix entendues, etc., et ont ordinairement trait au passé de l’objet, parfois à son avenir et parfois encore à une personne mêlée à l’histoire de l’objet » (p. 41). Cette acception très particulière du terme « psychométrie » n’a naturellement aucun lien avec notre propos. Anastasi, A. (1982). Psychological Testing. New York / London : MacMillan. On peut néanmoins citer l’ouvrage, extrêmement formalisé, de Jean-Claude Falmagne, paru en 1985 et réédité récemment (Falmagne, 2002). Cet ouvrage est malheureusement d’un abord difficile pour un lecteur novice. Introduction 3 Demeuse Introduction en éducation et dans les autres sciences humaines, l'évaluation peut et doit compléter la mesure, puisque souvent la valeur potentielle de celle-ci dépend entièrement du contexte dans lequel on la fait intervenir. Il conviendra donc bien de distinguer le travail d’instrumentation et les méthodes de mesure de l’interprétation qui pourra être faite du mesurage, même si la construction de l’instrument est déjà un parti pris. Poursuivons le raisonnement de manière à mieux préciser cette relation entre mesure et évaluation (Laurencelle, 1998, pp. 12-13) : Comme toute autre fonction d'information, la mesure qui exprime d'une façon ou d'une autre la « grandeur » d'un objet, prend toute sa signification dans un contexte; elle est alors interprétée et exploitée dans un but, social, éducatif, économique, scientifique. C'est cette action globale qu'on désigne par « évaluation ». Évaluer, c'est donc plus que mesurer, et l'on devrait parler d'un « jugement évaluatif » plutôt que d'une évaluation. Tandis que la mesure est, ou devrait être, une opération quasi machinale, l'évaluation est un acte foncièrement responsable, une décision concernant l'objet ou la personne évaluée. Pour prendre ce jugement, l'évaluateur doit a) obtenir l'information mesurée, b) apprécier cette information en considérant l'instrument de mesure, la caractéristique évaluée et la personne, c) utiliser une référence comparative. Dans ces conditions seulement, l'évaluation (ou l'évaluation scientifique) pourra être faite avec compétence et justice. Nous pouvons maintenant donner une définition extensive de l'évaluation : un jugement d'une qualité, d'une performance, d'une caractéristique définie, basé sur une mesure (issue d'un instrument, un test, etc.), se référant à un critère intrinsèque ou extrinsèque et prenant diverses formes. C'est donc d'abord un jugement, non pas seulement le résultat d'un test ou la donnée sortant d'une machine; c'est un acte responsable d'un évaluateur (par exemple, l'enseignant), qui a des conséquences sur la vie d'une autre personne ou sur le rejet ou l'avancement d'une théorie. Pour faire ce jugement, il faut interpréter la mesure, le résultat, dans les contextes global et particulier dans lesquels se trouve la personne évaluée. L'évaluation porte aussi sur un objet d'évaluation plutôt que sur la personne elle-même, et le jugement doit se borner à l'aspect évalué plutôt que d'être interprété comme s'il caractérisait globalement la personne. La personne évaluée devrait avoir une connaissance claire de ce qui est évalué chez elle; ainsi, dans le contexte scolaire, la note en mathématique n'est pas un score d'intelligence de l'élève, ou « l'attitude coopérative » en hockey sur glace n'est pas synonyme d'amour du hockey, ni d'amour du professeur d'éducation physique ! Le jugement évaluatif doit être basé sur quelque chose, tels un test, un appareil, un procédé défini d'avance, mais en tout cas ne pas être improvisé. Cela n'exclut pas certaines évaluations utilisant la « méthode des juges », pourvu que les aspects évalués et les critères de pondération soient préalablement et clairement définis. L'évaluation, on l'a dit, n'existe pas dans l'absolu; c'est un jugement, ce qui implique une référence, parfois une comparaison. On jugera selon le contenu de la performance, la valeur propre du résultat (par critère intrinsèque), ou selon l'aspect ordinaire ou exceptionnel du résultat (par critère extrinsèque). Enfin, le jugement évaluatif peut affecter des formes multiples. Dans certains cas, la seule sanction sera celle de succès ou échec; parfois, l'évaluation apparaîtra comme une liste d'éléments de connaissance ou de performance à améliorer; le résultat pourra prendre la forme d'une cote T, d'un rang centile, de contre-indications cliniques, etc. 4 Introduction Demeuse Introduction Ce long développement, emprunté à Laurencelle, ne doit pas conduire, puisque l’évaluation est plus que la mesure, à négliger celle-ci, comme s’il était possible de « passer outre ». Si l’évaluation est plus que la mesure, c’est parce qu’elle s’y ajoute, qu’elle s’en nourrit. Une mauvaise mesure – nous verrons quelles sont les qualités d’une « bonne mesure » - ne peut conduire qu’à une mauvaise évaluation, une évaluation biaisée. Ces quelques pages sont destinées à éclairer le lecteur, futur psychologue ou spécialiste de l’éducation, sur ce qu’il convient d’entendre par « mesure » dans son propre champ. Cet intérêt pour la mesure est subordonné à son usage, mais celui-ci ne justifie pas tout. La mesure en psychologie et dans les sciences de l’éducation obéit à des règles, tout n’est pas possible et toutes les techniques ne se valent pas. Il faut encore, même si ce sujet n’est pas spécifiquement abordé ici, attirer l’attention du lecteur, sur les aspects déontologiques inhérents au travail entrepris en relation avec des êtres vivants. La mesure et l’évaluation doivent être interrogées en fonction des finalités qui leur sont assignées. A ce niveau, le sujet/objet de la mesure n’est pas anodin5 ! Références American Educational Research Association, American Psychological Association, National Council on Measurement in Education (2002). Standards for educational and psychological testing. Washington : American Educational Research Association. Anastasi, A. (1994). Introduction à la psychométrie. Montréal : Guérin éditeur. Bernier, J.J., Pietrulewicz, B. (1997). La psychométrie. Traité de mesure appliquée. Montréal : Gaëtan Morin éditeur. Bonnet, C. (1986). Manuel pratique de psychophysique. Paris : Armand Colin. Collection U. Dikes, P., Tournois, J., Flieller, A., Kop, J.L. (1994). La psychométrie. Paris : Presses universitaires de France. Falmagne, J.C. (2002). Eléments of Psychophysical Theory. Oxford : Oxford University Press, Oxford Psychological series n° 6. Guilford, J.P. (1954). Psychometric Methods. New York : McGraw-Hill. Laurencelle, L. (1998). Théorie et techniques de la mesure instrumentale. Sainte-Foy : Presses de l’Université du Québec. 5 Il existe, dans le domaine de l’évaluation, des standards, édités par des associations professionnelles comme l’American Educational Research Association, l’American Psychological Association ou le National Council on Measurement in Education (2002). En français, on peut, notamment, trouver un texte canadien sur le sujet intitulé « Principes d’équité relatifs aux pratiques d’évaluation des apprentissages scolaires au Canada ». Ce texte est l’œuvre d’un comité consultatif mixte, composé de représentants de l’Association canadienne d’éducation, de l’Association canadienne des commissions/conseils scolaires, de l’Association canadienne des administrateurs scolaires, de la Fédération canadienne des enseignantes et enseignants, l’Association canadienne d’orientation et de consultation, de la Canadian Association of School Psychologists, du Conseil canadien pour les enfants exceptionnels, de l’Association canadienne de psychologie et de la Société canadienne pour l’étude de l’éducation. Ce texte a été publié par la revue « Mesure et évaluation en éducation » de l’Association pour le développement de la mesure et de l’évaluation en éducation. Il est disponible sur le site http://ww.education.ualberta.ca/educ/psych/crame/files/fr_princ.pdf L’international Test Commission / Commission internationale des Tests a également promulgué un texte intitulé, dans sa version française : « Recommandations internationales sur l’utilisation des tests ». Ce texte a été publié par la Société Française de Psychologie dans un numéro spécial hors série de la revue « Pratiques psychologiques » (2003). Il est aussi disponible sur le site de la Société Française de Psychologie (http://www.sfpsy.org). Introduction 5 Demeuse Introduction Nicolas, S., Ferrand, L. (2001). La psychométrie sensorielle au XIXe siècle. Psychologie et Histoire, vol. 2, 148-173. Pieron, H. (1979). Vocabulaire de la psychologie. Paris : Presses universitaires de France. (6e édition remaniée et augmentée sous la direction de F. Bresson et G. Durup). Woodworth, R.S. (1949). Psychologie expérimentale. Tomes I et II (trad. Franç.). Paris : Presses universitaires de France. 6 Introduction