Introduction à la psychométrie de l'enfant
Ce cours portera principalement sur les tests d'évaluation de l'intelligence.
1. Concepts généraux sur les tests
1.1. Caractéristiques générales des tests
On restreint souvent le rôle du psy à celui de testeur. Cette une vision tout à fait réductrice,
mais on lui reconnaît bien cette fonction. La notion de test mental a été proposée par Cattell
en 1890, pour désigner l'ensemble des épreuves permettant de sonder les individus, ou plus
particulièrement de mettre en relation les performances d'un individu avec ses compétences
mentales, qui étaient jusqu'alors considérées non-quantifiables. L'introduction des tests,
permettant d'évaluer des compétences, a fait de la psychologie une "science exacte".
"Mesurer" est en fait un abus de lgg, il faudrait dire quantifier...
2 auteurs vont particulièrement marquer l'évolution des tests
Galton : il s'est intéressé à l'utilisation de méthodes statistiques pour quantifier les
différences interindividuelles. G considérait qu'il y avait des familles biologiquement
intelligentes et d'autres non, de même qu'il considérait les femmes moins intelligentes.
Il tente d'élaborer des épreuves pour valider ses conceptions : épreuves
physiologiques, sensorielles, perceptives... Les résultats à ces épreuves ont montré de
faibles valeurs prédictives (i.e. ils ne permettent pas de prédire, par ex la réussite
sociale des individus...).
Binet a construit la première échelle d'intelligence, l'EMI (M pour métrique). C'est
une épreuve qui devait permettre de détecter les enfants qui ne seraient pas capables
de suivre une scolarité, devenue obligatoire depuis peu.
1.1.1. Qu'est-ce qu'un test ?
Ces critère sont vrais (nécessaires) quelque soit le type de test.
C'est une méthode particulière de la psychométrie. La psychométrie est l'ensemble des
méthodes, des techniques scientifiques d'investigation du psychisme, d'évaluations de
variables psychiques. Les tests servent à évaluer des personnes.
Ses objectifs sont d'obtenir en un temps bref des informations précises, quantifiées et
objectives (i.e. indépendantes de la subjectivité de l'examinateur) sur des caractéristiques
mentales de l'individu, à partir desquelles le psy pourra formuler un diagnostic ou un
pronostic.
Définition du test :
Un test est une épreuve standardisée, dans son administration et sa cotation,
qui renseigne sur certaines caractéristiques affectives, intellectuelles ou sensori-
motrices d'un individu, et permet de le situer objectivement par rapport aux
autres membres du groupe social dont il fait partie (étalonnage).
Standardisé : strictement défini dans ses conditions d'application et de cotation (identique
pour tous les individus.
Etalonné : qui permet de situer la performance d'un individu parmi celles d'une population de
référence, elle-même strictement définie.
Les tests renvoient à la notion de "méthode clinique armée". La méthode clinique étant
elle l'ensemble des permettant d'étudier un individu particulier. Un test est donc un moment
d'une investigation , un complément des informations de l'entretien clinique. Ce n'est qu'un
élément de diagnostic (parmi d'autres), à mettre en relation avec les autres informations
(obtenues par ex par l'entretien...). Un psy n'est don pas uniquement un testeur.
Le test se situe à l'interface des méthodes expérimentale et clinique. Il relève de la
méthode expérimentale lors de son élaboration et de son utilisation, et de la méthode clinique
lors des étapes ultérieures, notamment interprétation, diagnostic et pronostic. Il peut être
utilisé dans les deux perspectives : le plus souvent dans la clinique, pour évaluer un individu,
mais aussi dans des études expérimentales, lorsque les résultats sont obtenus sur un ensemble,
un groupe. C'est par ex. le cas quand on veut connaître le niveau de vocabulaire des enfants de
6 ans. Par opposition, on l'utilise de façon clinique pour connaître le niveau d'un enfant donné.
Diversité des pratiques des tests :
lieux d'utilisation : hôpitaux, écoles, cabinets, armée, entreprise...
champs de la psychologie : développement, clinique, sociale...
âge : nourrissons, enfants, adolescents, vieux...
objectifs recherchés : dépister (par ex. des enfants en difficulté d'apprentissage),
sélectionner, orienter, diagnostiquer pronostiquer...
Différents types de tests. Chacun évalue un aspect particulier du psychisme, par ex.
l'intelligence, ou la personnalité. La synthèse de l'ensemble des infos fournit une image
relativement complète des compétences de l'individu. On distingue deux grandes familles de
tests :
Les tests cognitifs visent à évaluer des connaissances générales, l'intelligence, les
aptitudes d'un individu. Deux classes :
o les fonctions instrumentales : tests de vocabulaire, calcul, lgg... Ils testent une
(ou certaines) fonction(s) particulière(s).
o les fonctions cognitives générales : intelligence.. C'est ceux que traitera plus
particulièrement ce cours.
Les tests de personnalité : ils visent à objectiver l'ensemble des composantes
affectives, relationnelles ou caractérielles des individus. Tes ts de personnalité
(souvent des questionnaires) et tests projectifs (Rorschach).
1.1.2. Standardisation et étalonnage
1.1.2.1. Standardisation
L'objectif d'un tests est de comparer les comportements d'individus placés dans la même
situation . Il est donc nécessaire d'obtenir un max d'objectivité en ce qui concerne l'application
et la cotation. Celle-ci va être atteinte grâce à la standardisation du test, qui garantit l'identité
de la tâche à accomplir, du matériel (consignes...), la manière d'enregistrer les réponses, de les
noter (selon des critères de notation précis).
La standardisation concerne tout ce qui est inhérent à l'épreuve et à l'intervention de
l'examinateur afin que tous les individus soient placés dans les mêmes conditions.
1.1.2.2. Etalonnage
L'étalonnage correspond à l'application préalable d'un test à un échantillon, qui servira de
population de référence. Cet échantillon est sélectionné pour être le plus représentatif possible
de la population en général. Il est choisi en fonction de certaines caractéristiques (âge, sexe,
milieu socio-culturel...), de l'objectif du test (pour étalonner un test destiné à des enfants , il
est nécessaire que les sujets aient la même moyenne d'âge...).
Les résultats vont permettre d'établir des tables de référence qui permettront de situer les
individus testés ultérieurement. Il existe deux types d'étalonnage : Quantilage et échelle
normalisée.
Dans le domaine de la mesure, il faut veiller à distinguer les variables observables (note, qui
traduit la performance de l'individu) des variables que l'on cherche à évaluer (les
compétences). Cette note est en général une valeur numérique. Mais attention, des mêmes
différences de score ne traduisent pas nécessairement des les mêmes différences de
compétence. La différence entre 4 et 6 (sur 20) peut être par ex. moins marquée qu'entre 14 et
16 (alors que l'écart est le même) parce que la difficulté peut augmenter entre 4 et 14.
Pour passer des variables observables (scores) aux variables à évaluer (compétence), on a
besoin d'une hypothèse.
Hypothèse faible : la compétence est une fonction monotone (soit croissante soit décroissante
dans un intervalle donné) de la note aux tests. I.e. plus la note est forte, plus la compétence est
grande ; ici ce qui importe, c'est l'ordre des notes, et non les différences. Cela renvoie aux
quantilages.
Pour réaliser un quantilage, on range les scores dans un ordre croissant, puis on constitue des
classes comportant le même pourcentage de notes : quartilage (en 4 parts de 25 % chacune),
décilages (10 de 10%)centilages (100 de 1 %).
Hypothèse forte : la compétence est une fonction linéaire de la note. Ici ce sont les
différences qui correspondent : une même différence de score renvoie à une même différence
de compétence. On utilise pour cela des échelles normalisées, puisque les notes doivent être
distribuées selon une courbe normale (de Laplace-Gauss). Les courbes ne comportent pas les
mêmes pourcentages de scores. On s'intéresse aux différences, non plus aux ordres. WISC et
WECHSLER se basent sur une loi normale centrée réduite.
1.1.3. Qualités métrologiques
Les tests doivent présenter certaines qualités métrologiques : fidélité, sensibilité, validité.
1.1.3.1. Sensibilité du test
C'est la capacité d'un test à bien différencier les sujets entre eux, cela correspond au pouvoir
discriminatif du test. Un test est + ou - sensible en fonction du nombre + ou - grand de classes
dans lesquelles on pourra situer les individus. Pour assurer ce pouvoir de discrimination, on
peut :
multiplier, augmenter le nombre d'items d'un test,
ou jouer sur les conditions de passation, la difficulté (on peut par ex. demander de
répondre en 30 s., ce qui implique une gestion du temps et une certaine rapidité).
1.1.3.2. Fidélité
Cela renvoie à la consistance des résultats à travers le temps. Un test est dit fidèle si les
résultats d'individus varient en moyenne peu dans le temps et sont susceptibles d'être
reproduits. Il est dit non-fidèle s'ils varient trop par ex. entre deux passations par des
examinateurs différents...
Pour quantifier cette fidélité, on calcule un coefficient de corrélation. 1 indique une fidélité
parfaite, 0 nulle.
Indice de constance : on fait passer le même test à un même groupe d'individus, à deux
périodes distinctes. Il peut être affecté par différents biais :
apprentissage (c'est le même test),
fluctuation de la motivation des sujets,
modification des conditions de passation (affectives, ou autres...)
Indice d'équivalence : on applique deux épreuves censée quantifier la même compétence à
un même groupe (par ex. le PM et le D48). Cet indice vérifie que la manière dont les items
sont présentés n'interfère pas dans l'évaluation. S'il s'approche de 1, on considère qu'ils
mesurent bien la même compétence.
Indice d'homogénéité : on divise le test en deux parties équivalentes et on calcule le
coefficient de corrélation entre elles.
Un facteur pouvant jouer sur la fidélité est l'ambiguïté des items, ou le fait qu'ils puissent
prendre des significations différentes à différents moments.
1.1.3.3. Validité
C'est la capacité d'un test à évaluer ce qu'il est censé mesurer. Il y a différents critères de
validité :
Validité du contenu : le contenu présente bien le champ de connaissance évalué (par
ex. : les items appartiennent bien au voc normal d'enfants de 6 ans).
Validité prédictive (ou pronostique) : il y a une corrélation positive entre les
performances à l'épreuve et ce qu'elle est censée prédire (ex. : réussite scolaire...).
Validité de construction : elle réside dans l'élaboration théorique du test, qui permet
d'émettre des hypothèses sur le fonctionnement et l'élaboration des réponses par les
sujets. Un test est toujours une opérationalisation d'une hypothèse basée sur une
conception de l'intelligence.
Cours 2
La révision d'un test est nécessaire du fait de l'évolution des caractéristiques de la population.
Certains tests ne sont cependant pas révisés, pour différentes raisons. Il est possible que ce
qu'évalue le test relève de capacités générales (ex. : capacités non-verbales) dont on fait
l'hypothèse qu'elles évoluent peu. Une autre raison p ê économique : le test est trop peu
utilisé. Le WISC en est à sa 4e révision depuis 1980. On considère qu'une révision doit avoir
lieu ≈ tous les 10-15 ans.
La révision du test concerne le contenu des questions (est-il toujours pertinent ?), les réponses
acceptées, les critères de cotation, les échelles de résultats (réétalonnage).
1.2. Conclusion de l'intro
L'ensemble des caractéristiques d'un test (étalonnage, standardisation, sensibilité, fidélité,
validité) font qu'un test est un outil très spécifique dont l'interprétation et l'utilisation
nécessitent de l'expérience et des connaissances théoriques, lors de la passation et de
l'interprétation. Le travail de psy est de compléter les données chiffrées par l'interprétation,
etc.
Parler de "mesure" de l'intelligence est un abus de lgg. Mesure, qui a un sens mathématique,
nécessite un étalon (comme : cm, min...) qui va être reporté autant de fois que nécessaire pour
mesurer une grandeur. Or il n'existe pas d'étalon des fonctions psychiques. Il faudrait que la
fonction soit mesurable pour pouvoir lui appliquer un certain nombre d'opérations ; ce n'est
pas le cas de l'intelligence (un QI de 120 n'est pas égal au triple d'un QI de 40).
C'est pourquoi on parlera plutôt d'évaluation des fonctions psychologiques. On va essayer
d'effectuer un classement d'un indidvidu par rapport à une population de référence.
Tout examen psychométrique évalue qqch de plus que la simple efficience intellectuelle
générale. Certaines caractéristiques comme les traits de personnalité (enfant motivé,
persévérant...) vont intervenir dans les résultats, ainsi que des variables situationnelles. Ces
facteurs non-intellectuels qui affectent les performances des individus doivent être pris en
compte lors de l'interprétation. Il est par ex. utile de mentionner comment se comportait
l'enfant, s'il participait, développait...
L'invention des tests a permis de rendre scientifique l'étude de l'intelligence par la mise en
œuvre d'une démarche objective (et non plus basée uniquement sur l'observation). Ils ont ainsi
contribués à développer nos connaissances sur le développement de l'enfant en particulier et
en général. (ex. du baby test de Brunet Lézine sur le dvpt psychomoteur général).
Ils fournissent des connaissances objectives sure les compétences cognitives de l'enfant et
permettent de dresser son profil de dvpt cognitif.
Cependant, il constituent une méthode descriptive qui ne nous renseigne pas sur les
mécanismes sous-jacents, sur les fonctionnement ayant permis à l'enfant de produire sa
réponse.
2. Le premier test d'intelligence : la NEMI
2.1. Quelques éléments historiques
L'Echelle Métrique d'Intelligence a été proposée par Binet, psychologue français véritable
promoteur des tests d'intelligence. A l'origine, cela répondait à un pb pratique à caractère
social. En 1904, la scolarité est rendue obligatoire pour tous, or certains élèves ne parviennent
pas à suivre celle-ci. Il est demandé à Binet de créer un outil permettant de détecter ces
enfants, afin de les réorienter. Il présente la première version de l'EMI en 1905, qui sera
modifiée plusieurs fois par la suite, jusqu'à la Nouvelle EMI, par ZAZZO en 1966.
Elle va marquer trois innovations importantes :
rupture avec la tradition empiriste qui consistait à fonder les examens psychologiques
sur l'évaluation des mécanismes sensoriels. Les travaux de Galton, Cattell...
consistaient à étudier les capacités sensorielles perceptives, ceux-ci estimant que l'on
pouvait ainsi obtenir des informations sur les performances intellectuelles. Les
résultats furent décevants et les prédictions impossibles.
Binet a lui travaillé sur les fonctionnement des processus supérieurs à l'œuvre dans les
tâches complexes de la vie quotidienne. Les épreuves étaient variées et adaptées à la
vie quotidienne.
Méthodologie de mesure : Binet se rendit compte que les enfants qualifiés de débiles
mentaux se comportaient de manière similaire à des enfants normaux mais plkus
jeunes. Il en déduit que les enfants avec des capacités intellectuelles amoindrie
correspondent à des enfants normaux dont la croissance serait retardée.
Il va étalonner un ensemble d'épreuves en essayant de repérer comment les enfants
normaux y répondent, pour ensuite y situer un enfant présentant une efficience
amoindrie (à quel âge les enfants de la norme répondent ainsi ?).
la troisième innovation est en fait un défaut (qui ne lui est d'ailleurs p-ê pas
imputable) : c'est la confusion entre l'intelligence au sens large et l'intelligence
scolaire. Elle est inhérente à la tâche même qui incombait à Binet, à savoir de dépister
des élèves qui ne parviendraient pas à suivre la scolarité normale. Cette confusion
persiste un peu jusqu'aujourd'hui. Débile est un terme utilisé pour désigner les enfants
incapables de suivre la scolarité ; il est aujourd'hui abandonné, au profit de déficient.
2.2. Intelligence et QI
2.2.1. Définition
Pour Binet, c'est une faculté unitaire, même s'il distingue plusieurs aptitudes (4 fonctions :
compréhension = analyse des données ; invention ; direction = capacité à conserver un but, un
objectif ; censure = capacité à critiquer). Cette capacité unitaire serait une caractéristique
inscrite en chaque individu, pour laquelle il convient de chercher une mesure stable, un
moyen de scientifique de mesure. Elle va permettre, pour Binet, à chaque
individu d'acquérir des savoirs et des connaissances. Il suffit par conséquent de mesurer la
quantité des savoirs pour avoir une information sur l'intelligence. C'est une conception
additive, capitalisante de l'intelligence. L'intelligence est définie comme une capacité
d'acquisition et va être mesurée au volume des connaissances.
Il propose donc un procédé consistant à ordonner les épreuves par âge, sélectionne de manière
empirique les épreuves (réputées mettre en jeu l'intelligence de l'enfant, et les présente à une
population de référence, puis les ordonne en fonction des taux de réussite par la majorité des
enfants.
1 / 22 100%
La catégorie de ce document est-elle correcte?
Merci pour votre participation!

Faire une suggestion

Avez-vous trouvé des erreurs dans linterface ou les textes ? Ou savez-vous comment améliorer linterface utilisateur de StudyLib ? Nhésitez pas à envoyer vos suggestions. Cest très important pour nous !