Telechargé par Djiby Ndiaye

Evaluation

publicité
02/02/2020
Evaluation
L'évaluation
modèles et pratiques
SOMMAIRE
Qu'est-ce que l'évaluation ?
Qu'est-ce qu'évaluer ?
Un modèle de l'évaluation ( parmi d'autres
)
Une typologie des évaluations
a L'évaluation formative
b L'évaluation formatrice
c L'évaluation sommative
Deux modalités d'évaluation
a L'évaluation normative
b L'évaluation critérielle
Évaluer des compétences en situation
Critérier l'évaluation des compétences
Séquence d’apprentissage : quand évaluer
?
a Les moments de l’évaluation
b Apprentissages et évaluation
Des outils pour l'évaluation
Les difficultés de l'évaluation
a Fidélité
b Validité
c Sensibilité
Qu'est-ce que l'évaluation ?
On peut tenter une définition de l’évaluation scolaire en s’interrogeant sur ses buts. Jean CARDINET 1 en
définit quatre, fondamentaux :
« - améliorer les décisions relatives à l’apprentissage de chaque élève
- informer sur sa progression l’enfant et ses parents
- décerner les certificats nécessaires à l’élève et à la société
- améliorer la qualité de l’enseignement en général. »
et précise qu’il ne peut s’agir d’évaluer de la même façon dans tous les cas. L’évaluation, en effet, même si elle
porte sur le même objet, à savoir une production d’élève, comporte des fonctions différentes : pédagogique,
sociale et institutionnelle.
Évaluer consiste donc essentiellement à fournir des informations à différents destinataires : élève(s),
professeur lui-même, parents, administration scolaire, autres professeurs, société... surtout en vue de prendre
des décisions : proposer des activités d’apprentissage, de soutien ou de remédiation ; décerner un diplôme ou
certifier de la maîtrise de compétences; transformer les méthodes et les modalités de l’enseignement; etc. La
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
1/19
02/02/2020
Evaluation
diversité des destinataires engendre d’ailleurs, parce que la nature de l’information attendue est différente pour
chacun, une première difficulté, fondamentale : il y a souvent incompatibilité, voire contradiction, entre les
informations fournies aux uns et aux autres parce qu’elles ne sont pas fondées sur la même « logique » et
parce qu’elles relèvent, par nature, de modèles différents de la relation pédagogique.
Si, d’autre part, on retient la définition de l’évaluation proposée par G. de LANDSHEERE 2
« Estimation par une note d’une modalité ou d’un critère considéré dans un comportement ou un
produit. »
on est conduit à valider l’acception la plus triviale du terme, celle qui structure la représentation la plus
largement partagée sur sa nature, mais aussi certainement la plus réductrice : évaluer, c’est toujours et
principalement donner une note 3. Cette définition s’accorde avec le troisième but de l’évaluation défini par J.
CARDINET ; elle n’est pas pertinente pour les autres.
Dans le même article, G. de LANDSHEERE, citant N.E. GRONLUND, précise toutefois que l’évaluation
« ... comprend à la fois la description qualitative et la description quantitative des comportements
et comporte, en outre, des jugements de valeur concernant leur désirabilité. »
Il est là question de tout autre chose que d’une note qui « mesure » un comportement ou un produit, et c’est
en cela que réside toute la difficulté, mais aussi toute l’ambiguïté de l’évaluation.
Qu’est-ce qu’évaluer ?
Il est certainement utile, pour répondre à cette question, de reprendre la distinction opérée par N. CHOMSKY
entre compétence et performance.
La compétence d’un élève, si on la rapporte à l’évaluation de ses comportements et de ses productions,
représente l’ensemble de ce qu’il est capable, potentiellement, d’accomplir. Sa performance représente, elle,
l’actualisation partielle de sa compétence, dans un contexte et une production définis. Évaluer consistera donc
à juger de la compétence d’un élève à travers sa performance, à extrapoler sa compétence à partir de
comportements observables et/ou d’un produit réalisé. Y. ABERNOT 4, faisant également référence à
CHOMSKY, note que
« ... l’évaluation est une tentative d’appréhension de la compétence sur un tout à partir d’une
performance sur une partie. »
Un modèle de l’évaluation ( parmi d'autres ) 5
L’acte d’évaluation peut s’inscrire dans un triangle dont les sommets figurent les trois pôles entre lesquels
s’affrontent le plus souvent les différentes conceptions, les différentes pratiques de l’évaluation.
Le RÉSULTAT de l’apprentissage est un produit ou un comportement qui montre ce que l’apprenant sait et sait
faire au moment et dans les conditions où il est évalué. Il est, le plus souvent, un indicateur des
apprentissages réalisés. Le jugement émis par l’évaluateur porte principalement sur la présence et la maîtrise
de savoirs et de compétences et l’information évaluative produite sur ce résultat est de l’ordre de la réussite ou
de la non-réussite en fonction des critères retenus.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
2/19
02/02/2020
Evaluation
La VALEUR du résultat de l’apprentissage est la traduction de ce résultat en note dont l’ambition est de
s’inscrire dans un absolu étalonné : l’échelle de 0 à 20, ou toute autre échelle possible 6. L’information
évaluative ne dit plus rien du produit évalué, des savoirs et des savoir-faire maîtrisés ou non, elle renvoie un
jugement sur la qualité globale du travail accompli par l’élève. Donner une valeur au résultat d’un
apprentissage est d’ailleurs une nécessité pour informer tous ceux qui ne sont pas présents dans la situation
d’apprentissage ( parents, administration, société... ) et pour lesquels les informations sur la réussite ou la nonréussite des apprentissage ne sont pas des informations pertinentes, ou ne font pas partie d’un héritage
socioculturel profondément et encore durablement partagé.
Les ACTIVITÉS MENTALES qui permettent les apprentissages et donc la mise en oeuvre des connaissances et
des compétences forment le troisième pôle de cet ensemble. Il s’agit de tous les processus intellectuels,
cognitifs, sociocognitifs, culturels etc., qui, sans se manifester directement et de façon visible, sont pourtant
indispensables à la réussite d’une tâche. L’information évaluative consiste, dans ce cas, à faire l’hypothèse, à
partir du produit réalisé, de la mise en oeuvre d’opérations mentales dont seule la maîtrise permet d’atteindre
le résultat attendu. Le jugement de l’évaluateur porte alors sur la mobilisation par l’apprenant de stratégies et
de moyens d’apprentissage adaptés. La possibilité d’évaluer ces activités mentales, surtout celles de haut
niveau, passe, bien entendu, également par la mise à distance métacognitive qui en est l’instrument privilégié.
Nous sommes là de plain-pied dans le modèle de l’apprendre que propose J. BERBAUM 7 ainsi que dans ce que
VYGOTSKY appelle « conscience après » , retour réflexif sur les réussites et les non-réussites pour en analyser
les causes 8. Il est aisé de voir pourquoi ces trois pôles s’affrontent toujours dans la pratique de l’évaluation.
C’est qu’ils ne répondent ni au même but, ni aux mêmes modalités.
Le pôle ACTIVITÉ et le pôle RÉSULTAT sont en interaction parce que l’un dit toujours quelque chose de l’autre;
et surtout parce que si l’objectif premier de l’enseignement devient la maîtrise des savoirs et des compétences
relatifs aux différents domaines de connaissance, ainsi que leur transfert optimal dans de nouveaux domaines,
alors le resserrement des liens entre ces deux pôles est une nécessité. En effet, un même résultat peut être
obtenu par des stratégies différentes ( et c’est là le pari même de toute différenciation pédagogique ).
Par contre, il ne peut y avoir interaction entre le pôle RÉSULTAT et le pôle VALEUR puisqu’il s’agit d’une
traduction de l’un dans le code particulier de l’autre. Une fois un produit traduit en note, lorsque la note seule
est la trace des apprentissages, il n’est plus possible de se faire une idée exacte de ce qu’était ce produit, il
n’est plus possible d’y revenir. Seule subsiste la mesure.
Quant aux pôles VALEUR et ACTIVITÉS MENTALES, il est strictement impossible de les mettre en relation. Une
note ne peut donner d’indication sur des processus mentaux. Il est même possible, en forçant quelque peu le
trait, de considérer que certains résultats de moindre valeur peuvent être dus à la mobilisation par l’apprenant
de processus cognitifs de haut niveau ( et ce sont précisément ceux que l’enseignement devrait chercher à
développer ). En effet, il peut être plus facile de réussir une tâche en faisant appel à un apprentissage par
cœur, ou même à un conditionnement 9, plutôt que par la mise en oeuvre de stratégies et d’opérations
mentales plus élaborées mais actuellement moins maîtrisées. C’est d’ailleurs ce qui se passe lorsque ne sont
évalués que des savoirs déclaratifs que les élèves sont capables d’énoncer mais incapables d’utiliser.
Une typologie des évaluations
Il est d’usage, depuis quelques années déjà, de distinguer trois grands types d’évaluation : l’évaluation
formative, l’évaluation formatrice et l’évaluation sommative.
a- L’évaluation formative
« Évaluation intervenant, en principe, au terme de chaque tâche d’apprentissage et ayant pour
objet d’informer élève et maître du degré de maîtrise atteint et, éventuellement, de découvrir où
et en quoi un élève éprouve des difficultés d’apprentissage, en vue de lui proposer ou de lui faire
découvrir des stratégies qui lui permettent de progresser.»
G. de Landsheere 10
C’est un mode d’évaluation dont l’objectif principal est donc la régulation du processus d’apprentissage. Il s’agit
donc, essentiellement, d’un processus de rétroaction. En fournissant à l’apprenant, qui en est le principal
destinataire 11, des informations sur ses progrès par rapport à un objectif déterminé, elle permet
d’intervenir dans le processus d’apprentissage pour infléchir les modalités de l’action en
cours;
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
3/19
02/02/2020
Evaluation
de transformer les contenus d’apprentissage, de permettre à l’apprenant de transformer
ou de varier ses méthodes et ses stratégies d’apprentissage;
de décider des actions d’aide nécessaires ( soutien notionnel, aide méthodologique... ).
En ce sens, l’évaluation formative permet donc de remplir les deux premières fonctions assignées à l’évaluation
par J. CARDINET.
C’est également une évaluation qui permet à l’apprenant d’évaluer lui-même ce qu’il sait, ce qu’il ne sait pas,
ce qui fait qu’il ne réussit pas et, en ce sens, elle un chemin vers l’auto-évaluation.
Enfin, c’est un type d’évaluation qui permet de mettre en place une pédagogie de la réussite, source de
motivation.
Faut-il préciser que l’évaluation formative consiste à fournir des informations, des appréciations sur le travail,
les activités et les productions de l’apprenant ? Elle est irréductible donc à un résultat chiffré.
L’évaluation formative n’est pas, dans tous les cas, qu’une évaluation terminale, qui se situerait toujours après
une tâche; elle constitue également, par nature, une évaluation diagnostique ou une évaluation pronostique
qui peut donc intervenir en début de séquence d’apprentissage ou avant une séance de travail subordonnée à
un objectif spécifique.
Évaluation diagnostique, car elle permet alors de mettre en lumière les difficultés liées à l’apprentissage et
donne des indications sur les obstacles à surmonter; en ce sens elle est une évaluation qui sert à mettre en
place des activités propres à lever ces obstacles d’apprentissage. Comme le précise J. CARDINET 12.
« L’évaluation diagnostique porte [...] sur les acquisitions et les démarches, sur les aptitudes, sur
l’histoire et le contexte social de l’élève. Elle s’appuie sur une analyse de ses productions et sur
l’observation de son comportement pour formuler des hypothèses, et suggérer des remèdes. »
Évaluation pronostique, dans le sens où elle permet de déterminer si un élève maîtrise les pré-requis
nécessaires pour la poursuite des apprentissages prévus dans une séquence. Elle renvoie, alors, des
informations sur les apprentissages prioritaires à consolider, à s’approprier en vue de la réussite des
apprentissages ultérieurs.
b. L’évaluation formatrice
D’après C. HADJI 13, l’évaluation formatrice est une
« ... évaluation qui, en fonction de l’idée que seul l’élève peut vraiment réguler
d’apprentissage, et de la prise en compte de l’importance de la représentation
atteindre, vise l’appropriation par l’apprenant des critères de réalisation du
d’appréciation de la production, l’activité didactique se centrant pour cela sur
concrètes et non sur des objectifs formels. »
son activité
des buts à
produit et
des tâches
Ce type d’évaluation est, on le voit, essentiellement conçu comme un outil spécifique d’apprentissage qui a sa
place dans le processus même de l’apprentissage. Elle permet
le progrès vers l’expertise et l’autonomie de l’élève en le conviant à mettre
en oeuvre des procédures métacognitives à chaque moment de son
apprentissage;
l’émergence de représentations cohérentes nécessaires à la maîtrise :
représentation du produit, représentation de la tâche, représentation des
buts...;
l’implication active de l’élève dans le processus d’apprentissage qui donne du
sens à l’action.
L’évaluation formatrice est donc le vecteur d’une réelle appropriation des savoirs et des savoir-faire.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
4/19
02/02/2020
Evaluation
c. L’évaluation sommative
L’accent, ici, est mis sur la notion de produit de l’activité d’un élève. Son destinataire est prioritairement
l’institution scolaire et la société. L’objectif principal de l’évaluation sommative est un objectif de certification.
En effet, elle permet
de fournir un bilan qui situe l’apprenant par rapport à une norme ou à des
critères établis;
de prendre des décisions de type institutionnel, obtention d’un diplôme,
passage dans une classe supérieure par exemple;
de situer les apprenants les uns par rapport aux autres, à l’intérieur d’un ou
de plusieurs groupes.
L’évaluation sommative, faisant la somme des apprentissages réalisés, se traduit le plus souvent dans une
note. J. CARDINET 14 note que l’évaluation sommative
« ... porte sur un objectif terminal, plutôt que sur des savoirs partiels : si l’on fait l’effort d’établir
un bilan, on voudrait qu’il renseigne sur quelque chose d’important et d’utile socialement [...].
Elle porte normalement sur des résultats acquis de façon relativement stable, car totaliser des
acquisitions qui s’oublieraient immédiatement n’aurait pas de sens. »
et il ajoute
« On tend souvent à confondre ces deux évaluations [formative et sommative], en parlant d’un
niveau global de compétences caractéristiques d’un bon ou d’un mauvais élève. Cependant, tant
que l’élève est encore en train d’apprendre, un bilan est prématuré. Pour prendre des décisions
d’ordre pédagogique, dans la pratique journalière de la classe, c’est une évaluation formative
dont on a besoin : il faut se garder de juger trop vite le niveau général de réussite d’un élève. »
Une recommandation à méditer, en tout cas, pour redonner à l’évaluation sommative sa véritable fonction :
faire le bilan des apprentissages appropriés et consolidés.
Ailleurs, il distingue l’évaluation sommative externe de l’évaluation sommative interne. La première
« juge le résultat social de l’enseignement. [...] elle certifie que le but final de la formation a été
atteint, donc que les élèves ont acquis les compétences dont la société a besoin. [Elle] contrôle la
maîtrise de situations réelles, et donc extérieures à l’école. » 15
La seconde
« juge les savoirs et les savoir-faire scolaires. [...] Elle ne prépare pas directement à la vie active.
C’est pourquoi les examens scolaires se centrent presque exclusivement sur les disciplines
enseignées, conçues comme des outils indispensables pour des formations ultérieures. » 16
Deux modalités d’évaluation
Une évaluation, formative ou sommative, peut être conçue selon deux modalités : une évaluation qui compare
les élèves les uns aux autres, dans le groupe classe ou entre des groupes de même niveau, et une évaluation
qui permet de certifier ce que les élèves peuvent faire et ne peuvent pas faire, indépendamment les uns des
autres, en rapportant cette certification à un ensembles de critères prédéfinis.
On parlera, dans le premier cas, d’évaluation normative, et, dans le second, d’évaluation critérielle 17.
a- L’évaluation normative
L’évaluation normative permet
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
5/19
02/02/2020
Evaluation
« ... de situer un individu par rapport à une norme, constituée par les performances d’un groupe
de référence.» G. de Landsheere 18
Elle traduit donc les résultats d’un apprentissage, le produit d’une tâche, en termes de comparaison avec les
résultats des autres élèves de la classe voire avec des élèves appartenant à d’autres groupes de même niveau.
Elle permet ainsi de situer chaque élève par rapport à la moyenne de son groupe; c’est cette moyenne qui
représente la norme du groupe en question.
Il est capital de bien comprendre que ce n’est pas par rapport à une moyenne absolue qu’on classe les élèves.
En effet, la moyenne normative est toujours fonction du niveau d’un groupe de référence donné parce que,
lors de l’élaboration de l’épreuve d’évaluation, il est nécessaire d’insérer des questions faciles, des questions de
difficulté moyenne et des questions difficiles dans le but de discriminer les élèves les uns par rapport aux
autres.
A l’occasion d’une évaluation normative, les élèves sont classés du plus fort au plus faible parce que l’épreuve a
été construite dans ce sens; on prend essentiellement en compte l’écart de la moyenne de chacun par rapport
à la moyenne du groupe dont il fait partie; on fait en sorte que la distribution des élèves s’opère selon une
courbe en cloche (cf. figure) - c’est là d’ailleurs l’indicateur de la validité de ce type d’évaluation.
Ainsi, dans l’idéal, les élèves devraient se répartir selon cette distribution « normale » définie par G. de
LANDSHEERE 19
« Distribution symétrique de notes par rapport à la moyenne, les notes se raréfiant à mesure que
l’on s’en éloigne, selon une équation mathématique (fonction de Laplace-Gauss). La
représentation graphique de cette distribution revêt la forme d’une courbe en cloche, appelée
courbe de Laplace-Gauss. »
Un écart-type, noté s ( sigma ), permet de mesurer la dispersion de la série des notes. Il se calcule selon la
formule 20
où
ni est le nombre d’apparition de chaque note
xi représente chaque note de l’échelle choisie
m est la moyenne des notes données
N est le nombre total des copies corrigées
Si cet écart-type est d’environ 2,5, la distribution des notes est alors dite " normale " et les élèves sont
distribués sur la courbe de la façon suivante :
99 % obtiennent une note comprise entre 4 et 17;
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
6/19
02/02/2020
Evaluation
95 % une note de 7 à 14;
68 % une note entre 9 et 12.
Enfin, comme le souligne C. HADJI 21
« ... la norme est, d’un côté, purement descriptive, puisque ce sont des performances réelles qui
la définissent. On s’y réfère bien, toutefois, pour formuler un jugement de valeur, dans la mesure
où la possibilité donnée de situer une performance par comparaison n’est utilisée que pour
apprécier celle-ci. Au-delà du constat, c’est la prise de conscience de la valeur de la place
occupée qui importe. Les "réponses" de l’auteur de la performance sont bien "jugées" par
comparaison avec celles du groupe de référence. L’usage du terme de norme est, certes, très
ambigu, sinon "regrettable" comme le dit G. de Landsheere. »
L’évaluation normative trouve également sa place dans des dispositifs pédagogiques différenciés. Dans ce cas
cependant, elle se présente de façon quelque peu différente : l’objectif n’est plus de distribuer les élèves dans
une perspective de classement les uns par rapport aux autres, mais bien d’assurer la progression de tous vers
les objectifs retenus, en donnant notamment à chacun tous les moyens ( temps, aide notionnelle et
méthodologique... ) d’atteindre un niveau optimal de progrès.
Ce qu’évalue alors une telle épreuve normative c’est la quantité des progrès, bien sûr, c’est-à-dire les différents
apprentissages réalisés, mais surtout la qualité de la progression vers un objectif déterminé. On pourrait
penser qu’il s’agit là pratiquement d’une évaluation de type formatif, à cette exception près que l’épreuve est
sommative, non critérielle, parce que chaque élève est évalué en fonction de son point de départ dans la
séquence d’apprentissage, en vertu de l’évaluation initiale réalisée. La courbe des notes devrait se rapprocher
dans ce cas d’une courbe en " J ".
« Alors que la courbe de Gauss est sous-tendue par une logique de discrimination, la courbe en J
s’inscrit dans une logique d’homogénéisation. » B. Maccario 22
b- L’évaluation critérielle
L’évaluation critérielle vérifie les performances d’un élève en fonction d’un ensemble de compétences ( savoirs,
savoir-faire, savoir-être ) constituées en critères par rapport à un modèle défini par avance. Dans
l’enseignement technique par exemple, les référentiels de diplômes sont ces modèles, à un niveau donné et
pour une formation donnée.
R. Glaser, cité par V. de Landsheere 23, précise
« Comme les tests critériels sont spécialement conçus pour fournir une information ( directement
interprétable ) sur les niveaux de performance, ces niveaux doivent être définis avant de
construire le tes. Le but du testing est d’évaluer la position de chaque individu par rapport à ces
niveaux. »
Contrairement à l’évaluation normative, la démarche critérielle ne situe pas les élèves les uns par rapport aux
autres; ce qui est pris en compte, c’est l’écart des performances ( que ce soit en plus ou en moins ) par rapport
à une sorte de « capital-cible » , pour reprendre l’expression de V. de Landsheere 24. Le but poursuivi est, bien
entendu, 100 % de réussite.
Il n’y a pas de questions trop faciles ou de questions plus difficiles puisqu’il n’est pas question d’aboutir à un
classement des élèves sur une échelle ordinale. Les tâches proposées permettent d’évaluer à quel point
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
7/19
02/02/2020
Evaluation
« d’un continuum dans l’acquisition de la connaissance, allant de l’absence totale de compétence
à la performance parfaite » 25
se situe un élève.
Évaluer des compétences en situation
Une tâche inscrite dans une situation réelle donnée, aussi proche que possible d’une situation sociale ou
professionnelle, est particulièrement complexe à évaluer. On se trouve, en effet, sur un terrain où les facteurs
cognitifs, affectifs, conatifs et gestuels sont massivement présents et où ils interagissent constamment. Dans
des situations de ce type, les connaissances et les savoirs ( facteur cognitif ), les actions ( facteur gestuel ), les
comportements ( facteur conatif ) et les émotions ( facteur affectif ) sont intimement liés.
Si l’évaluation a lieu en cours de formation ( évaluation formative critérielle ), certaines compétences sont déjà
acquises antérieurement à la tâche, on peut alors évaluer leur degré de transfert si la tâche s’inscrit dans une
situation nouvelle par rapport à la situation d’apprentissage. Si ce n’est pas le cas, on évaluera leur degré de
réinvestissement.
D’autres ont fait l’objet des apprentissages visés en cours de séquence. Ce sont ces compétences qui seront
évaluées prioritairement, mais sans négliger leurs relations avec les autres paramètres de la situation. Les
critères de performance retenus pour l’évaluation devront prendre en compte le caractère facilitateur ou non
des autres compétences mises en oeuvre dans la situation.
Certaines, enfin, ne sont pas évaluées parce qu’elles n’ont pas fait l’objet d’apprentissages spécifiques. Il faut
veiller alors à ce que la non-maîtrise de ces compétences-là ne rendent pas la tâche impossible ou
problématique. Au contraire, les situations scolaires plus traditionnelles ne font intervenir, le plus souvent, que
les dimensions cognitives ( connaissances sur les objets, surtout ) et gestuelles. Qui plus est, elles tendent à
présenter ces compétences de manière unidimensionnelle en éliminant, souvent implicitement, la complexité
des situations : évaluer une compétence telle que « décoder un message écrit » en la coupant de toute
situation sociale ou professionnelle, la réduit à une activité « simple », facilement évaluable certes, mais
considérablement appauvrie, sans enjeu réel. La même compétence, en situation, se conjugue avec un
faisceau d’autres compétences qui lui sont irréductiblement liées; elle est plus difficile à maîtriser parce que
d’autres compétences, de nature différente, interagissent avec elle; il est donc plus difficile de l’évaluer parce
qu’il faut considérer en même temps les autres facteurs, les autres types de compétences à maîtriser et leurs
relations; cela rend bien plus complexe la définition des critères de performance.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
8/19
02/02/2020
Evaluation
V. de Landsheere 26 distingue quatre composantes principales de l’évaluation des compétences :
le produit ( la compétence );
les indicateurs de la présence de la compétence 27;
les instruments de mesure adéquats;
le niveau requis.
Si la compétence à évaluer est une connaissance, déclarative ou procédurale, alors les indicateurs de sa
présence sont des énoncés déclaratifs : connaissance, savoir-dire et savoir sur un savoir-faire. Ainsi, énoncer
de façon correcte le théorème de Pythagore est un savoir-dire une connaissance. Expliquer la méthode de
calcul de l’hypoténuse d’un triangle rectangle est un savoir sur un savoir-faire associé à des savoir-dire des
connaissances ( concept de rectangle, angle droit, notion de carré... ).
Lorsque la compétence à évaluer est un savoir-faire, les indicateurs sont alors des actions, celles qui sont
nécessaires, selon des stratégies et des méthodes imposées ou propres à l’élève, pour réussir la tâche fixée. Si
ce qui importe, c’est la réussite de la tâche, seule l’observation de l’activité de l’élève permettra une évaluation
cohérente. L’apprentissage se fait pendant l’action, l’évaluation également; mais bien entendu pas au même
moment ou à l’occasion de la même tâche. Pour évaluer ces savoir-faire, il faudrait aller, avec P. MENDELSOHN
28, jusqu’à faire l’éloge du « bricolage » :
« Bien que formés à raisonner à l’aide d’outils formels puissants, il faut bien reconnaître qu’il nous
arrive souvent de bricoler des solutions ad hoc dans les situations de la vie quotidienne comme
dans la vie professionnelle. Pour cela, nous utilisons les outils qui sont à la portée de notre main (
artefacts ), outils beaucoup plus rudimentaires mais souvent tout aussi efficaces que les modèles
formels et abstraits. »
On peut évaluer le savoir-faire d’un élève dans le domaine de la formation des adverbes à partir des adjectifs
en observant ses actions, ses méthodes, ses stratégies à l’occasion d’une tâche qui nécessite, entre autres, la
mise en oeuvre de cette compétence.
Si l’évaluation porte sur un savoir-être, une attitude, alors l’indicateur de la présence d’une telle compétence
doit être un comportement, habituel ou non. Ainsi, dans le travail d’un groupe, pourra-t-on évaluer les
attitudes, positives ou négatives, d’un élève dans les différents domaines du travail de ce groupe : recherche
d’information, interactions dans la poursuite de la tâche, régulation des activités et de la vie du groupe...
Critérier l’évaluation des compétences
Les critères à retenir pour l’évaluation des compétences, pour être pertinents, doivent distinguer ceux qui sont
orientés vers le but de la tâche, notamment dans sa dimension pragmatique, ceux qui sont orientés vers
l’action, les processus d’accomplissement de la tâche par exemple et ceux qui sont orientés vers le produit de
l’activité. Les critères orientés vers les buts sont ceux qui permettent d’évaluer l’adéquation de la performance
réalisée par un élève aux finalités, buts et objectifs généraux de la formation. Ils évaluent également
l’adéquation et la cohérence du produit de l’activité de l’élève par rapport à des normes, sociales ou
professionnelles ( intelligibilité, acceptabilité, fonctionnalité du produit ). En ce sens, il peut y avoir maîtrise
complète ou seulement partielle du faisceau de compétences ( capacité 1 ) considéré pour l’accomplissement
de la tâche proposée ou encore absence totale de maîtrise.
Les critères orientés vers l’action permettent d’évaluer les processus mis en oeuvre dans l’exécution d’une
tâche : choix de techniques, de méthodes; choix d’opérations, d’outils; mobilisation de savoirs; décentration
métacognitive et ajustements; durée impartie... Ces critères sont centrés sur les objectifs spécifiques de la
formation et plus particulièrement sur les compétences spécifiques à mobiliser pour la réussite de la tâche
proposée. Il n’y a, le plus généralement, que deux possibilités d’accomplissement : réussite ou non-réussite,
cohérence ou incohérence, validité ou non-validité.
Les critères orientés vers le produit l’évaluent en tant que tel, indépendamment de sa portée pragmatique et
des processus et conditions de sa réalisation. L’évaluation porte donc sur la forme et le contenu du produit :
esthétique, correction, exactitude...
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
9/19
02/02/2020
Evaluation
Pour illustrer ce propos, prenons l’exemple d’une tâche en situation : prendre la parole, de façon adaptée en
termes de forme et de contenu, lors d’une réunion de travail.
Deux critères principaux, orientés tout à la fois vers les buts, l’action et vers le produit, peuvent être retenus :
l’intelligibilité du message ( forme : phonologie et syntaxe );
l’acceptabilité de ce message ( contenu sémantique et pragmatique ).
Les compétences spécifiques à maîtriser relèvent des différentes composantes d’un tâche : cognitives,
conatives, affectives, gestuelles. On voit bien quelles seront les compétences à évaluer :
Composantes cognitives ( savoirs )
connaissances sur ce qu’est la situation réunion de travail : ses enjeux,
ses formes, ses modalités...
connaissances sur l’action : prendre la parole pour exposer, expliquer,
argumenter, réfuter...
connaissances sur les objets : thème de la réunion, informations et
données pertinentes, matériel...
Composantes conatives ( savoir-être )
comportements à adopter dans cette situation : attitudes, nature des
interactions verbales...
habitudes à maîtriser : posturales, verbales...
Composantes affectives ( savoir-être )
émotions : maîtrise...
jugements : pertinence, effets...
Composantes gestuelles ( savoir-faire)
demander / prendre la parole
expliquer, illustrer, argumenter, réfuter...
utiliser les différents outils de communication : voix, gestes, matériel
audio-visuel...
Toutes ces compétences n’ont pas le même statut. Certaines sont des compétences « globales » qui assurent
l’essentiel de ce qui doit être maîtrisé : la pertinence sémantique et la cohérence pragmatique du discours
produit. D’autres, plus "locales", facilitent, améliorent certes la pertinence et la cohérence du discours mais
sans toujours le rendre inacceptable si elles ne sont pas maîtrisées. Ainsi en est-il, par exemple, de certaines
caractéristiques syntaxiques qui peuvent rendre un discours formellement incorrect sans pour autant altérer sa
portée sémantico-pragmatique : le destinataire perçoit le sens et l’intention du propos. La non-réussite formelle
( syntaxe fautive 29 ) n’est pas un critère de non-réussite par rapport au but de la tâche. On pourra cependant
évaluer la tâche comme partiellement réussie puisque certaines compétences caractéristiques ne sont pas
maîtrisées. Pour évaluer toutes ces compétences, constituées en critères, la prise en compte du seul produit ne
suffit pas; il faut également élaborer des instruments d’observation de l’activité de l’élève, des processus qu’il
met en oeuvre tant dans ses stratégies que dans ses méthodes de résolution.
Séquence d’apprentissage : quand évaluer ?
a- Les moments de l’évaluation
Comme le montre la figure, les moments de l’évaluation sont très fréquents en cours de séquence
d’apprentissage. Ils ouvrent et ferment toute séance de travail. Il est même pratiquement impossible, dans des
conditions habituelles, de les observer tous, surtout si l’on y intègre ceux nécessaires à l’évaluation des tâches
et activités de consolidation, d’approfondissement, de soutien ou de remédiation qui ne figurent pas sur ce
schéma.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
10/19
02/02/2020
Evaluation
Quelques-uns de ces moments, toutefois, doivent absolument être respectés; ainsi, il n’est pas possible de faire
l’économie des différentes évaluations formatives, pronostiques ou diagnostiques, qui interviennent en fin de
séance de travail parce qu’elles sont les indicateurs principaux des apprentissages réalisés ou à réaliser. C’est
en fonction des résultats à ces évaluations que le professeur pourra décider des activités à proposer à un élève
: consolidation des apprentissages, soutien - notionnel ou méthodologique -, remédiation.
Dans ce cas, l’objet de l’évaluation se confond avec les activités d’apprentissage définis pour cette séance. La
tâche définie dans l’objectif spécifique de la séance doit, en effet, permettre à l’élève de mettre en oeuvre des
compétences diverses. Ni les activités de réinvestissement, ni celles qui ne font pas l’objet de l’apprentissage
spécifique ne devraient être évaluées, si ce n’est les premières parfois, de façon sommative. Mais cela multiplie
les critères d’évaluation, de même que les instruments d’évaluation. Il est donc plus sage de limiter, dans la
plupart des cas, l’évaluation formative aux apprentissages réalisés à l’occasion de la tâche proposée.
Quant à l’évaluation sommative, il faut insister sur le fait qu’elle n’est possible que pour évaluer des
apprentissages consolidés :
« Elle porte normalement sur des résultats acquis de façon relativement stable, car totaliser des
acquisitions qui s’oublieraient immédiatement n’aurait pas de sens. » J. Cardinet 30
Elle devrait donc n’intervenir qu’en fin de séquence, éventuellement avec un temps de latence permettant un
réel apprentissage. Bien entendu, cela remet en cause une pratique courante dans l’institution scolaire : la
multiplication des notes et des relevés de notes comme indicateur du travail accompli par un élève 31. Tout le
monde - parents, élèves, enseignants et administration scolaire - semble investir les notes d’une fonction
certainement excessive :
« Un enfant qui « n’apporte » pas beaucoup de notes avec une périodicité régulière devient un
enfant qui n’apprend rien, de même les enseignants seront jugés à la quantité de notes remises
[...] Ainsi les parents exercent fréquemment sur l’institution scolaire une réelle pression pour que
le système de notes, parfois celui du classement, soit valorisé. » C. Delorme 32
La pratique des différentes formes d’évaluation, au début, pendant et à la fin des apprentissage devrait
conduire à relativiser l’importance de notes trop fréquentes, en ce sens qu’elles n’auraient, dans ce contexte,
que peu de pertinence. Mieux vaut, certainement, n’obtenir qu’une seule note, à l’issue d’une séquence
d’apprentissage, mais qui fasse réellement la « somme » des apprentissages réalisés et consolidés. C’est
d’ailleurs ce que préconisent, à la suite de B.S. BLOOM, les théoriciens de la pédagogie de maîtrise 33 :
« A la fin de la séquence des unités d’enseignement ( ou à une échéance fixée par l’institution,
par ex., fin de trimestre ), les résultats des élèves sont évalués par une épreuve sommative à
référence critérielle. Si les procédés d’évaluation formative et de remédiation ont bien fonctionné
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
11/19
02/02/2020
Evaluation
tout au long de la séquence, un pourcentage très élevé d’élèves ( 80%, voire 90% ) devrait
atteindre les critères de maîtrise fixés pour l’épreuve sommative. »
b- Apprentissages et évaluation
« ... la fonction remplie par l’école est [...] celle d’une présentation des savoirs, immédiatement
suivie de leur évaluation. Mais entre les deux, le temps essentiel de l’appropriation se trouve
comme escamoté, laminé. » 34
Sans vouloir forcer le trait, on ne peut nier que le propos de J.-P. ASTOLFI corresponde à une réalité trop
fréquente. Il pose de façon aiguë la question de ce qui est exactement évalué lorsqu’un temps trop court
sépare le moment de la présentation des savoirs, souvent abusivement tenu comme un moment
d’apprentissage, et celui de l’évaluation, qu’elle soit formative ou sommative d’ailleurs.
Une séance d’apprentissage est un moment de contact de l’élève avec un objet d’apprentissage, parfois de
premier contact. Il est rare qu’elle soit également un moment d’appropriation, tout simplement parce que celleci nécessite, outre l’acquisition des savoirs, leur consolidation et leur assimilation. Et seuls le temps et l’exercice
le permettent. Il en résulte, qu’à suivre de trop près le repérage 35 des objets d’apprentissage proposés,
l’évaluation court le risque de se tromper de cible. J.-P. ASTOLFI 36 note fort justement que
« Lorsque, après une leçon qui porte sur une notion nouvelle, suivie de deux ou trois exercices
d’application, l’enseignant décide d’une évaluation notée, il ne se rend pas compte que, au moins
pour une fraction de la classe, ce moment, dit d’évaluation, est souvent le premier où les élèves
sont vraiment... en situation d’apprentissage; autrement dit le premier où ils ont à mobiliser de
façon personnelle, des connaissances qui ne leur ont été antérieurement que présentées. »
On n’évalue donc que la capacité d’attention de l’élève, l’efficacité de sa mémoire immédiate, le poids relatif du
conflit entre ses représentations spontanées et ses représentations « apprises », ou tout autre facteur de ce
type. Il semble, par conséquent, nécessaire de différer le moment de l’évaluation pour lui assurer une validité
et une cohérence suffisantes.
Dans ce sens, il faudrait être plus que circonspect face à des pratiques comme celles du contrôle en cours de
formation qui, souvent, consiste à évaluer ( de façon sommative ) des apprentissages maîtrisés, certes, mais
insuffisamment ou momentanément, parce que l’évaluation intervient trop tôt dans le processus d’assimilation.
Des outils pour l’évaluation
Certains outils sont plus adaptées que d’autres à l’évaluation de certaines capacités ou compétences. Celles-ci
ne peuvent être appréhendées qu’à travers une performance de l’élève. Il faut, par conséquent adapter la
forme de la performance à la compétence à évaluer. Comme le souligne Y. Abernot 37
« La performance doit [...] porter sur un contenu représentatif de la compétence, mais aussi être
produite sous une forme permettant de l’apprécier. Il suffit de proposer sur le même sujet un
Q.C.M. ( questionnaire à choix multiple ) et un sujet de synthèse pour apprécier l’importance de
la forme de l’évaluation sur le résultat. »
Bien entendu, les outils d’évaluation seront très largement déterminés par les objectifs, mais il est possible,
suivant en cela l’exemple d’Y. Abernot, de mettre en relation ces outils et la taxonomie du domaine cognitif
proposée par B.S. Bloom. Les outils d’évaluation les plus fermés sont parfaitement adaptés à des objectifs dont
le niveau d’exigence les situe sur les premiers degrés de cette taxonomie, alors qu’aux niveaux les plus élevés
correspondent des outils plus ouverts. En utilisant la terminologie de J.P. Guilford 38, on peut estimer que les
outils d’évaluation fermés font prioritairement appel à la pensée convergente, alors que les outils ouverts sont
dédiés à la pensée divergente. Un tableau permet de donner une idée précise de ces correspondances; il faut
toutefois ajouter qu’il n’a qu’une valeur indicative : en effet, une catégorie d’objectifs, à un niveau d’exigence
déterminé, peut être évalué à l’aide de plusieurs types d’outils voisins.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
12/19
02/02/2020
Evaluation
Les outils fermés, ceux dont les réponses peuvent généralement s’apprécier en juste ou faux, sont nombreux.
Leur degré d’ouverture peut être modulé en fonction des compétences à évaluer et du type d’évaluation (
formative / sommative, normative / critérielle ) qu’on veut pratiquer 39.
Q.C.M.
questionnaire à choix multiple; Il s’adapte
idéalement au contrôle d’une connaissance,
d’un savoir sur un savoir-faire. Complexité,
difficulté des items sont variables.
Tableau
de
production à double
entrée
il s’agit, pour l’élève de proposer lui-même une
réponse. C’est là que débutent les difficultés
d’évaluation parce que des éléments parasites
à la compétence évaluée peuvent interférer :
dysorthographie, synonymie, réponse correcte
mais non attendue etc.
Question
le niveau d’exigence peut varier selon qu’il
s’agit de reproduire un savoir ou d’appliquer
une règle, une formule etc.
Texte lacunaire
il permet de vérifier des connaissances et leur
application dans un contexte particulier.
Test de closure
c’est un texte à trous qui permet de mesurer la
capacité de compréhension d’un élève et
d’application d’une notion particulière.
Questionnaire
à
réponses
ouvertes
courtes
forme et contenu de la réponse sont libres
mais il n’est pas nécessaire de développer la
réponse : donner une définition par exemple.
Texte induit
il s’agit, pour l’élève de rédiger un texte à
partir d’une liste de notions. Le degré
d’ouverture de cet outil est très variable; il se
situe, en fait, à la charnière des outils fermés
et des outils ouverts.
Les outils d’évaluation ouverts requièrent de l’élève une plus grande maîtrise; ils mettent en oeuvre des
compétences de plus haut niveau et supposent la maîtrise d’un faisceau de plus en plus large de compétences.
Problème
il requiert une plus grande autonomie de l’élève dans la
mesure où, après avoir analysé la situation, il doit choisir
lui-même les savoirs et les savoir-faire à mobiliser,
contrairement à l’exercice d’application d’une règle
donnée.
Dissertation
on peut regrouper sous ce terme générique tous les
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
13/19
02/02/2020
Evaluation
travaux pour lesquels l’élève doit mobiliser un grand
nombre de savoirs et de compétences dans une
production dont il est entièrement libre de définir la forme
( dans certaines limites cependant ) et le contenu.
Difficilement évaluable de façon objective, une telle
production fait également intervenir des paramètres
d’évaluation qui ne sont pas toujours bien définis.
Création
l’élève est entièrement libre quant au choix, à la forme,
au contenu de son travail. Des facteurs comme les
moyens utilisés, le temps imparti sont difficilement
prévisibles. C’est la forme la plus ouverte d’épreuve, la
plus difficile à juger également.
Ces outils sont parmi ceux qui sont le plus fréquemment utilisés, cela ne limite en rien la possibilité d’en
imaginer d’autres. En ce domaine, tout dépend des compétences à évaluer, et les seuls outils pertinents sont
ceux qui permettent d’évaluer avec le plus de précision et de la manière la plus fiable les compétences
souhaitées.
Parallèlement à ces outils d’évaluation, Y. ABERNOT 40 présente deux autres instrument, précieux pour le
professeur, qui pourront efficacement le guider dans la mise en place d’un enseignement différencié : la
matrice d’objectifs et le tableau des systèmes d’erreurs de l’élève.
Une matrice brute d’objectifs permet de visualiser le déroulement d’une séquence d’apprentissage en
fournissant au professeur une double information : le pourcentage des réussites par objectif et une
visualisation du parcours de chaque élève dans la séquence. Le pourcentage de réussites par objectif permet
d’évaluer leur pertinence par rapport au niveau de compétences de la classe. Ainsi, dans une perspective de
pédagogie de maîtrise, des réussites inférieures à 80 % doivent alerter le professeur sur la difficulté excessive
de l’objectif considéré; cela devrait lui permettre de proposer aux élèves, dans les séances de travail suivantes,
des activités d’application adaptées aux réussites et non-réussites constatées. La matrice permet également de
suivre le parcours individuel d’un élève et de voir où se situent les points de rupture dans la progression vers
l’objectif général de la séquence.
Une matrice ordonnée permet de constater les compétences acquises par la majorité des élèves ( à gauche ) et
les élèves ayant maîtrisé le plus de compétences ( de haut en bas ).
Le tableau des système d’erreurs est un autre outil d’évaluation et de régulation intéressant à utiliser dans la
perspective d’une évaluation formative différenciée. Il exige une réflexion didactique pertinente sur les
difficultés d’apprentissage d’une notion ou d’une compétence et permet, à cette condition, de repérer, au fil
des travaux des élèves et des évaluations réalisées, les erreurs les plus systématiques. Le tableau recense
toutes les difficultés d’apprentissage probables qu’un élève peut rencontrer dans l’exécution d’une tâche :
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
14/19
02/02/2020
Evaluation
difficultés liées aux représentations initiales, au produit demandé, aux savoirs et savoir-faire à mobiliser etc. Il
fournit ainsi un « programme » de travail différencié en vue de surmonter ces obstacles.
Dans l’exemple choisi, le système d’erreurs s’articule autour de la notion de récit. La tâche demandée consiste
à produire une séquence narrative. La typologie des erreurs retenue ne concerne que le texte narratif et ses
marques constitutives; d’autres erreurs ne sont pas prises en compte : lexique, syntaxe, orthographe... Elles
peuvent faire l’objet d’un autre tableau qui regroupe les erreurs relatives à l’écriture d’un texte, quelle que soit
sa nature.
L’utilisation de ce tableau fait apparaître les erreurs récurrentes de l’élève et fournit donc au professeur un
indicateur précieux qui lui permettra de proposer des travaux de remédiation appropriés : il apparaît, dans cet
exemple - fictif, bien entendu, que la récurrence des erreurs dans l’utilisation du passé-simple ou celles
relevant de la structuration du texte nécessitent de travailler plus particulièrement ces points en proposant à
l’élève des activités qui tiennent compte également de la cause de ces erreurs.
Les difficultés de l’évaluation
Il n’est peut-être pas inutile de terminer en rappelant quelques problèmes, souvent évoqués, liés à l’évaluation
du travail des élèves.
a- Fidélité
La fidélité de l’évaluation est très fréquemment remise en question. En effet, c’est un lieu commun de signaler
que les enseignants ne formulent pas les mêmes jugements devant le même produit à évaluer. Ainsi, F. Viallet
et P. Maisonneuve 41 notent que
« [...] pour obtenir la "vraie note" d’une copie, il a été calculé que le nombre d’évaluateurs
nécessaires était, pour chaque matière, le suivant : [...]
468 évaluateurs en français,
168 évaluateurs en anglais,
78 évaluateurs en mathématiques,
762 évaluateurs en philosophie,
95 évaluateurs en physique,
autrement dit, qu’il fallait faire les moyennes de 468, [168, 78...] notes d’une même copie pour
obtenir une note quasi indiscutable. »
Il faut ajouter que, dès que l’on veut évaluer des attitudes par exemple 42, la subjectivité de l’évaluation et les
jugements de valeur propres à l’évaluateur interviennent de façon plus importante encore.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
15/19
02/02/2020
Evaluation
De même, tous les évaluateurs n’utilisent pas l’échelle d’évaluation dont ils disposent de manière identique.
Certains l’utilisent dans sa totalité, de 0 à 20; d’autres la restreignent, n’allant pratiquement jamais en-deçà de
5 ou au-delà de 15. L’écart-type n’est donc pas le même selon les évaluateurs: certains, en ne donnant que
des notes moyennes le restreignent; d’autres, au contraire, en accordant des notes extrêmes, obtiennent un
écart-type plus important.
On peut toutefois observer, avec Y. Abernot 43, que
« D’une manière générale, les matières les plus normées (dictées, exercices de mathématiques)
et les outils les plus fermés (questionnaire à choix multiples) donnent lieu à une fidélité meilleure
et à une utilisation plus large de l’échelle de notes (on peut atteindre 0 ou 20). En revanche, en
dissertation, version, travaux de synthèse, c’est plus rare. »
b- Validité
Le problème de la validité de l’évaluation est l’un des plus épineux qui soit.
« Non seulement un test valide doit mesurer ce qu’il prétend mesurer, mais, en outre, il ne doit
pas mesurer quelque chose d’autre. » G. de Landsheere 44
Or des " variables parasites " 45 viennent presque toujours interférer dans les pratiques d’évaluation.
Quelques-unes de ces variables sont bien connues :
le favoritisme
(
ou
son
contraire )
les élèves qui renvoient une image gratifiante au
professeur sont surévalués, les autres souvent
défavorisés;
l’effet d’ancre
une copie est surévaluée lorsqu’elle est corrigée après
une mauvaise, et inversement;la fatigue : au fur et à
mesure des corrections, à cause de la fatigue du
correcteur, la moyenne des notes attribuées a tendance
à baisser, les écarts de notes entre copies sont plus
importants. Ce phénomène est particulièrement visible
dans les circonstances où un enseignant doit corriger
un grand nombre de copies ( plus de 30 ).
la stéréotypie
lorsqu’un enseignant a " établi " son jugement sur un
élève, il a tendance à se conformer à ce
jugement;l’effet de halo : la sympathie pour un
candidat, sa façon de s’habiller, de s’exprimer,
l’écriture, la présentation d’une copie etc., peuvent
influencer l’évaluateur.
D’autres variables encore peuvent entrer en ligne de compte lors d’une évaluation, celles qu’Y. Abernot appelle
les « variables choc » et les « variables de débordement ».
Les « variables choc » sont représentées par les éléments sur lesquels les enseignants sont intraitables, ce
qu’ils souhaitent rencontrer, ou au contraire ne jamais voir, dans une production d’élèves. Ces variables
peuvent donc être positives ( idée développée par l’élève et qui « plaît » tout particulièrement à l’enseignant )
ou négatives ( si tel ou tel élément, des abréviations par exemple, apparaît dans un devoir, l’enseignant refuse
de corriger ou note très sévèrement, en tout cas très en-dessous de la valeur « réelle » du travail fourni ).
Les « variables de débordement » sont celles qui sont prises en compte dès que leur nombre dépasse un
certain seuil, comme la goutte d’eau qui fait déborder le vase : la ponctuation, les accents, l’écriture... Si
certaines peuvent constituer, parfois, des critères d’évaluation, d’autres, en revanche, sont plus difficiles à
accepter comme tels. Faire entrer, dans une évaluation sommative des savoirs et des savoir-faire d’un élève,
des paramètres comme par exemple le délai de remise d’un travail ou encore le comportement de cet élève,
fausse tout particulièrement la validité de cette évaluation. Or beaucoup d’élèves en difficulté sont évalués sur
des paramètres qui ne recouvrent pas toujours leurs capacités effectives, tant il est vrai qu’ils cumulent les «
handicaps », cognitifs, procéduraux et comportementaux. A trop faire intervenir des variables de débordement,
on se prive des moyens d’assurer les conditions de la réussite.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
16/19
02/02/2020
Evaluation
c- Sensibilité
Une évaluation sensible doit être adaptée au produit à évaluer. Il n’est pas toujours nécessaire de noter un
travail de 0 à 20. Dans certains cas, une évaluation dichotomique est suffisante : réussi / non réussi; dans
d’autres, un élargissement de l’échelle d’évaluation peut être souhaitable : 40, 50... 100. C’est d’ailleurs ce qui
se passe lorsque l’échelle de 0 à 20 est subdivisée par ½ ou ¼ de point : d’une échelle à 21 degrés on passe
ainsi à une échelle à 81 degrés si les notes sont calculées au ¼ de point !
Si tous les problèmes évoqués - et ce sont loin d’être les seuls - peuvent donner à croire que les enseignants
évaluent « n’importe comment », il ne faut pas perdre de vue que la grande majorité ont le sentiment
d’évaluer honnêtement le travail de leurs élèves. L’évaluation est l’une des pratiques les plus sensibles du
métier d’enseignant, l’une des plus difficiles aussi. Et c’est malheureusement aussi celle pour laquelle ils sont le
moins préparés.
Mais, au fond, une des ambiguïtés principales de l’évaluation ne réside-t-elle pas surtout dans le fait que si on
sait assez souvent ce qui est évalué, on ne sait jamais avec précision qui est évalué?
« D’une manière générale, la note comporte toujours une auto-évaluation de l’enseignant. Ainsi
l’enseignant consciencieux ne peut que s’interroger sur l’adaptation de ses méthodes et du
contenu de son enseignement lorsque la majorité des notes est systématiquement inférieure à la
moyenne. Il ne sera pas le seul à s’interroger, car les notes sont aussi un indice de ce qui se
passe dans la classe et donne lieu à une évaluation extérieure. Les parents, l’administration
s’inquiéteront de notes systématiquement trop hautes ou trop basses. L’image que l’enseignant
veut se donner et donner aux autres est donc une variable parasite, sans rapport avec la qualité
des productions des élèves, mais qui institue la distribution normale des notes comme règle : peu
de très mauvaises notes, beaucoup de moyennes et peu d’excellentes. L’enseignant qui s’en
éloigne risque de se faire une réputation parfois injuste et toujours difficile à vivre. » Y. Abernot
46
- septembre 1996 -
NOTES
1 CARDINET, J. : (1988), Pour apprécier le travail des élèves, De Boeck, 2ème édition.
retour au texte
2 De LANDSHEERE, G. : (1992), Dictionnaire de l’évaluation et de la recherche en éducation, Presses
Universitaires de France, 2ème édition revue et augmentée.
retour au texte
3 On peut en voir une confirmation dans bien des remarques qui accompagnent les notes des élèves et
qui ne sont que redondance : ainsi il n’est pas rare que la note ou la moyenne de 10 soit assortie de la
remarque, pourtant inutile puisque la note apporte la même information, « élève moyen ».
retour au
texte
L’évaluation scolaire in J. Houssaye (ss la dir. de ), La pédagogie : une encyclopédie pour
aujourd’hui. Paris : ESF Editeur, 1993. retour au texte
4 Y. Abernot,
5 Le modèle présenté ici s’inspire très largement des idées développées par Goéry Delacôte dans un
ouvrage qui présente, entre autres, les thèses des tenants du courant contextualiste, en psychologie et
en pédagogie, dans les pays anglo-saxons ( situated cognition et situated learning ).
G. Delacôte,
. Paris : Editions Odile Jacob, 1996.
retour au
texte
Savoir apprendre, Les nouvelles méthodes
6 Une note de 0 à 20, une échelle réduite de 1 à 5, une échelle étendue par la prise en compte de ½ ou
de ¼ de points, des lettres A, B, C... etc.
retour au texte
Développer la capacité d’apprendre. Paris : ESF Éditeur, 1991. retour au texte
8 L.S. Vygotsky, Pensée et langage. Paris : Editions Sociales, 1985.
retour au texte
7 Jean Berbaum,
9 Exercice d’automatisation d’un savoir ( ex. apprentissage par coeur des tables de multiplication ), d’un
geste ( ex. tour de main professionnel ) ou d’une procédure ( ex. effectuer une règle de trois ). C’est ce
que les psychologues appellent un drill, par opposition à un skill, habileté centrée sur une tâche.
Cf. G. de Land-sheere,
, p. 84.
retour au texte
op. cit.
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
17/19
02/02/2020
10 G. de Landsheere,
op. cit., 1992, p. 125.
Evaluation
retour au texte
11 Le groupe-classe ou l’équipe pédagogique impliquée dans l’action éducative peuvent naturellement
être également destinataires des informations fournies à l’occasion d’une évaluation formative.
retour
au texte
op. cit., 1988, p. 23. retour au texte
13 C. Hadji, L’évaluation, règles du jeu, Des intentions aux outils. Paris : ESF Éditeur, 1989.
12 J. Cardinet,
retour au
texte
14 J. Cardinet,
op. cit., 1988, p. 15-16.
15 J. Cardinet, op. cit., 1988, p. 23.
16 J. Cardinet,
ibid.
retour au texte
retour au texte
retour au texte
17 On parle souvent, à tort, d’évaluation critériée pour désigner l’évaluation critérielle. Au-delà des
polémiques sur le « jargon » et l’inflation des termes dès qu’il est question de théoriser, il convient de
préciser que toute évaluation, quelle qu’elle soit, est critériée en ce sens qu’elle repose sur des critères,
subjectifs ou objectifs. Évaluer sans critères est impossible; même « la tête du client » est un critère,
absurde certes, mais un critère quand même.
retour au texte
op. cit., 1992, p. 308. retour au texte
19 G. de Landsheere, op. cit., 1992, p. 82.
retour au texte
20 Voir Y. Abernot, Les méthodes d’évaluation scolaire. Paris : Bordas, 1988, Utilisation de l’échelle de
notes de 0 à 20, pp. 16-22. retour au texte
21 C. Hadji, op. cit., 1989, p. 48.
retour au texte
22 B. Maccario, Ce que valent nos enfants, L’école à l’heure de l’évaluation. Paris : Milan / Education,
18 G. de Landsheere,
1988, p. 64.
retour au texte
Faire réussir, faire échouer; La compétence minimale et son évaluation. Paris :
23 V. de Landsheere,
Presses Universitaires de France, 1988, p. 62.
retour au texte
op. cit., 1988, p. 60. retour au texte
25 R. Glaser cité par V. de Landsheere, op. cit., 1988, p. 62.
26 V. de Landsheere, op. cit.,1988, p. 63.
retour au texte
24 V. de Landsheere,
retour au texte
27 Ces indicateurs doivent permettre, parce que de nombreuses compétences sont des complexes de
compétences, impossibles à décrire dans le détail, d’inférer la maîtrise de la compétence. V. de
Landsheere propose de les spécifier à partir de la question : « Que tiendra-t-on pour preuve que le
produit existe ? ».
retour au texte
Peut-on vraiment opposer «savoirs» et «savoir-faire» quand on parle d’apprentissage
Savoirs et Savoir-faire, Les Entretiens Nathan. Paris : NATHAN Pédagogie,
28 P. Mendelsohn,
, in A. Bentolila (ss la dir. de),
1995, p.29.
retour au texte
?
29 L’évaluation de la compétence à former un énoncé syntaxiquement correct ne peut cependant
prendre que la forme réussi / non-réussi. En effet, un énoncé ne peut pas être partiellement fautif : il
l’est ou il ne l’est pas.
retour au texte
30 J. Cardinet,
op. cit., 1988, p. 15.
retour au texte
31 Il n’est pas rare de rencontrer des enseignants qui notent systématiquement les travaux des élèves;
lors du premier relevé de notes de l’année ( vers le début du mois de décembre ), ils présentent, pour
chaque élève, plus de 10 notes, ce qui revient à noter un travail par semaine en moyenne.
retour au
texte
Évaluer autrement pour assurer une formation meilleure... est-ce possible ? in C.E.P.E.C.,
L’évaluation en questions; Paris : Les Editions E.S.F., 1987, p. 24. retour au
32 C. Delorme,
C. Delorme (ss la dir. de ),
texte
Vers un élargissement de la pédagogie de maîtrise : processus de régulation interactive,
rétroactive et proactive, in M. Hubermann ( ss la dir. de ), Assurer la réussite des apprentissages
scolaires ? Les propositions de la pédagogie de maîtrise. Neuchâtel - Paris : Delachaux & Niestlé, 1988,
33 L. Allal,
p.89.
retour au texte
L’école pour apprendre. Paris : E.S.F. Éditeur, 1992, p. 56. retour au texte
35 Au sens que donne P. Meirieu à ce terme. Cf. P. Meirieu, L’École, mode d’emploi. Paris: E.S.F. Éditeur,
34 J.-P. Astolfi,
2ème édition 1985.
retour au texte
op. cit., ibid. retour au texte
37 Y. Abernot, op. cit. , 1988, p. 84.
retour au texte
36 J.-P. Astolfi,
38 in documents produits par l’équipe GEREX-SOUTIEN sous la direction de F. Chirivella, I.U.F.M. de
Toulouse.
retour au texte
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
18/19
02/02/2020
Evaluation
39 Les outils présentés ainsi que certains développements doivent beaucoup à Y. Abernot,
1988, pp. 83-88.
retour au texte
L’évaluation scolaire
op. cit. ,
La pédagogie : une encyclopédie pour
40 Y. Abernot,
in J. Houssaye ( ss la dir. de )
, Paris, E.S.F. Éditeur, 1993, pp. 240-241.
retour au texte
aujourd’hui
41 Viallet et P. Maisonneuve,
retour au texte
80 fiches d’évaluation. Paris : Les Éditions d’Organisation, 1981, p.73.
Enseigner des attitudes? Planifier, intervenir, évaluer.
42 Voir notamment D. Morissette - M. Gingras,
Bruxelles : De Boeck, 3ème édition 1991, pp. 131-164.
retour au texte
op. cit., 1993, p. 237. retour au texte
44 G. de Landsheere, op. cit., 1992, p. 324.
retour au texte
45 Cf. Y. Abernot, op. cit., 1988, pp. 11-37.
retour au texte
46 Cf. Y. Abernot, op. cit., 1988, p. 28.
retour au texte
43 Y. Abernot,
sites.estvideo.net/gfritsch/doc/rezo-cfa-308.htm#S14
19/19
Téléchargement