Chapitre 1 : Les théories de l’apprentissage. 3 LES THEORIES DE L’APPRENTISSAGE I. LES PREMIERES FORMES D’APPRENTISSAGE A. L’HABITUATION Elle est généralement considérée comme la forme la plus simple d’apprentissage. Elle se rencontre dans tout le règne animal, des protozoaires à l’homme. C’est la diminution de l’intensité, de l’amplitude ou de la durée d’une réponse, réponse comportementale, végétative ou nerveuse. C’est donc la diminution puis la disparition de cette réponse lors de la répétition du stimulus évocateur. Exemple : Si l’on présente à un enfant le même objet plusieurs fois de suite, on constate que le temps pendant lequel l’enfant fixe l’objet diminue. Si l’objet change, le temps de fixation augmente à nouveau. C’est ce qu’on appelle « la réaction à la nouveauté ». Depuis 1963, on considère l’habituation comme une forme d’apprentissage. B. L’EMPREINTE L’empreinte est issue des anthropologistes qui étudient les animaux. Le petit apprend à reconnaître sa mère quelques heures après sa sortie de l’œuf, ce qui lui permet de la suivre dans tous ses déplacements. Ainsi, on a pu observer que l’oisillon développe une préférence envers un objet qui, dans les premières heures qui suivent l’éclosion, se trouve dans son environnement. On observe des conduites de poursuite à l’égard d’un stimulus qui peut n’avoir aucun caractère commun avec la mère biologique. L’empreinte correspond donc à une acquisition brusque par un jeune au cours d’une période biologiquement privilégiée. Chapitre 1 : Les théories de l’apprentissage. 4 Toutefois, 3 caractéristiques sont nécessaires : Il faut d’une part une période critique, il faut que l’objet soit mobil. Les conséquences sont très importantes sur son devenir. L’empreinte sociale que va subir l’animal a une influence sur sa future vie. Les effets sont irréversibles. II. LES THEORIES BEHAVIORISTES A. LA LOI DE L’EFFET OU APPRENTISSAGE PAR « ESSAI ET ERREUR » 1. PRESENTATION La loi de l’effet ou apprentissage par « essai et erreur » a été initialement étudié par Thorndike (1874 – 1944) La plus connue de ses expériences a été conduite sur des chats qui sont placés dans des boîtes que l’on appellera plus tard « des boîtes à problèmes ». Elles sont munies d’un dispositif permettant l’ouverture d’une porte par le chat. On enferme donc un chat affamé et on met de la nourriture en dehors de la cage pour l’attirer. Des réactions comportementales ont été observées, le chat tourne dans la cage, la griffe, la mord et se dresse sur ses pâtes arrières. Comme par hasard, la cage va s’ouvrir. Il a appris par essais et erreurs et s’il recommence, il ouvrira la cage beaucoup plus rapidement. Il y a eu un apprentissage. La nourriture à l’extérieure de la cage est une forme de récompense pour le motiver à sortir. Cette forme d’apprentissage est un processus associatif caractérisé par la formation de connexion entre un stimulus (S) et une réponse (R). S Eléments de situation Cage expérimentale R Eléments de réponse Ouvrir la porte de la cage Chapitre 1 : Les théories de l’apprentissage. 5 A partir de ces études des lois de l’apprentissage ont été mises en avant. On peut citer des lois principales et des lois secondaires. 2. LOIS PRINCIPALES Loi de l’exercice ou de l’oubli : Plus le nombre d’essai augmente, moins l’animal fait d’erreur. En revanche, si on se limite dans le nombre d’essai, il y a oubli donc pas de connexion et pas apprentissage. Le non-exercicee provoque l’oubli. Loi de l’effet : Une connexion S R peut être renforcée mais aussi affaiblie par l’effet de ses conséquences. Si à la sortie de la cage, on donne à l’animal de la nourriture, il y a un effet positif alors que s’il ouvre et qu’on lui donne une décharge électrique il n’apprécierait pas. La connexion sera affaiblie et il n’aura aucun intérêt à essayer d’ouvrir la porte. Ces deux lois sont principales car ce sont les conditions nécessaires à l’apprentissage. 3. QUELQUES LOIS SECONDAIRES Réponses multiples : Il faut que le sujet ait un répertoire de réponses suffisamment variées. Si ses capacités réactionnelles sont insuffisantes ou si elles sont peu diversifiées, la réalisation d’un apprentissage par essai et par erreur devient improbable. Attitudes : La motivation est un déterminant majeur de l’apprentissage. Si par exemple on met un chat qui a bien mangé il ne cherchera pas à sortir de la cage. Réponses par analogie : Lorsqu’une situation antérieure a donné lieu à un certain type de comportement, une situation nouvelle similaire à la précédente tendra à provoquer un comportement identique ou analogue. Chapitre 1 : Les théories de l’apprentissage. 6 4. CONCLUSION Il existe des mécanismes similaires en ce qui concerne l’apprentissage humain. C’est une théorie toujours d’actualité, notamment reprise dans les sciences de l’éducation (concept de transfert) Il y a une importance de la loi de l’effet avec le principe de renforcement et de punition. B. LE CONDITIONNEMENT CLASSIQUE Ou conditionnement répondant. 1. QUELQUES POINTS On le doit à Ivan PAVLOV (1849 – 1936) qui a reçu le prix Nobel de physiologie et de médecine en 1904. Il a fait l’étude physiologique de la sécrétion salivaire chez le chien pour décrire la réponse ou la réaction conditionnelle classique. Cette réaction ou cette réponse conditionnelle repose sur la possibilité pour un organisme d’acquérir et de retenir l’association de 2 stimuli de telle sorte qu’une réponse (salivation) naturellement provoquée par un stimulus (viande) dit « inconditionnel » puisse après apprentissage être obtenue par le second (son) dit « conditionnel » 2. LA REACTION CONDITIONNELLE La réaction conditionnelle va se construire à partir de plusieurs éléments : - Réaction inconditionnelle (RI) : La salivation. Un chien salive sans apprentissage. Chapitre 1 : Les théories de l’apprentissage. 7 - Stimulus inconditionnel (SI) : La poudre de viande suscite un réflexe de salivation. Ce n’est pas encore un apprentissage. - Stimulus neutre (SN) : Une sonnerie ne déclenche pas de salivation chez le chien. - Stimulus conditionnel (SC) : Un son est capable dans l’apprentissage de susciter une réponse de type salivation. - Réaction conditionnelle (RC) : Réponse réflexe déclenchée artificiellement (la salivation). Le conditionnement classique consiste donc en une opération qui va rendre efficace l’action d’un stimulus qui ne l’était pas auparavant. Schéma de l’expérimentation : Il va y avoir association de 2 stimuli (viande + sonnerie), si bien que le chien, après le conditionnement sera capable de saliver à l’unique son de la cloche. Chapitre 1 : Les théories de l’apprentissage. 8 Avant le conditionnement : SN stimulus neutre (cloche) aucune réponse ou réponse d’orientation SI (nourriture) RI (salivation) Durant le conditionnement : SC (cloche) RI (salivation) SI (nourriture) Après le conditionnement : SC (cloche) RC (salivation) 3. LES CONDITIONS D’ETABLISSEMENT DE LA REACTION CONDITIONNELLE 5 conditions sont nécessaires : - Contiguïté temporelle : Il est nécessaire qu’il existe une contiguïté temporelle entre la présentation du SC et du SI pour qu’apparaisse une réponse de type conditionnelle. D’une manière générale, il faut que le SN ou le SC soit toujours présenté avant le SI. En effet, le SN qui deviendra SC est efficace lorsqu’il joue le rôle d’un signal annonçant le stimulus inconditionnel (ici la viande) De nombreuses études se sont intéressées à découvrir l’intervalle optimal séparant le SC du SI, et il semblerait que l’établissement de la RC soit plus rapide si l’intervalle se situe autour d’une demie-seconde. Chapitre 1 : Les théories de l’apprentissage. 9 Dans le conditionnement rétroactif, l’apprentissage n’a pas lieu si le SC est placé avant la SI. PAVLOV est contre le conditionnement rétroactif. Dans le conditionnement différé ou retardé, on va apprendre au chien à inhiber sa réaction en différant progressivement la présentation de la viande par rapport à la sonnerie. Dans le conditionnement de trace, on apprend à l’animal à ne plus répondre de manière automatique mais à inhiber sa réponse. Les conditionnements différés et de trace sont les plus efficaces car ils sont plus adaptatifs puisque l’organisme peut apprendre à faire des prédictions au sujet de son environnement. - La répétition : La force de la réaction conditionnelle est fonction du nombre de répétitions, de la conjonction des 2 stimuli. Chapitre 1 : Les théories de l’apprentissage. 10 - Le renforcement : Dans l’établissement d’une réaction conditionnelle, le renforcement est indispensable. Par exemple si le chien nous donne la patte, on lui donne le sucre. Si on souhaite le renforcement, il faut qu’il y ait une condition particulière. - L’intensité du SN qui deviendra SC : Elle doit être assez forte pour provoquer une réaction d’orientation, sans cependant être trop élevée sous peine de susciter la peur. - Le contrôle de tous les éléments étrangers qui vont venir interférer avec l’apprentissage : Liés à l’animal (il y a des animaux plus anxieux, plus craintifs que d’autres) Liés à l’environnement (il ne faut pas d’autres bruits ou d’autres odeurs autour sinon il ne salivera pas) 4. L’EXTINCTION ET LE RECOUVREMENT L’établissement de la réaction conditionnelle est réel si nous respectons les 5 conditions exprimées précédemment, mais on peut se demander combien de temps un chien va saliver au bruit d’une cloche. En d’autres termes, que se passe-t-il si nous supprimons le renforçateur. La réaction conditionnelle est soumise à l’extinction. L’apprentissage et les courbes d’extinction Chapitre 1 : Les théories de l’apprentissage. 11 L’extinction est considérée comme un processus par lequel les stimuli conditionnels perdent leur capacité à déclencher des réponses conditionnelles parce que les stimuli conditionnels ne sont plus associés à des stimuli inconditionnels. Toutefois, on peut au bout d’un certain temps à nouveau faire entendre le son et l’associer à un élément renforçateur : c’est le recouvrement spontané. Mécanisme de l’extinction : 2 hypothèses : - Hypothèse du simple évanouissement de la réaction conditionnelle. Le processus de recouvrement spontané contredit cette théorie. - Hypothèse de l’effacement par inhibition. La réponse n’est pas oubliée mais inhibée, le chien ne répond plus parce qu’il n’est pas récompensé. Résistance à l’extinction : - Nombre de renforcements donnés au cours du conditionnement (une réaction est d’autant plus difficile à atteindre qu’elle a été abondamment renforcée) - Délai dans l’établissement de la réaction conditionnelle et son extinction est plus long, plus l’extinction sera difficile. - L’intervalle entre les renforcements : l’extinction est plus difficile après un conditionnement différé car le chien a appris à inhiber. - Les substances chimiques. Les sédatifs vont faciliter l’extinction. 5. GENERALISATION ET DISCRIMINATION Généralisation : Il y a généralisation lorsqu’une réponse ayant été conditionnée avec un stimulus déterminé apparaît également avec des stimuli qui lui ressemblent. Schéma : variation de fréquence d’un son. On suppose que l’on a conditionné le chien à un son de 1000 Hz. Si on lui fait entendre un son plus petit, on obtient quand même une réponse mais la quantité de salive est moindre. Une réaction serait donné à chaque fois mais elle est d’autant plus faible que l’on s’éloigne du stimulus conditionnel. Chapitre 1 : Les théories de l’apprentissage. 12 L’intensité de la réponse (ex : quantité de salive) est fonction de l’intensité du stimulus (ex : fréquence du son) : c’est le gradient de généralisation. Une fois établie, une réaction conditionnelle à un stimulus bien défini, la présentation de stimuli différents peut aussi évoquer la même réaction : c’est la généralisation conditionnelle. Les stimuli susceptibles d’évoquer la réaction conditionnelle ont certaines relations avec le premier stimulus. Leur efficacité est d’autant plus grande qu’ils sont plus semblables à ce dernier. Discrimination : Discriminer = différencier ses réponses. Discriminer, c’est le fait de répondre par une réaction donnée à un stimulus bien déterminé et de ne pas répondre à des stimuli différents. Nous avons présenté les principales caractéristiques de la réaction conditionnelle classique en ne retenant que les travaux de PAVLOV. Partant du conditionnement salivaire comme un prototype, on trouve un nombre important de réactions qui peuvent être conditionnées selon le même schéma. Certains auteurs ont pensé pendant longtemps que le conditionnement pavlovien était une forme d’apprentissage très primitive. Ce point de vue est actuellement discuté et il semblerait que c’est la prise de conscience entre le stimulus conditionnel et le stimulus inconditionnel qui serait la condition nécessaire à l’établissement d’un conditionnement classique chez l’être humain. Ceci expliquerait que le conditionnement soit difficile à établir chez le bébé, mais il faut dire que le conditionnement serait le témoin d’une capacité à saisir des relations de causalité et non pas une forme primitive de l’activité cognitive. 6. EXEMPLES D’APPLICATIONS DU CONDITIONNEMENT CLASSIQUE Technique du coussinet pour les problèmes d’incontinence nocturne chez l’enfant. RC : réveil de l’enfant SC (pression) SI (sonnerie) L’avantage est qu’il n’y a pas d’extinction, le conditionnement est durable car elle relève d’une adaptation nerveuse. Immersion et désensibilisation systématique, mécanisme d’extinction conditionnelle. Chapitre 1 : Les théories de l’apprentissage. 13 C. LE CONDITIONNEMENT OPERANT OU INSTRUMENTAL 1. DEFINITION C’est Skinner (1904 – 1990) qui fut le pionnier du conditionnement opérant qu’il va opposer au conditionnement classique de Pavlov. Il va étudier le conditionnement opérant sur l’animal (rat, pigeon) puis assez rapidement il va utiliser le conditionnement opérant pour rendre compte de l’ensemble des apprentissages humains, même celui du langage. Le qualitatif « instrumental » vient du fait que dans cette forme d’apprentissage, l’obtention d’une récompense (renforcement positif) ou une punition (renforcement négatif) dépend de l’activité du sujet, c’est à dire de sa réponse. Par conditionnement instrumental, on désigne simplement la réponse du sujet qui est l’instrument dont il dispose pour exercer une influence sur la suite des événements et il doit apprendre à l’utiliser. 2. CONDITIONNEMENT CLASSIQUE ET INSTRUMENTAL : LES SIMILITUDES L’acquisition d’un comportement exige une association. L’acquisition d’un comportement exige aussi une répétition : plusieurs essais successifs sont nécessaires. Le rôle du renforcement est essentiel car sans lui la réaction s’éteindra. 3. CONDITIONNEMENTS CLASSIQUE ET INSTRUMENTAL : LES DIFFERENCES Répondant (Pavlov) Relation causale entre le renforcement et la réponse. Le renforçateur (SI) est donné par l’expérimentateur. → Le sujet est passif, il subit le milieu. Loi de contiguïté temporelle. Instrumental (Skinner) Liaison réponse / renforcement arbitraire. Le renforcement dépend de la production de la réponse du sujet → Le sujet est actif, il agit sur le milieu. Loi de l’effet (rôle des récompenses et des punitions) Chapitre 1 : Les théories de l’apprentissage. 14 4. LE CADRE D’ANALYSE Boîte à Skinner ou « puzzle box » ou « boîte à problème » Elle est munie d’un dispositif de réponse et d’un réceptacle. Unité de comportement qui est le fait d’appuyer sur un bouton. C’est ce que l’on souhaite obtenir après apprentissage. Sous le contrôle du renforcement Stimulus (ex : levier) Milieu Organisme Renforçateur (ex : aliment) Réponse (ex : appui sur levier) La réponse opérante est contrôlée par ses conséquences. 5. LES PRINCIPES DU CONDITIONNEMENT OPERANT a) Contingences de renforcement Les principes du conditionnement opérant décrivent les relations entre le comportement et les conditions environnementales qui vont l’influencer. 3 éléments majeurs apparaissent : Stimuli discriminatifs : ils servent de signaux en procurant de l’information concernant le moment où un opérant (ex : coup de bec) sera renforcé. Réponse opérante : ce n’est pas seulement une réaction à un stimulus mais un moyen d’obtenir une récompense ou d’éviter une punition. Chapitre 1 : Les théories de l’apprentissage. 15 Agents renforçateurs : Consommables et manipulables (boissons, bonbons…) Sociaux (contact physique, réponse verbale) Certains comportements → principe de Prémack. Renforcements conditionnés généralisés et échangeables (argent) Principe de Prémack : Un comportement émis selon une fréquence élevée peut servir de renforcement à un autre comportement de probabilité d’apparition plus faible. (ex : si résultats scolaires mauvais, plus de télévision) Regard particulier sur les agents renforçateurs : Les agents renforçateurs peuvent modifier la fréquence dans le sens d’une augmentation. - Renforcement positif : cela augmente la probabilité d’une réponse opérante. - Renforcement négatif : requiert la présence d’un événement aversif et l’animal ou l’individu va apprendre à éviter ou échapper cet événement. Echappement : quitter une pièce trop bruyante. Evitement : absorption d’un médicament. Echappement : l’individu est soumis à une situation douloureuse à laquelle il va se soustraire par l’émission d’un comportement. Evitement : ce type de comportement va permettre à l’individu de prévenir un contact avec une situation aversive, l’individu va se soustraire à la situation. L’évitement peut se développer après l’apprentissage d’une réponse d’échappement. Chapitre 1 : Les théories de l’apprentissage. 16 Les agents renforçateurs peuvent modifier la fréquence d’une réponse dans le sens d’une diminution. L’objectif est de réduire voir de supprimer l’émission d’un comportement non approprié (les punitions) Il ne faut pas confondre les notions de renforcement négatif et de punition. La punition se réfère à la réduction de la fréquence d’émission d’une réponse, mais dans la vie courante, la punition est très souvent utilisée indépendamment de ses efforts sur le comportement. b) Les programmes de renforcement Il faut varier le délai entre la réponse opérante et le renforçateur. Réponse opérante Renforçateur Programme de renforcement La relation entre réponse opérante et le renforçateur peut être réglée par diverses modalités que l’on appelle programme de renforcement. Il existe plusieurs programme de renforcement : Programme de renforcement continu : C’est le programme le plus simple, chaque réponse est suivie d’un renforcement quel que soit le moment où la réponse est émise. Programmes à proportion des réponses : - A proportion constante (FR ou Fixed Ratio) : Le sujet recevra un renforcement chaque fois qu’il fournira un nombre de réponses déterminé (ex : pigeon tourne la clé 10 fois pour être renforcé) - A proportion variable (VR ou Variable Ratio) : Le renforcement est octroyé après un nombre variable de réponses. Le renforcement est intermittent et la variation se fait autour d’une moyenne. Chapitre 1 : Les théories de l’apprentissage. 17 Programmes à composantes temporelles : - Programme à intervalle fixe (FI ou Fixed Interval) Toutes les 10 secondes. - Programme à intervalle variable (VI ou Variable Interval) Renforcement délivré après une heure variable (de 90 à 100 secondes) A partir de ces différents programmes, Skinner a pu étudier l’apprentissage de différents types de comportement. Par exemple, la discrimination d’un élément (apprend à l’animal à émettre une réponse en présence d’un signal qui peut être par exemple une lampe) La différenciation : la nourriture ne sera donnée seulement si l’animal fournit une réponse d’une certaine intensité. 6. LES LOIS DU CONDITIONNEMENT OPERANT Le conditionnement opérant a apporté plusieurs points à l’étude de l’apprentissage, il a conduit à accorder une plus grande généralité aux mécanismes mis en évidence par l’étude du conditionnement Pavlovien. a) Conditions d’établissement L’efficacité du renforcement est dictée par le fait qu’il doit être délivré immédiatement après l’émission d’une réponse et lorsque la réponse est apprise, le délai entre la réponse et le renforcement peut varier. b) L’extinction et recouvrement spontané Dans le conditionnement opérant, l’extinction et le recouvrement spontané des réponses apprises proviennent d’une répétition du comportement sans renforcement. (ex : si un enfant est en colère et que les parents lui disent de se taire, il faut simplement l’ignorer et il y aura extinction des cris de colère) c) La généralisation On peut conditionner un pigeon à picorer une petite plage lumineuse, on mesure la fréquence de réponse et on va faire varier la couleur se rapprochant plus ou moins des stimulus discriminatifs et on aura la même réponse. Chapitre 1 : Les théories de l’apprentissage. 18 Chez l’être humain, on a observé les mêmes phénomènes (le transfert d’apprentissage, par exemple, faire quelque chose de la main droite puis de la main gauche). d) La discrimination e) La névrose expérimentale Chapitre 1 : Les théories de l’apprentissage. 19 7. EXEMPLES D’APPLICATION Enseignement : Enseignement programmé, c’est une technique d’enseignement (avec ordinateur) qui consiste à découper les connaissances en petites unités présentées à l’élève dans un ordre de difficulté gradué. Chaque unité fait l’objet d’une ou plusieurs questions de l’enseignant. Ces questions sont conçues de telle manière que l’élève puisse donner des réponses satisfaisantes faisant l’objet d’un renforcement positif (ex : c’est bien, continue…) Education. Thérapie : Dans de nombreux troubles du comportement (dépression …) par la technique du conditionnement opérant, nous pouvons renforcer le sujet pour qu’il redevienne « normal » (renforcement d’unité comportementale) 8. CONCLUSION GENERALE Les théories S-R de l’apprentissage sont insuffisantes dans l’explication d’apprentissage complexe. La théorie de Hull : S-O-R est précurseur d’autres théories. Stimulus Organisme Besoin Motivation Réponse Il a défini les habitudes plus particulièrement des familles d’habitudes.