Vincent Foutrier Comportementalisme animalier Psychologie et Éthologie 2 2 1. Avant-propos Ce livre a été conçu afin de comprendre les relations entre l’homme et votre compagnon. Il s’adresse aussi bien à un large public, qu’aux comportementalistes animaliers, vétérinaires et dresseurs. Cet ouvrage se propose d’offrir une initiation à la psychologie. Il traite de la discipline scientifique de la psychologie et touche aux matières apparentées à l’éthologie. Il s’applique à couvrir les aspects dominants de cette psychologie animale. En fait, il s’agit plus justement d’une initiation dans ces domaines, car on ne pourrait pas traiter un tel sujet si vaste dans un seul ouvrage. Ce document ne peut prétendre résumer l’ensemble des connaissances acquises par les méthodes en psychologie. Son discours est de décrire dans quel esprit travaille la psychologie. On le considère comme un parcours initial indispensable au développement d’enseignements plus approfondis et plus spécialisés. Cet ouvrage au départ paraîtra peut-être pour certains « ardu », mais soyez persévérant et perspicace, car le domaine de la psychologie est si passionnant que vous ne regretterez pas d’avoir entrepris cette lecture passionnante. 2 3 2. Disposition du « module » de psychologie Les chapitres sur l’intelligence, l’apprentissage, le conditionnement, l’instinct… décrivent les rapports qui existent entre la pensée et le comportement du chien. Une attitude ne peut pas être simplement expliquée par un processus réflexe conditionné. Le chien est un être capable : * d’émotions * de sentiments * de raisonnements. Pour comprendre les mécanismes élaborés « de la conscience animale », une étude approfondie de son psychisme est nécessaire. * La fonction du comportementaliste Ce professionnel a un rôle de conseiller en éthologie. C’est avant tout un spécialiste qui analyse et règle les problèmes liés aux troubles du comportement. Son secteur d’activité est vaste. Il emploie des techniques tirées directement des méthodes que l’on utilise en clinique humaine (massages énergétiques, thérapie de guidance, techniques de communication…) Le comportementaliste prend en compte la relation entre le maître et son animal. Les comportementalistes se sont aperçus, lors des consultations comportementales, que, dans de nombreux cas, il existait entre l’homme et l’animal une relation affective ou de dépendance affective, qui mérite d’être examinée si l’on conçoit ainsi le travail du comportementaliste. Le comportementaliste doit être aussi qualifié pour soumettre une conversation avec : 42 Des vétérinaires, des psychologues, des éthologues, des propriétaires de chiens… Cela nécessite naturellement l’acquisition d’un vocabulaire spécifique et d’un savoir-faire. La profession exige un minimum de deux années d’études, ainsi qu’une grande expérience sur le terrain. 3. Plan de lecture : comprendre avec méthode ! Une évaluation personnelle vous est proposée afin de vous permettre de tester vos connaissances, et d’aborder votre acquis par une réflexion individuelle. C’est exclusivement un travail de recherche et d’analyse. 4. L’apprentissage La théorie de l’apprentissage, est une question fondamentale pour l’étude du comportement animal. Les processus d’apprentissage ont une fonction importante chez les espèces animales, principalement chez les espèces supérieures. Chez l’être humain, le rôle de l’apprentissage est primordial, surtout à l’époque de la petite enfance, « période éducative allant de la scolarité et pouvant s’entendre jusqu’à la trentaine ». L’utilisation de ce cours d’éthologie doit conduire les spécialistes (comportementalistes, psychologues) à analyser les processus du conditionnement, afin de comprendre les raisons qui amènent l’animal à répondre à un apprentissage. L’apprentissage demande une participation active de l’animal ; il consiste en premier lieu à modifier des comportements, — on peut rajouter qu’il est de nature adaptative. 2 5 Pour qu’un apprentissage soit réussi, les modifications doivent durer dans le temps. On assiste, lors de périodes éducatives, à des manifestations qui sont variables dans le temps, soit : – augmentation de la vitesse – diminution de l’effort – qualité meilleure – modification de la structure… Il est vrai que de nombreux animaux ont un comportement limité et invariable. Lorenz avait bien étudié ce phénomène chez l’oie cendrée, qui ramène de façon constante les œufs tombés du nid. Cependant, chez la plupart des animaux, les individus doivent s’adapter à l’environnement mouvant, abstraction faite de ses stéréotypes héréditaires. Aujourd’hui, on sait que le comportement congénital de certaines espèces se modifie de génération en génération pour s’accommoder à de nouveaux éléments climatiques. L’étude de l’apprentissage peut être abordée selon deux points de vue différents. Du côté du psychologue, le spécialiste s’intéresse directement au comportement de l’animal pour exposer des lois et des hypothèses qui laissent souvent loin derrière le cadre rigoureux du laboratoire. De l’autre côté, on trouve les théoriciens de l’apprentissage qui n’ont pas le même point de vue. Leur centre d’intérêt n’est pas axé sur les modifications comportementales, ils recherchent plutôt la direction selon laquelle les animaux accèdent à des connaissances par expérimentation. 62 Dans leur pratique, on retrouve principalement la méthode de conditionnement classique, qui est outil d’analyse pratique. Deux grands courants de pensée ont marqué cette époque : le béhaviorisme et la réflexologie. Le chef de file de l’école béhavioriste fut Watson (1849-1958), psychologue, et celui de la réflexologie fut Pavlov (18491936), psychophysiologiste d’origine russe. Ces écoles avaient pour objectif d’étudier un stimulus et sa réponse. Ce fut principalement appliqué à l’observation du comportement animal. * La récompense Pour apprendre, il faut éprouver une motivation : Cette dernière peut-être créée par l’apport d’une récompense. Lorsque l’animal, après un effort, est stimulé par une gratification, généralement il cherche « spontanément » à restituer son expérience. Le conditionnement pavlovien, associait au signal (son de la cloche) un renforcement (récompense). Dans ce type de situations expérimentales, le chien associe vite la venue du signal au système de distribution de récompense (poudre de viande). Les observateurs pouvaient ainsi analyser modifications du comportement de l’animal. les Dans ce type de conditionnement, l’expérimentateur édifie une situation très particulière, en associant : * un stimulus (signal) * avec une récompense (renforcement) 2 7 Avant conditionnement : – Métronome (stimulus neutre ou SN) = réponse d’orientation – Poudre de viande (stimulus inconditionnel ou SI) = salivation (RI) Après conditionnement : – Métronome Conditionnelle ou RC) (SI) = salivation (Réponse Pour l’apprentissage du comportement social de l’homme, on tient également compte des renforcements partiels. La motivation joue aussi un rôle de maturation dans la situation d’apprentissage. Exemple : – Une prime aux pièces chez l’ouvrier est considérée comme un renforcement. – À l’école, l’élève est stimulé par la notation du devoir, la valorisation des encouragements du professeur agit aussi comme un renforcement. Dans ces deux exemples, la motivation assume une fonction « moteur ». * Apprentissage et intelligence Le conditionnement classique de Pavlov sur ses chiens a malheureusement induit en erreur de nombreux « professionnels ». On trouve encore des « éthologues » qui observent les mécanismes d’apprentissage comme un processus dépourvu de tout raisonnement. 82 Aux yeux de ces éthologues, les mécanismes d’apprentissage de l’animal ne représentent pas nécessairement un processus intelligent. Ce n’est évidemment pas la réalité. En P.N.L. (programmation neuro linguistique), on pense que la carte n’est pas le territoire, comme la représentation que nous nous faisons du monde, n’est pas le monde. Cela s’explique par d’innombrables limitations, sociogénétiques, culturelles, individuelles, etc. Les nouvelles données sont plus précises et nous avons appris que les animaux utilisent des moyens qui font appel à une réalité plus complexe. Dans toutes les formes d’apprentissage, on sait que la mémoire est présente. Si une situation donnée ne laissait pas de traces mnésiques, elle ne pourrait pas contribuer à une modification du comportement, particulièrement si l’animal se trouve à nouveau confronté à cette situation. Le conditionnement est à la fois automatique et conscient. La psychologie classique retient les lois de répétition de l’exercice. Les expériences démontrent l’influence de la répétition sur la mémorisation (très utile pour l’organisation de la tâche). * Le conditionnement instrumental et opérant Dans l’expérimentation instrumentale, l’animal doit effectuer une action (réponse) ou éviter un renforcement négatif (punition). Hilgard et Marquis sont les précurseurs de cet intitulé (1940). Ils ont introduit ce terme pour définir un type de conditionnement où la réponse conditionnée est distincte 2 9 de la réponse inconditionnelle ou, si vous préférez, de la réaction originaire au stimulus inconditionnel. Il doit, pour éviter les punitions, apprendre à utiliser l’instrument. Pour cela il doit acquérir, (par une série d’enchaînements), des coordinations : => stimulus – réponses Le conditionnement opérant a aussi été utilisé chez l’homme. Agathon et A. Roussel (1968) ont étudié cette technique chez des malades mentaux. La réponse était réalisée par la manipulation d’une poignée. Le renforcement (comme pour l’appareil distributeur de récompense chez l’animal) délivre des objets (argent, nourriture, etc.). Cet appareillage permet l’enregistrement automatique des réponses. C’est avec la technique de la boîte de Skinner, introduite vers 1930, que le conditionnement opérant a fait son apparition. En réalité, ce n’est pas autre chose qu’une technique d’apprentissage instrumental au milieu d’autres. Cette technique a permis quand même une analyse plus détaillée des causes capables de faire diversifier la fréquence des réponses de l’animal, une fois assurée la corrélation entre cette réponse et le renforcement. Le rat Skinner explore la cage et finit par actionner au hasard un levier qui commande l’arrivée d’une ration de nourriture. C’est par relation que l’animal finit par comprendre qu’il existe une relation entre le levier et la distribution de nourriture. L’expérimentateur ici utilise un système composé de récompenses (renforcement positif), associé de 10 2 renforcements négatifs (punitions). Le rat apprend ainsi à réagir au stimulus par un comportement d’évitement. Il cherche à éviter la punition. La réponse de ce type de conditionnement est bien définie. Les causes dans lesquelles la situation expérimentale progresse peuvent être maîtrisées (lumière, aération…). L’enregistrement des réponses est automatisé. Il peut s’étendre durant une longue période « même en l’absence de l’homme », grâce à l’automatisation du renforcement. Le renforcement peut être intermittent et s’accomplit d’après un projet précis : * Programme à rapport constant où le renforcement intercède après un nombre précis de réponses (une boulette de viande pour 45 pressions sur le levier…) ; * Programme à rapport variable, où le renforcement intercède après une quantité variable de réponses, la différence se faisant à l’entour d’une moyenne précise ; * Programme à écart continuel, dans lequel le renforcement est distribué à la suite de la première réponse émise après qu’un écart de temps précis se soit écoulé depuis la réponse antérieure renforcée ; *Programme à espace variable, analogue au précédent, à cela près que l’écart entre deux renforcements oscille aux alentours d’une moyenne précise ; * Programme de renforcement des débits de réponse traînant, où la réponse n’est renforcée que si un écart de temps précis s’est écoulé depuis la réponse antérieure. Les conditions d’établissement * Les lois observées Pour 2 établir un conditionnement opérant, la 11 motivation est un facteur déterminant. Pour établir un état de besoin, les animaux sont sousalimentés avant une expérience. Le renforçateur sera de la nourriture. L’intensité du renforcement dépend aussi de la rapidité d’acquisition (une souris doit donner une réponse précise à l’allumage d’une ampoule pour échapper à un choc électrique). * L’extinction Lorsque le renforcement est supprimé, l’extinction survient. Elle est plus tardive dans les programmes à espace ou à rapport variables et là où la proportion de réponses renforcées est moins forte. * La généralisation du stimulus Un colombin subit un renforcement toutes les deux minutes, selon un programme à écart variable, en becquetant une plage lumineuse d’une couleur déterminée. Il administre de cette manière 4 000 à 6 500 coups de bec à l’heure. Si le renforcement est supprimé, l’extinction est très lente. Il est possible de présenter au pigeon des plages de couleurs distinctes qui se suivent au hasard, et inscrire la fréquence des coups de bec pour toutes les couleurs. En dépit de la présentation au hasard des diverses couleurs, la fréquence s’amoindrit de part et d’autre du stimulus initial. On a observé que cette fréquence était plus faible pour une certaine couleur, que cette couleur est plus lointaine du stimulus initial sur l’échelle des longueurs d’onde. Lorsque les couleurs varient par degrés de manière ininterrompue, 12 2 la fréquence des coups de bec alterne également de manière instantanée et harmonieuse, « comme si on tournait un robinet » (N. Guttman et H.I. Kalish, 1958). * La discrimination Elle s’illustre par une expérience poursuivant celle qui a été décrite précédemment. Imaginons qu’un pigeon est conditionné avec un stimulus positif de 600 millimicrons (les coups de bec sur une plage d’un vert sont renforcés) et un stimulus négatif de 550 millimicrons (les coups sur une plage d’un vert plus jaunâtre, ne sont pas renforcés). On contrôle ensuite la généralisation du stimulus positif, comme on l’a fait plus haut. On s’aperçoit que la marge de couleurs sur laquelle la généralisation s’observe est bougée vers les longueurs d’onde courtes, à l’opposé du stimulus négatif. Masserman décrit de telles expériences qui aboutissent à la formation de névroses expérimentales à partir de conditionnements opérants. Exemple d’une névrose expérimentale : « On remplace la distribution de viande par un jet d’air puissant » (J.H. Masserman, 1950). Très vite apparaissent des troubles comportementaux * durables et généraux (angoisse, convulsions, phobies, panique, troubles psychosomatiques…). * Espacement et apprentissage L’apprentissage espacé dans le temps (durée de l’exercice) est plus performant que l’apprentissage condensé. Les séances de conditionnement de courte durée et répétées par une pratique régulière, sont plus opérantes. Cette méthode a pour effet de motiver l’animal, par sa disponibilité physique et mentale. 2 13 Si l’on présente à l’animal des périodes d’entraînement condensé et temporaire, la réponse au conditionnement décroît lentement puis fini par disparaître. Une fois constituée une liaison conditionnelle, entre les séances d’entraînement répétées régulièrement, on peut être sûr que la réponse persiste à exister. Il est donc préférable d’espacer les séances d’apprentissage. * Le modelage des attitudes Les scientifiques, pour modeler un comportement, associent une réponse injustifiée à un signal banal. L’exemple le plus concret est celui où l’expérimentateur apprend à un chien à effleurer de la tête la poignée de la porte du laboratoire après un signal sonore. L’apprentissage commence par une distribution de viande au moment de l’émission du signal sonore. Ensuite le signal sonore et la distribution de récompense sont donnés uniquement au moment où le chien se trouve par hasard dirigé vers la porte, et au fur et à mesure qu’il s’approche de la poignée. Il y a dans cette expérience une cause à effet où le chien associe très vite l’intérêt qu’il a de coopérer avec l’homme. On peut par exemple dresser rapidement un chien à aller toucher du museau la poignée de la porte d’un mobilier (après l’émission d’un signal). On renforce l’exercice par une récompense et par le son du signal. Ensuite le son et son renforcement ne sont émis que lorsque le chien se trouve par hasard à proximité du meuble ; puis uniquement lorsqu’il est aux environs du meuble, etc. 14 2 * Les théories cognitives Tilman (1886-1959) a été à l’origine de cette théorie cognitive de l’apprentissage. Les données de son système ne prennent pas en compte les éléments classiques => stimulus – réponse, ni les éléments de renforcement. Pour Tolman, l’apprentissage n’est pas une liaison stimulus – réponse, mais des structures signifiantes. Elles réglementent un signe, un signifié et la façon d’arriver au signifié. Le signe est compris par rapport à certaines allures et conduites. Pour Tolman, les structures signifiantes entretiennent chez l’animal des « attentes ». Le signe correspond au signal et le renforcement au signifié. Pour Tolman, la présence de nourriture est un objet de connaissance, pas nécessaire pour obtenir un apprentissage. Tolman n’utilise ni la notion de liaison S-R, ni la notion de renforcement. Ce qui se constitue durant l’apprentissage, ce ne sont pas des connexions stimulusréponses, ce sont des structures appelées « structures signifiantes » (« sign-gestalt »). Elles organisent un signe, un signifié et le moyen de parvenir au signifié, le signe étant perçu par une conduite déterminée. Pour Tolman, ces structures signifiantes répondent à des « attentes ». Le signe, si l’on y répond d’une certaine manière, amène au signifié. Pour Tolman, un renforcement n’est pas essentiel pour que de telles structures se construisent. Si le signifié est fait de récompenses, ces affirmations consisteront à 2 15 chercher des récompenses, identiques aux situations expérimentales de HULL. Toutefois, toujours selon Tolman, le besoin n’est plus une nécessité pour que le fait de trouver de la nourriture prenne un intérêt de validation. Pour Tolman, l’existence de nourriture peut devenir un objet de connaissance, alors que pour Hull, elle n’était qu’un moyen de combler un besoin. * L’apprentissage psychophysiologique Des expériences ont été utilisées pour comprendre les mécanismes neurophysiologiques de l’apprentissage. Cette méthode (d’un autre âge), procède à l’ablation d’une partie du cerveau chez l’animal, afin d’observer les données de cette expérience sur les facultés d’acquérir l’apprentissage expérimenté par l’animal. Ces expériences ont été réalisées sur des singes et sur toutes sortes d’animaux. Pour Pavlov, l’écorce cérébrale était essentielle pour l’acquisition de l’apprentissage. Des expérimentateurs ont pu faire intégrer des réflexes conditionnés à des chiens dont le cortex a été sectionné (des rapports nerveux sous-corticales indirects sont possibles entre les noyaux qui font les relais des voies sensorielles afférentes). Mais cela n’exclut pas le rôle du cortex dans le mécanisme de l’apprentissage. E.S. Cashley a publié, en 1950, que seul avait une importance le volume global de la destruction qui pouvait intervenir sur n’importe quelle région du cortex. Chez l’homme, les observations faites à la suite de lésions ou d’interventions chirurgicales, ayant entraîné la destruction de telle ou telle partie du cerveau, se sont portées sur le cortex sensoriel d’association (région frontale). 16 2 Le cortex temporal est un ensemble de structures sous-corticales appelé système limbique. À l’heure actuelle, on n’a pas trouvé de structure cérébrale qui soit responsable de l’apprentissage. Les destructions opérées sur les parties du cortex expliquent les perturbations qui ont modifié l’apprentissage, car ces destructions influencent directement des fonctions spécifiques (attention, motivation, vigilance…). * Les comportements innés Définition Lorenz indique que c’est activité rigide, qui se déroule dans un ordre rigoureux, qui ne nécessite pas d’apprentissage. Tinbergen, quant à lui, pense que c’est une faculté d’accomplir (sans apprentissage) des actions spécifiques dépendant des conditions internes et de facteurs externes. Les auteurs comme Chauvin, considèrent la distinction entre un comportement « inné » (né avec, comprenant tout ce qui est héréditaire) et toutes les acquisitions du fœtus au cours de sa vie prénatale. Les comportements innés sont des réactions qui se manifestent de façon identique chez tous les individus d’une espèce donnée, indépendamment de tout exercice ou d’expérience préalable. Ils peuvent être considérés comme prédéterminés par les seuls facteurs héréditaires (gènes), et se transmettent donc à la descendance. * Les activités réflexes Ce sont les réactions élémentaires d’un organe qui animent une partie du corps, le corps lui-même restant en 2 17 place. Ainsi la rétraction d’un membre sous l’effet d’un contact est un réflexe. La plupart des réponses réflexes sont protectrices et ont pour objet d’écarter le corps d’un stimulus dangereux. L’acte réflexe est un processus automatique, apparemment immédiat, constitué en réponse à une excitation. Il peut se répéter de nombreuses fois identique à lui-même, il ne dépend pas de conditions internes particulières. Il s’agit de cas à la limite des conduites instinctives et, chez les animaux à comportement complexe et intégré, il s’agit plus d’éléments de conduite que de conduites véritables. * Point de vue social de l’apprentissage L’effet d’audience La présence passive d’individus exerce une influence sur l’apprentissage (qualité et performance). On désigne ce phénomène par l’effet d’audience, qui agit comme un effet de contagion comportementale. Cela peut amener quelquefois l’observateur à imiter une conduite acquise. Les éthologues ont déjà observé cette manifestation avec des espèces différentes. L’apprentissage imitatif Avec l’apprentissage « imitatif », l’individu apprend à reproduire un comportement prototype. Ce type d’apprentissage est ensuite capable de généralisation. Le conditionnement social peut déclencher une réponse positive. Chez l’être humain par exemple, un simple signe approbateur (hochement de la tête, sourire…) 18 2 fournit un effet stimulateur sur la volonté. Chez l’animal, la présence d’un congénère suffit à provoquer une réponse émotionnelle. Skinner avait observé que la présence d’un rat dans une cage voisine (qui apprend à actionner le levier distributeur de récompense), augmentait la qualité de l’apprentissage du rat observateur. Exemple : Un rat (a) est placé en arrière d’un autre rat qui a appris précédemment à se déplacer dans un labyrinthe en T. Le rat (a), est tout à fait capable d’apprendre le circuit par simple imitation. On a observé ensuite, après avoir placé les deux rats dans un deuxième labyrinthe, que le rat (a) continuait à suivre le rat leader. L’apprentissage, ici, ne porte d’abord que sur l’imitation du comportement du leader. Ensuite le rat (a) finit par mémoriser les indices qui le mènent au labyrinthe. Les avis restent cependant partagés, sur la discussion qui consiste à savoir si l’apprentissage imitatif est ou n’est pas un comportement inné. * Conditionnement et éducation Ces techniques sont inspirées d’expériences de conditionnement répondant et opérant. Tableau II résultat des conduites Exercices : Leçons de travail : 2 résultats : attention, soif de connaître 19 Succès aux exercices : satisfaction L’établissement d’une liaison entre exercice et sentiment déplaisant, entraîne des manifestations affectives. À chaque présentation de l’exercice, l’animal éprouve un sentiment de rejet face à l’entraînement. La leçon de travail devient par la suite un stimulus conditionné, qui peut déclencher à lui tout seul (avent même d’avoir commencé l’entraînement), une manifestation de rejet. Il faut faire très attention à la méthode de conditionnement employée. Association entre ordre et manifestation * Le maître, manifestation d’impatience, comportement rigide * L’animal, crainte, tension ; * Le maître, calme, souplesse * L’animal, intérêt, satisfaction. Les expériences de Köhler Köhler a surtout observé les grands singes, il a remarqué que ces animaux étaient capables d’utiliser certains objets comme outil pour atteindre un objectif. L’expérience classique est la banane suspendue audessus de la tête du singe. Ce dernier, dans un premier temps, essaie de l’attraper en sautillant, ensuite il cherche un objet pour s’en servir comme outil. Les exemples de ce genre sont multiples, certaines espèces arrivent même à emboîter deux morceaux de bois 20 2