Lire l`article complet

publicité
mise au point
Motivation et récompense :
le point de vue
des neurosciences cognitives
Motivation and reward: views from cognitive neuroscience
M. Pessiglione*
“
Bonjour monsieur, comment vous sentezvous ?”
– Je me sens bien physiquement, mais… j’ai des difficultés à… faire beaucoup de choses… à part la routine…
je n’arrive pas à me stimuler assez… pour y arriver.
- Et vous madame, pouvez-vous nous expliquer ce
qui se passe avec votre mari ?
- Ben, il est motivé pour rien, faut toujours lui dire
de faire les choses, être toujours derrière lui.”
Comme dans cet exemple, l’entretien clinique
fait parfois apparaître un manque de motivation,
c’est-à-dire une apathie, chez les patients atteints
de pathologie neurologique, ici la maladie de
Parkinson. Comment, au-delà des échelles et des
questionnaires, objectiver ce symptôme et aborder
les mécanismes sous-jacents ?
La motivation est d’abord un concept du sens
commun, que l’on comprend intuitivement mais qui
est difficile à définir. Comme l’épouse de notre patient,
on aura tendance à dire de quelqu’un qui ne fait pas
d’effort qu’il n’est pas motivé. On se demande aussi
parfois quelle est la motivation (ou le motif) d’une
action : pourquoi s’engager dans telle tâche plutôt
que dans telle autre ? Une explication en termes motivationnels doit donc rendre compte non seulement
de l’ “énergisation” (combien d’effort) mais aussi de
l’orientation (quels choix) du comportement.
* Chargé de recherche Inserm, hôpital
de la Pitié-Salpêtrière, Paris.
Ainsi, la motivation provient d’une inférence sur
la raison d’un comportement. De fait, on ne peut
pas l’observer directement, on n’en observe que les
effets, ce qui soulève plusieurs problèmes pour l’approche expérimentale.
70 | La Lettre du Neurologue • Vol. XIII - n° 3 - mars 2009 Le premier est celui de la circularité : s’agit-il
seulement d’une façon de parler ? Si je dis qu’un
patient en a agressé un autre en raison de ses
pulsions agressives, est-ce que je n’ai pas dit deux
fois la même chose ? Existe-t-il réellement une
chose qu’on puisse appeler motivation et dont on
puisse étudier les bases cérébrales ? Un deuxième
problème est celui du particularisme : tous les individus ne se comportent pas de la même façon, tous
les comportements ne procèdent pas des mêmes
désirs. Peut-on parler de motivation dans un sens
général ? Il faut aussi mentionner le problème du
réductionnisme : peut-on trouver une correspondance entre les causes inférées à un niveau psychologique et les causes mécaniques étudiées au niveau
neuronal ? C’est le sujet qui désire ; y a-t-il un sens
à dire qu’une région cérébrale est responsable de
la motivation du comportement ? Enfin, troisième
problème : comment s’assurer que l’inférence est
correcte, c’est-à-dire que le mécanisme cérébral
mis en avant est bien responsable de l’effort ou des
choix engagés par l’individu ? La méthode expérimentale consiste à manipuler les causes pour
reproduire les effets. Mais si la motivation est une
chose interne au sujet qui le pousse à agir, comment
la manipuler ?
Ayant mis ces difficultés en relief, nous allons dans un
premier temps tenter de comprendre comment les
neurosciences cognitives ont réussi à les contourner.
Ensuite, nous passerons en revue quelques paradigmes permettant d’étudier les bases cérébrales
de la motivation et de ses troubles, en commençant
par les mécanismes les plus basiques pour aller vers
les plus sophistiqués.
Mots-clés
Points forts
»» Les neurosciences cognitives définissent la motivation comme un processus permettant aux récompenses
désirées d’activer et d’orienter le comportement.
»» Ces processus traitant des récompenses sont pris en charge par un système cérébral particulier, reliant cortex
orbitofrontal et structures limbiques sous-corticales.
»» Le champ émergent de la neuro-économie propose de nouveaux paradigmes pour caractériser les troubles de
la motivation en termes de sensibilité à l’effort, à la récompense, à la punition, au risque, au délai, etc.
»» Ainsi, certaines formes d’apathies liées à une atteinte des ganglions de la base s’expliquent par une perte de
sensibilité aux récompenses, et certains comportements compulsifs liés aux traitements dopaminergiques par un
gain de sensibilité aux récompenses.
Motivation et neuroscience :
bref historique
Les sciences cognitives ont émergé au milieu du
siècle dernier. Avant cela, la plupart des scientifiques se méfiaient des représentations mentales,
justement parce qu’elles n’étaient pas observables.
Le cerveau était considéré comme une boîte noire, et
les chercheurs se contentaient de décrire les entrées
et les sorties. L’étude du comportement animal
se résumait alors à la recherche de lois stimulusréponse, suivant le programme dit béhavioriste.
Un écueil majeur pour le béhavioriste est l’explosion combinatoire : lorsque plusieurs manipulations
peuvent générer plusieurs comportements, le nombre
de liens possibles devient vite astronomique. Par
exemple, la privation d’eau, une température élevée
ou une nourriture salée peuvent toutes conduire un
animal à boire davantage d’eau, à travailler plus pour
une gorgée, ou à consentir d’absorber des boissons
amères. Plutôt que de tracer tous les liens possibles, il paraît économique de relier les différentes
manipulations à la soif, puis la soif aux différents
comportements. La soif apparaît donc comme une
variable intermédiaire, une commodité de notation.
On peut considérer ces variables intermédiaires (par
exemple la soif, la faim, l’agressivité ou la libido), que
les Anglo-Saxons appellent drive, ce que nous traduirons par “besoin”, comme les premiers concepts
opérationnels de motivation.
Il revient aux béhavioristes d’avoir découvert que
certains stimuli influencent le comportement parce
qu’ils interviennent en conséquence d’une action,
ce que E.L. Thorndike a appelé la loi de l’effet. On
dit que ces stimuli renforcent le comportement, et
on les qualifie de récompenses (1). Ainsi, dans la
fameuse cage de Skinner, on récompense le rat par
de la nourriture chaque fois qu’il appuie sur la bonne
pédale, ce qui se produira de plus en plus souvent
au fil du temps. La dynamique du renforcement est
bien décrite par la loi de Rescorla et Wagner, selon
laquelle la vitesse d’apprentissage est proportionnelle à l’erreur de prédiction de la récompense, soit la
récompense obtenue moins la récompense attendue.
Si l’on obtient plus de récompenses que prévu, le
comportement va être renforcé ; si l’on en obtient
moins, il sera au contraire affaibli.
Mais pourquoi les récompenses ont-elles cette capacité de renforcer le comportement ? Parce qu’elles
viennent réduire le besoin. Et d’où vient le besoin ?
De la nécessité de maintenir certaines variables
internes à un niveau constant. Les récompenses font
alors partie intégrante d’un mécanisme de régulation
homéostatique, selon l’expression de W. Cannon. Ces
mécanismes fonctionnent sur le modèle du thermostat, qu’on peut appliquer au comportement
alimentaire. Pour maintenir les réserves d’énergie
disponible, l’organisme dispose d’indicateurs, par
exemple le taux de glucose sanguin. On a donc des
capteurs qui vont signaler les écarts entre les valeurs
mesurées et les valeurs de références, un gramme par
litre dans le cas de la glycémie. Ces signaux d’erreur
vont ensuite déclencher des mécanismes compensateurs, dont certains passent par le comportement,
par exemple, une hypoglycémie va pousser à la prise
alimentaire.
L’idée du besoin homéostatique est si élégante et
si intuitive que les recherches sur la motivation se
sont longtemps focalisées sur l’étude de points de
référence, de signaux d’erreur et de mécanismes
compensateurs. Cette théorie a pourtant été mise
à mal par de nombreuses observations, et elle a
progressivement été abandonnée (2). Il a d’abord
été objecté qu’une stabilité des variables internes
n’implique pas nécessairement l’existence d’une
régulation. Par exemple, un poids corporel stable ne
signifie pas qu’il existe un point de référence ni des
mécanismes régulateurs pour maintenir le poids au
niveau de référence. Il s’agit peut-être plutôt d’un
point d’équilibre entre systèmes antagonistes, les
uns favorisant l’amaigrissement et les autres la prise
de poids. Si l’obésité s’est répandue ces dernières
décennies aux États-Unis, ce n’est pas que le poids
de référence a changé, mais que la réclame a rendu
les aliments plus appétissants et disponibles. Ce
que l’on peut éprouver soi-même face à un bol de
cacahuètes salées : on n’en éprouvait pas le besoin
et pourtant on n’arrête pas d’en manger. Ainsi, la
prise alimentaire n’est pas forcément proportionnée
aux besoins, et les aspects hédoniques semblent
déterminants.
Ces remarques rejoignent d’autres observations montrant que les récompenses ne viennent
pas satisfaire un besoin mais donner du plaisir.
Apathie
Apprentissage
Compulsion
Cortex préfrontal
Dopamine
Ganglions de la base
Modèle computationnel
Motivation
Neuropsychologie
Summary
Patients with neurological
conditions can exhibit disorders where motivation is
either deficient (apathy) or
out of control (compulsion). At
first sight, it may seem uneasy
to tell whether the deficit
is primarily linked to brain
damage or secondary to motor
or cognitive disability. Cognitive neuro­s cience provides
conceptual and empirical tools
to explore the neural substrates
of motivational processes.
A large brain network, within
the prefrontal cortex and the
basal ganglia, has been implicated in representing expected
rewards so as to energise and
direct be­h aviour. Damage
to this network results in
primary motivational disorders, in which reward-seeking
behaviour specifically deviates
from normality. Depending on
the specific brain structure
impaired, motivational disorders can thus be characterised
in terms of sensitivity to effort,
reward, punishment, risk or
delay.
Keywords
Apathy
Learning
Compulsion
Prefrontal cortex
Dopamine
Basal ganglia
Computational model
Motivation
Neuropsychology
Functional neuroimaging
Decision making
Reward
La Lettre du Neurologue • Vol. XIII - n° 3 - mars 2009 | 71
mise au point
Motivation et récompense :
le point de vue des neurosciences cognitives
On cite souvent le cas d’un patient souffrant d’occlusion œsophagienne, et nourri directement par
sonde gastrique. Ce patient insistait pour passer
les aliments en bouche avant de les placer dans son
estomac. De même, des chiens nourris par intra­
veineuse continuent à ingérer la nourriture disponible et, de ce fait, prennent du poids. Ou encore,
les rats peuvent fournir de gros efforts pour obtenir
une solution de saccharine, qui ne peut pas être
digérée et donc utilisée comme source d’énergie
pour l’organisme. Tous ces exemples montrent que
la prise alimentaire n’est pas seulement une question
de régulation homéostatique. Dans bien des cas, si
les animaux mangent, ce n’est pas pour refaire leur
stock d’énergie, c’est parce qu’ils aiment ça.
D’ailleurs, si la théorie du besoin homéostatique
peut s’appliquer à la prise alimentaire, on voit mal
comment la généraliser à des récompenses moins
primaires, telle que la reconnaissance sociale ou le
sentiment d’avoir agi selon sa morale. En outre, l’acti­
vation d’un lien stimulus-réponse appris par renforcement paraît trop pauvre pour que l’on puisse parler
d’un comportement réellement motivé. L’intuition
veut qu’un comportement motivé s’accompagne
d’une certaine participation affective, sinon émotionnelle. Selon la distinction de K.C. Berridge (3), un
contexte associé à une récompense devient à la fois
apprécié sur le plan affectif (effet liking) et recherché
sur le plan comportemental (effet wanting). De plus,
le comportement doit être flexible : par exemple,
selon le contexte, le sujet doit pouvoir élaborer de
nouvelles stratégies pour obtenir sa récompense.
Enfin, et surtout, l’animal doit agir en vertu de la
récompense recherchée et non de façon automatique. On peut le vérifier en variant la valeur de la
récompense, par exemple en amenant l’animal à
satiété : si, en présence du stimulus, il reproduit
la réponse, alors il s’agissait d’un comportement
automatique ; s’il ne le fait pas, il s’agissait d’un
comportement dirigé vers un but.
Ainsi, alors que dans les premières conceptions
scientifiques de la motivation tout partait des
besoins internes, dans les conceptions plus actuelles
tout commence avec l’expérience hédonique des
récompenses. La motivation reste en partie liée aux
nécessités de la survie, dans la mesure où la valeur
hédonique dépend des besoins, par exemple de la
faim pour la nourriture, et plus généralement de
l’état de notre appareil cognitif. Les récompenses
évaluées positivement par notre appareil cognitif
seront à la fois appréciées et désirées, de même
que les éléments du contexte qui leur sont associés. Ainsi, par apprentissage associatif, la valeur
positive des récompenses se propage aux indices de
notre environnement qui les annoncent. Les indices
annonciateurs de récompense prennent alors une
valeur incitative : ils acquièrent le double pouvoir
d’orienter le comportement (vers l’alternative la
mieux récompensée) et d’augmenter son intensité
(lorsqu’il y a davantage de récompense en vue).
Cette théorie de la motivation peut être considérée
comme une réinterprétation cognitiviste des lois
béhavioristes. Elle offre beaucoup d’avantages pour
une approche expérimentale. Elle définit tout d’abord
ce qu’on doit chercher dans le cerveau : comment se
construit la représentation des buts (les récompenses
espérées), et comment ceux-ci peuvent activer et
orienter le comportement. Ensuite, elle indique
comment manipuler la motivation : en variant les
récompenses en jeu dans le contexte, on joue sur
leur représentation dans le cerveau. On dira que les
récompenses espérées sont les raisons du comportement, et que leurs représentations cérébrales en
sont les causes. Enfin, elle fournit une hypothèse
de travail, selon laquelle toute situation associée à
une expérience hédonique positive prendra le statut
de récompense (sera appréciée et désirée), qu’elle
soit primaire comme un repas ou plus secondaire
comme des applaudissements.
Quelques troubles de la motivation
bien caractérisés
La théorie a été féconde, y compris chez l’homme.
En particulier, l’hypothèse dite de la monnaie neuronale commune, selon laquelle différents types de
récompenses chez différents sujets sont représentés
par les mêmes régions cérébrales, a été largement
vérifiée (4-6). À tel point qu’on appelle système
de récompense les régions qui, chez la plupart des
individus, répondent aux récompenses et aux indices
qui les annoncent. Ces structures, qui donnent donc
une valeur aux éléments du contexte, comprennent
notamment le cortex orbitofrontal, le cortex cingulaire antérieur, l’amygdale et la partie ventrale des
ganglions de la base. Une même région (le striatum
ventral) peut représenter à la fois le plaisir de recevoir
une somme d’argent et celui de donner cette somme
à une œuvre de charité (7). L’argent est sans doute la
récompense la plus largement utilisée, d’abord pour
des raisons pratiques. Au-delà de l’universalité, il a
l’avantage de ne pas générer de satiété : les participants ont beau gagner de l’argent, ils continueront à
en empocher s’ils en ont l’occasion. Il offre aussi la
possibilité de quantifier dans une même métrique les
▶▶▶
72 | La Lettre du Neurologue • Vol. XIII - n° 3 - mars 2009 15:08:05
mise au point
▶▶▶
récompenses (gains monétaires) et leur contraire, les
punitions (pertes monétaires). Enfin l’utilisation de
l’argent a permis de croiser les paradigmes issus de
l’expérimentation animale avec les théories économiques de la décision. Ces théories présument que
l’on choisit l’option qui maximise la valeur attendue,
une notion qui peut être identifiée au concept de
récompense espérée.
Le processus motivationnel le plus basique est sans
doute l’énergisation du comportement en proportion
de la récompense espérée. Nous avons imaginé pour
l’étudier un test très simple (8) : on présente au sujet
une certaine somme d’argent, et on lui demande
de serrer la pince d’un dynamomètre, sachant que
plus il serre fort, plus grande sera la fraction de la
somme en jeu qu’il pourra mettre dans sa poche. En
moyenne, les sujets témoins produisent plus de force
lorsqu’il y a davantage d’argent en jeu, et cet effet
s’accompagne en IRM fonctionnelle d’une activation
des régions ventrales des ganglions de la base. Nous
avons donc testé des patients présentant des lésions
bilatérales des ganglions de la base et, sur le plan
clinique, un déficit d’autoactivation. Ce déficit se
caractérise par une sévère réduction des comportements spontanés, partiellement réversible via la
sollicitation d’un tiers (9). Les résultats montrent que
ces patients ne modulent pas leur force en fonction
de la récompense en jeu (figure 1). Pourtant, leur
réponse électrodermale, qui reflète les réactions
émotionnelles, est bien proportionnelle aux enjeux
monétaires. Tout se passe chez ces patients comme
si l’activation motrice (le wanting) était déconnectée
de l’évaluation affective (le liking). Chez les patients
déprimés, il n’y a pas de dissociation : la conductance
cutanée comme la force manuelle restent insensibles
aux récompenses proposées. Pour une même force
produite, ces patients ont l’impression de fournir
plus d’effort que les sujets témoins. Chez les sujets
sains, en effet, la sensation d’effort semble diminuée
par les récompenses promises : plus on est motivé,
moins on ressent l’effort.
Un second processus motivationnel concerne
l’orientation du comportement en fonction des
récompenses attendues. Au plus simple, il s’agit
de deux réponses motrices entre lesquelles le sujet
doit choisir. On peut associer les réponses à des
indices, dont le sujet doit apprendre la valeur par
essai et erreur, comme dans la cage de Skinner. Pour
que la tâche ne soit pas triviale, les associations entre
indices et récompenses sont en général probabilistes : certains indices font gagner (ou perdre) plus
souvent que d’autres. La loi de Rescorla et Wagner
est alors utile pour générer les valeurs théoriques
Figure 1. Caractérisation d’un cas d’apathie. Le patient présente un déficit d’auto­activation
consécutif à une lésion bilatérale du pallidum (IRM anatomique en haut à droite). Dans le
test d’effort sur instruction (colonne de gauche), le patient doit serrer la pince de façon
à faire monter le curseur jusqu’à la ligne rouge, placée suivant les conditions à 40, 80 ou
120 % de sa force maximale. Les résultats montrent la force produite en moyenne au cours
d’un essai. On voit que le patient, tout comme le sujet témoin, est capable de moduler
sa force en fonction de l’instruction. Dans le test d’effort sur incitation, on met en jeu
différentes sommes d’argent : 1, 10 ou 50 euros selon les conditions. On laisse le patient
libre de serrer la pince comme il le souhaite, mais on lui fait comprendre que plus il serre
fort, plus il gagnera d’argent. On voit que le patient ne module pas sa force (colonne du
milieu), contrairement au sujet témoin qui appuie plus fort et plus longtemps lorsqu’on
augmente les récompenses en jeu. Enfin, on vérifie que le patient différencie bien les
enjeux sur le plan affectif en mesurant la réponse électrodermale (colonne de droite).
Il ne s’agit donc ni d’un trouble purement moteur (le patient module sa force sur consigne)
ni d’un trouble purement affectif (le patient réagit aux récompenses proposées). On peut
conclure que, chez ce patient, la représentation des récompenses en jeu n’active plus le
comportement.
sur lesquelles est censée se fonder la décision des
sujets. L’IRM fonctionnelle a montré que ces valeurs
sont représentées essai après essai dans le striatum
ventral (10, 11). De plus, l’erreur de prédiction de
la récompense, qui selon cette loi guide l’apprentissage, est codée par les populations dopaminergiques du mésencéphale (12, 13). Il devenait donc
particulièrement intéressant d’étudier le comportement des patients parkinsoniens dans ce type de
tâche. Il apparaît dans l’étude de M.J. Frank et al.,
que lorsqu’ils sont sans traitement, ces patients
apprennent mieux sous renforcement négatif (au
bâton) que sous renforcement positif (à la carotte),
alors qu’ils présentent les performances inverses
La Lettre du Neurologue • Vol. XIII - n° 3 - mars 2009 | 75
mise au point
Motivation et récompense :
le point de vue des neurosciences cognitives
Figure 2. Le modèle acteur-critique. Le schéma représente une implémentation possible
d’un modèle computationnel permettant de rendre compte à la fois des données d’imagerie
et du comportement des sujets dans une tâche d’apprentissage instrumental. Il y a deux
systèmes d’apprentissage, l’un fondé sur le critique et l’autre sur l’acteur, qui vont extraire
différentes dimensions du contexte, représenté dans le cortex. Le critique, représenté par
le striatum ventral, prédit la quantité de récompense qu’on peut attendre dans le contexte.
L’acteur, représenté par le putamen, va sélectionner l’action pour laquelle la prédiction est
maximale, via les sorties des ganglions de la base (globus pallidus interne et substance noire
réticulée). Lorsque le résultat de l’action est connu, les neurones dopaminergiques de la
substance noire compacte et de l’aire tegmentale ventrale vont calculer la différence entre
la récompense prédite par le critique et la récompense réellement obtenue. Ils renvoient
cette différence, c’est-à-dire l’erreur de prédiction de la récompense (δ), vers le critique
pour qu’il améliore sa prédiction, et vers l’acteur pour qu’il améliore sa sélection. Sur le
plan mathématique, les valeurs du contexte et de l’action sont mises à jour en proportion
de l’erreur de prédiction, selon la loi de Rescorla et Wagner. Sur le plan neuronal, il s’agit
de modifier le poids des synapses cortico-striatales, pour faciliter un choix optimal si le
même contexte se représente. Dans un environnement stable (dont les contingences ne
changent pas), le système nigro-striatal va ainsi optimiser ses prédictions et ses choix
jusqu’à ce que l’erreur devienne nulle.
lorsqu’ils sont traités par L-dopa (14). Pour expliquer ce résultat, M.J. Frank et al. ont proposé une
variante du modèle acteur-critique représenté sur
la figure 2, qui implémente la loi de Rescorla et
Wagner au sein des circuits striato-frontaux. Selon
ce modèle, la décharge de dopamine (lorsqu’il y a
76 | La Lettre du Neurologue • Vol. XIII - n° 3 - mars 2009 plus de récompense que prévu) renforce les circuits
d’approche, tandis que la dépression en dopamine
(lorsqu’il y a moins de récompense que prévu)
renforce les circuits d’évitement. Il est possible que
ce modèle explique les comportements compulsifs,
notamment le jeu pathologique, observés chez les
patients sous agonistes dopaminergiques. L’idée
serait que le médicament crée un déséquilibre, de
sorte que les récompenses renforcent davantage le
comportement que les punitions ne l’affaiblissent.
Ainsi, les paradigmes d’incitation à l’effort ou
au choix simple mobilisent principalement les
ganglions de la base (striatum ventral, pallidum
ventral et dopamine). C’est encore le cas lorsque
l’on masque les indices annonçant les récompenses,
de façon que leur perception reste subconsciente
(15, 16). Les sujets peuvent alors être amenés,
même lorsqu’ils ne perçoivent pas consciemment
les enjeux, à produire plus d’effort pour plus de
récompense (motivation subliminale), ou à choisir
l’option la mieux récompensée (apprentissage
subliminal). Ces paradigmes subliminaux permettent de tester l’intégrité de processus motivationnels basiques sans brouiller les résultats par
l’intervention de rationalisations conscientes qui
peuvent être altérées chez le patient. On a ainsi
pu mettre en évidence dans la maladie de Gilles
de la Tourette une double dissociation, en miroir
de celle observée dans la maladie de Parkinson,
avec un meilleur apprentissage par renforcement
positif lorsque les patients ne sont pas traités, et
par renforcement négatif lorsqu’ils sont traités par
des neuroleptiques.
Dans une certaine mesure, les atteintes des territoires
corticaux (orbitofrontal et cingulaire antérieur), qui
forment avec les régions ventrales des ganglions de
la base des circuits fonctionnels, affectent également les fonctions motivationnelles rudimentaires.
Mais ces territoires semblent intervenir plus spécifiquement lorsqu’il faut apprendre ou inverser des
règles associatives plus complexes, et lorsque
les récompenses sont différées dans le temps.
A.R. Damasio a appelé “myopie du futur” la forme
d’impulsivité qui consiste à rechercher les récompenses à court terme au détriment des conséquences
négatives à long terme. Elle s’observe notamment
en cas de lésions du cortex préfrontal ventromédian,
qui empêcheraient les patients d’évoquer par antici­
pation les marqueurs somatiques associés aux conséquences de leurs choix (17, 18). Mais la gambling task
utilisée pour la démonstration confond en fait de
nombreux phénomènes tels que l’apprentissage par
renforcement, l’extraction de règle, la recherche
mise au point
du risque, la sensibilité aux gains par rapport aux
pertes, etc. Les nouveaux paradigmes, élaborés
dans le champ émergeant de la neuro-économie,
sont beaucoup plus spécifiques et commencent à
décortiquer ces processus complexes. Par exemple,
dans une tâche où il faut choisir entre deux roues
de la fortune, il a été montré que c’est la peur de
regretter (d’avoir choisi la mauvaise), exprimée au
niveau du cortex orbitofrontal, qui guide les choix
des sujets sains (19). Les patients atteints de lésions
orbitofrontales se comportent différemment des
sujets témoins parce qu’ils n’éprouvent pas, et donc
n’anticipent pas, de regret (20). Ainsi les régions
préfrontales, peut-être en lien avec les structures
temporales internes, semblent nécessaires pour
évaluer les récompenses ou les punitions associées
à des épisodes futurs.
Conclusion
De nombreuses situations cliniques font apparaître la motivation comme déficiente (syndromes
apathiques) ou incontrôlable (troubles compulsifs).
Ces situations peuvent être liées à des lésions
ponctuelles, notamment du cortex orbitofrontal
ou des ganglions de la base, ou dégénératives,
comme dans la maladie de Parkinson ou la démence
fronto-temporale. Elles peuvent aussi être dues aux
traitements, comme les drogues dopaminergiques
ou la stimulation cérébrale profonde. Il ne paraît pas
évident au premier abord de distinguer un déficit
primaire d’une conséquence secondaire au handicap
moteur ou cognitif. Les neurosciences cognitives ont
proposé des concepts et des paradigmes permettant de caractériser les troubles primaires liés à
des perturbations spécifiques du système cérébral
traitant des récompenses. Leur rencontre avec les
théories économiques a permis de définir une
norme de rationalité : le comportement rationnel
est celui qui apporte le plus de récompense. On
peut alors décrire les troubles comme des déviations par rapport à cette norme, par exemple en
termes de sensibilité à l’effort, à la récompense, à la
punition, au risque ou au délai. À cet égard, l’apport
des modèles computationnels paraît particulièrement prometteur pour une meilleure compréhension des mécanismes sous-jacents aux troubles de
la motivation.
◼
Références bibliographiques
1. Schultz W. Behavioral theories and the neurophysiology
of reward. Annu Rev Psychol 2006;57:87-115.
2. Berridge KC. Motivation concepts in behavioral neuroscience. Physiol Behav 2004;81:179-209.
3. Berridge KC, Robinson TE. Parsing reward. Trends Neurosci
2003;26:507-13.
4. McClure SM, York MK, Montague PR. The neural substrates of reward processing in humans: the modern role of
FMRI. Neuroscientist 2004;10:260-8.
5. O’Doherty JP. Reward representations and reward-related
learning in the human brain: insights from neuroimaging.
Curr Opin Neurobiol 2004;14:769-76.
6. Knutson B, Cooper JC. Functional magnetic resonance imaging
of reward prediction. Curr Opin Neurol 2005;18:411-7.
7. Harbaugh WT, Mayr U, Burghart DR. Neural responses to
taxation and voluntary giving reveal motives for charitable
donations. Science 2007;316:1622-5.
8. Schmidt L, d’Arc BF, Lafargue G et al. Disconnecting force
from money: effects of basal ganglia damage on incentive
motivation. Brain 2008;131:1303-10.
9. Laplane D, Dubois B. Auto-activation deficit: a basal
ganglia related syndrome. Mov Disord 2001;16:810-4.
10. O’Doherty J, Dayan P, Schultz J et al. Dissociable roles
of ventral and dorsal striatum in instrumental conditioning.
Science 2004;304:452-4.
11. Pessiglione M, Seymour B, Flandin G et al. Dopaminedependent prediction errors underpin reward-seeking behaviour in humans. Nature 2006;442:1042-5.
12. Schultz W, Dayan P, Montague PR. A neural substrate of
prediction and reward. Science 1997;275:1593-9.
13. Waelti P, Dickinson A, Schultz W. Dopamine responses
comply with basic assumptions of formal learning theory.
Nature 2001;412:43-8.
14. Frank MJ, Seeberger LC, O’Reilly RC. By carrot or by
stick: cognitive reinforcement learning in parkinsonism.
Science 2004;306:1940-3.
15. Pessiglione M, Petrovic P, Daunizeau J et al. Subliminal
instrumental conditioning demonstrated in the human brain.
Neuron 2008;59:561-7.
16. Pessiglione M, Schmidt L, Draganski B et al. How the
brain translates money into force: a neuroimaging study of
subliminal motivation. Science 2007;316:904-6.
17. Bechara A, Damasio H, Tranel D, Damasio AR. Deciding
advantageously before knowing the advantageous strategy.
Science 1997;275:1293-5.
18. Bechara A, Damasio H, Tranel D, Damasio AR. The Iowa
Gambling Task and the somatic marker hypothesis: some
questions and answers. Trends Cogn Sci 2005;9:159-62;
discussion 162-4.
19. Coricelli G, Critchley HD, Joffily M et al. Regret and its
avoidance: a neuroimaging study of choice behavior. Nat
Neurosci 2005;8:1255-62.
20. Camille N, Coricelli G, Sallet J et al. The involvement of
the orbitofrontal cortex in the experience of regret. Science
2004;304:1167-70.
La Lettre du Neurologue • Vol. XIII - n° 3 - mars 2009 | 77
Téléchargement