Un modèle de codage prédictif par populations de neurones

publicité
COGMASTER 2009-2010
Un modèle de codage prédictif par populations
de neurones appliqué à la réponse à la
nouveauté du cortex auditif primaire
Mémoire de Master 2
Catherine Wacongne – Sous la direction de Stanislas Dehaene
04/06/2010
Unité de Neuroimagerie Cognitive – CEA/INSERM
Sommaire
Sommaire ................................................................................................................................................ 2
1.
2.
3.
Introduction .................................................................................................................................... 3
1.1.
Données expérimentales sur la MMN ..................................................................................... 5
1.2.
Cadre théorique....................................................................................................................... 7
Matériel et Méthodes..................................................................................................................... 9
2.1.
Choix du type de modèle ......................................................................................................... 9
2.2.
Organisation du réseau ......................................................................................................... 11
2.3.
Règles de plasticité ................................................................................................................ 14
2.4.
Implémentation du réseau .................................................................................................... 16
2.5.
Séquences test des simulations. ........................................................................................... 17
Résultats........................................................................................................................................ 17
3.1.
Paradigme local/global .......................................................................................................... 17
3.1.1.
Contexte AAAAA ............................................................................................................ 17
3.1.2.
Contexte AAAAB ............................................................................................................ 24
3.2.
Séquences alternées.............................................................................................................. 25
3.2.1.
3.3.
4.
Contexte ABABA ............................................................................................................ 26
Paradigme Oddball ................................................................................................................ 29
Discussion et perspectives............................................................................................................ 30
Bilan ................................................................................................................................................... 30
Confrontation avec les données expérimentales .............................................................................. 30
Prédictions et test du modèle ........................................................................................................... 32
Limites et extensions possibles du modèle ....................................................................................... 34
ANNEXES ............................................................................................................................................... 36
2
1. Introduction
Reconnaitre un organisme conscient est un challenge non résolu. Lorsque nous tentons d’évaluer
l’état de conscience des êtres humains qui nous entourent, nous nous basons essentiellement sur le
rapport subjectif qu’ils sont capable de faire. Si une personne est capable de communiquer le fait
qu’elle se sent subjectivement consciente, dans un contexte où il est improbable que cette réponse
soit due au hasard, nous admettons que cette personne est consciente. Lorsque des patients perdent
la capacité de communiquer avec l’extérieur, poser la question de l’état de conscience devient
complexe. Malgré tout, ce diagnostique est crucial pour adapter la prise en charge clinique des
patients en état apparemment végétatif. Récemment, ce problème a reçu une attention particulière
de la part des cliniciens, qui commencent à exploiter l’imagerie fonctionnelle, en particulier l’IRM
fonctionnelle, comme interface de communication avec des patients potentiellement conscients
mais prisonniers de leur corps [1]. Si ces méthodes ont permis d’obtenir des résultats spectaculaires
sur quelques cas, elles souffrent de divers inconvénients. D’une part les protocoles IRM sont couteux
et complexes à mettre en place de façon systématique, d’autre part, les méthodes utilisées
demandent que le patient maintienne une imagerie mentale sur de longues périodes, ce qui requiert
une attention soutenue. Il est possible que des patients dont les états de conscience sont fluctuants,
appelés patients minimalement conscients, passent au travers de telles méthodes. Il serait donc
souhaitable de développer des techniques plus théoriquement fondées et utilisant des méthodes
moins couteuses et plus simple d’implémentation. Une telle approche permet un enrichissement
mutuel de la clinique par la recherche et vice versa.
Dans cette perspective Bekinstein et al.[2] ont développé un protocole auditif passif utilisant des
enregistrements MEG/EEG aisément applicable à des patients. Des données de la littérature
montrent qu’il existe deux types de réponses évoquées par un son inattendu [3] : une réponse
précoce à la déviance dans un flux régulier (connu dans la littérature sous le nom de MMN) et le
complexe P300. La MMN a plutôt été associée à une réponse pré attentionnelle automatique et
inconsciente [4] alors que la composante tardive de la P300 (P3b) est considérée comme un indice du
rafraichissement de la mémoire de travail et associée à l’accès conscient. Partant de ces données, le
protocole mis en place teste l’hypothèse que différents types de déviance affecteront différemment
les deux réponses évoquées.
Le protocole (Figure 1), auquel on fera référence par la suite sous le nom de « local/global », consiste
en l’écoute passive de stimuli sonores, il ne nécessite donc pas de concentration particulière. Les
sujets entendent des groupes de 5 sons, pouvant appartenir à 2 catégories : soit les 5 sons sont
identiques (XXXXX), soit seuls les 4 premiers sont identiques et le dernier diffère (XXXXY). Dans ce cas
le dernier son représente une violation de la règle locale de répétition établie par les premiers sons.
Le sujet entend ces groupes de sons au sein d’un bloc de quelques minutes au cours duquel une des
catégories est majoritairement représentée : 25 groupes de la catégorie dominante fixent la « règle »
en début de bloc. Une centaine de groupes de 5 sons sont présentés ensuite, dont 20% de groupes
appartenant à l’autre catégorie. Ces groupes constituent une déviance à la règle globale. Un déviant
à la règle locale peut ainsi se trouver être la séquence globalement régulière. La déviance est dans ce
cas parfaitement prédictible.
3
Figure 1: design expérimental du protocole développé par Bekinstein et al.
L’analyse des résultats montre que les deux types de déviance évoquent deux types de réponses
différentes. La déviance à la règle locale évoque une composante précoce, 150 ms environ après le
début du dernier son. Cette composante est bien connue dans la littérature sous le nom de
Mismatch negativity (MMN). La déviance à la règle globale évoque une réponse plus tardive sous
forme d’une P300. De façon intéressante, alors que la mismatch negativity est peu affectée par les
états de conscience des sujets ou leur état d’attention, la P3 est très diminuée chez les sujets ne
portant pas attention au stimulus, et disparait complètement chez les patients végétatifs.
Ce paradigme fournit donc une dissociation entre 2 niveaux de traitement : un niveau
« automatique » peu dépendant des ressources attentionnelles, apparemment local dans le temps ;
et un niveau conscient capable de coder pour des régularités de plus haut niveau.
Afin de mieux comprendre la spécificité du niveau conscient, on souhaite développer un modèle
neuronal biologiquement plausible permettant de rendre compte de ces effets. Dans un premier
temps on s’intéressera au niveau « automatique » afin de mieux comprendre ses capacités et la
nature de l’information codée.
De façon surprenante, malgré une littérature plus qu’abondante, il n’existe pas de consensus
théorique sur la façon dont la MMN est générée ou même sur sa signification computationnelle
[5][6].
Après une revue des principales données expérimentales de la littérature contraignant le modèle,
ainsi que des principales pistes théoriques pertinentes, nous proposerons un modèle possible de la
mismatch negativity à l’échelle locale et en discuterons les performances.
4
1.1.Données expérimentales sur la MMN
Le terme mismatch negativity a été introduit en 1978 par Näätänen et al.[7] pour décrire une
composante des potentiels évoqués (ERP) décrite auparavant par Squires [8] produite par un
changement dans le flux de stimuli. Cette composante n’est apparemment pas spécifique de la
modalité auditive car des analogues on pu être décrites dans la modalité somato-sensorielle [9],
olfactive [10] et visuelle [11]. L’immense majorité de la littérature sur la MMN reste cependant
concentrée sur la modalité auditive.
Effet1 : MMN à la déviance dans un flux de sons purs répétés à intervalles réguliers
Dans le paradigme dit « oddball » un stimulus auditif est répété à intervalle régulier (le standard). De
façon rare, un son de fréquence, d’amplitude, de durée différente est présenté : c’est un déviant. La
MMN est la composante négative obtenue de façon reproductive en soustrayant les ERP produits
par un stimulus donnée entre la condition ou il est en position de déviant et celle où il est en position
de standard. De façon générale, on trouve une mismatch negativity significative entre 100 et 200 ms
après le début du stimulus déviant.
Effet2 : Sensibilité de l’amplitude de la MMN à la fréquence du déviant
L’amplitude de la mismatch negativity varie en fonction de la magnitude de la différence physique
entre le standard et le déviant : si le déviant est un son pur d’une fréquence différente mais proche
du standard, l’amplitude de la mismatch est proportionnelle à l’écart entre les fréquences des deux
sons. Pour des fréquences suffisamment différentes, l’amplitude de la mismatch est constante.
L’amplitude de la mismatch varie également avec la probabilité d’occurrence du son déviant. Dans un
paradigme oddball, une étude [12] a pu montrer que l’amplitude de la mismatch augmente quand la
différence entre les probabilités d’occurrence du standard et du déviant augmente (Figure 2).
Figure 2 : Mismatch negativity (déviant-standard) en fonction de la fréquence du déviant dans un paradigme oddball.
Repris de Sato et al.
Effet3 : MMN à la répétition dans un signal alterné
La mismatch negativity est cependant sensible à des relations plus complexes que la simple
fréquence relative des stimuli. Dans un signal alterné (ABABA… ) la répétition d’un élément
(ABABABBABABA..) évoque une MMN [13].
5
Effet4 : MMN à l’omission d’un son attendu
En outre, plusieurs études ont pu montrer l’existence d’une MMN à l’omission [14]. Cette MMN est
décrite en cas d’interruption de séquences régulières longues telles qu’une séquence oddball, mais
aussi pour l’omission d’un son attendu dans des séquences courtes répétées. Par exemple, si on
présente régulièrement des paires de sons identiques, en omettant de façon rare le second son, le
déviant est un son isolé. On peut comparer la réponse au déviant à la réponse au même son présenté
de façon isolée dans un bloc contrôle. On observe que les deux réponses à ce même stimulus sont
très différentes : la réponse au son isolé dans le conteste ou une paire est attendue est plus proche
de la réponse à la paire que de la réponse au son isolé en condition contrôle [15]. Cette observation
va à l’encontre d’une théorie purement feedforward de la réponse auditive.
Effet5 : insensibilité à la prédictibilité du déviant local dans le paradigme « Local/Global »
Dans le paradigme développé par Bekinstein et al, on observe qu’une MMN est évoquée pour un son
différent après 4 sons identiques même si le son déviant est parfaitement prédictible dans le
contexte global.(Figure 3, haut)
Effet Local
Effet Global
Figure 3 : ERP des effets local et global au niveau de l’électrode Fz. On peut identifier les pics de réponse aux 5 sons avec
une différence entre le standard et le déviant local sur le 5ème son indépendamment du contexte (significative sur une
autre électrode). On peut également observer un effet de la déviance globale (bas) sur la réponse précoce (significative
sur des données MEG non publiées)
Effet6 : localisation électrophysiologiques des sources de courants de la MMN
Les données électrophysiologiques de l’équivalent animal de la mismatch negativity sont rares. On
dispose cependant de quelques études chez le singe où des électrodes placées dans le cortex auditif
primaire (A1) permettent de décomposer les sources de courant en fonction des couches corticales
[16] (Figure 4). Ces études montrent que la plus grande partie de la différence entre la réponse au
standard et la réponse au déviant provient essentiellement des couches supragranulaires.
Effet7 : Sensibilité de la MMN aux inhibiteurs des récepteurs NMDA
Cette étude montre également que l’injection au site d’enregistrement d’un inhibiteur non
compétitif des récepteurs NMDA (le PCP) affecte peu la réponse au standard, et supprime la
différence entre la réponse au standard et la réponse au déviant. La mismatch semble donc
dépendre crucialement d’un signal dépendant de récepteurs NMDA.
6
Figure 4 : Profile « Current Source Density » (CSD) dans le cortex auditif primaire du singe en réponse à un stimulus
standard (haut) ou déviant (centre) dans le cadre d'un paradigme oddball. Différence de ces deux profiles (bas). A droite,
effet de la phéncyclidine (PCP - inhibiteur non compétitif des récepteurs NMDA) injectée localement sur ces profils.
1.2. Cadre théorique
Malgré la littérature abondante sur la MMN, aucune théorie n’est parvenue à s’imposer pour rendre
compte de la génération de la mismatch negativity. Cependant, différentes théories ont été
proposées.
Modèle adaptatif
La théorie la plus simple est celle de l’habituation synaptique. Le phénomène d’adaptation ou
d’habituation synaptique est largement décrit dans la littérature : lorsque la même synapse est
stimulée de façon répétée, les potentiels post synaptiques sont souvent de plus en plus réduits. La
réponse maximale est récupérée avec une constante de temps variant d’une à une vingtaine de
secondes. Ainsi, la fraction des neurones du cortex primaire qui répondent au stimulus standard
subit une adaptation synaptique qui engendre l’amoindrissement de la réponse. La fraction de
neurones qui répondent seulement au déviant ne subit pas cette adaptation et produit donc une
réponse de plus forte amplitude que la réponse au standard. Cette théorie dans sa forme la plus
simple permet de rendre aisément compte de l’effet de la fréquence du déviant sur l’amplitude de la
mismatch, car l’adaptation synaptique spécifique au déviant est d’autant plus forte en moyenne que
le déviant est fréquent. Il est plus difficile de rendre compte de la mimsatch à la répétition dans un
signal alterné ou de la réponse à l’omission. May et al. défendent cependant que la plupart de ces
7
effets peuvent être modélisés par un modèle d’adaptation à condition de supposer l’existence de
neurones codant pour des propriétés plus complexes qu’une simple tonotopie et de prendre en
compte le caractère dynamique du système. Par exemple, si un neurone répond spécifiquement
non seulement à une fréquence sonore mais aussi à un certain ISI dans la présentation des sons,
l’effet de mismatch à la répétition est rendu car la répétition implique une stimulation des neurones
répondant à la fréquence d’un des 2 sons pour un ISI égal à la moitié de l’ISI « adapté » et engendre
donc une réponse plus importante. L’interprétation de chaque phénomène requiert cependant
l’existence de neurones codant pour une propriété spécifique du stimulus (sens de la variation,
longueur de la séquence de stimulation…).
Modèle basé sur une mémoire du passé (« memory based model »)
La théorie qui prévaut dans la littérature est le « memory based model ». Ce modèle suppose que la
MMNest générée de façon spécifique par un comparateur entre une mémoire du stimulus et les
entrées sensorielles. Si les entrées sensorielles ne sont pas conformes aux régularités de la mémoire,
le comparateur émet un signal : la MMN. Ce modèle n’est cependant pas implémenté de façon
convaincante dans un réseau neurocomputationel réaliste. Il ne précise pas de quelle façon, ni sur
quelle durée les entrées sont conservées en mémoire, ni comment la comparaison s’effectuerait.
L’un des arguments majeurs de cette théorie est l’apparente dissociation des sources générant la N1
et la MMN. Ce point a cependant été remis en question depuis quelques années[17] : la N1
comprendrait 2 sources qui seraient altérées de façon différentes par les stimuli précédents. Cela
déplacerait le centre de gravité apparent de la source menant à la conclusion erronée qu’il existerait
2 sources distinctes.
Codage prédictif (« predictive coding »)
Depuis une décennie, l’hypothèse du codage prédictif(Figure 5) connait un succès grandissant. Cette
approche du fonctionnement du cerveau postule que le système apprend les régularités statistiques
du monde et utilise cette information pour signaler aux niveaux supérieurs de traitement les
déviations de ces régularités, c'est-à-dire les éléments non prédictibles du signal qui contiennent des
informations nouvelles par rapport à ce que le système est capable d’anticiper. Cette théorie rompt
avec une tradition psychophysique consistant à considérer le cerveau comme un organe passif
réagissant à des stimulations extérieures et postule au contraire que le cerveau émet en permanence
des prédictions actives quant aux entrées attendues. Elle a été appliquée avec succès par Rao et
Ballard [18] à la modélisation des champs récepteurs du cortex visuel primaire pour en expliquer
certaines propriétés.
Figure 5 : schéma du principe de codage prédictif. Repris de Rao et Ballard, 1999
Cette théorie a été reprise dans un cadre plus général par Karl Friston[19]. Il explore l’hypothèse que
de manière générale tout organisme biologique tend vers une optimisation de son énergie libre[20].
Le principe de codage prédictif découlerait mathématiquement de ce principe plus général. Ne coder
8
que les éléments surprenants est le mode de codage le plus économique de l’information. Friston
propose d’interpréter la MMN en termes d’erreur de prédiction dans un cadre Bayésien : par une
modification des connections plastiques venant de projections descendantes ou latérales, le système
apprendrait à minimiser son énergie libre en prédisant mieux le stimulus. Une hypothèse forte de la
théorie fristonienne est que le système biologique est optimal et peut être décrit de façon
mathématique en développant les conséquences logiques de ce principe général.
Nous choisissons au contraire ici de partir des données empiriques et de construire un modèle tenant
compte des contraintes biologiques en termes de courants synaptiques et de plasticité.
2. Matériel et Méthodes
2.1.Choix du type de modèle
Notre but est de développer un modèle aussi simple que possible mais biologiquement plausible de
la mismatch. Pour approximer au mieux les dynamiques des courants synaptiques, et de la
dynamique de membrane des neurones on choisit un modèle de spiking neurones. Les équations
développées par Izhikevich[21] permettent d’approximer au mieux les dynamiques de membrane de
différents types de neurones à moindre coût computationnel. Ces équations sont issues de l’étude
des équations d’Hodgkin-Huxley dans la théorie des bifurcations et permettent de rendre compte
d’un grand nombre de comportements physiologiques données par ces équations avec un système à
2 dimensions obéissant aux équations différentielles suivantes :
𝑑𝑣
= 0.04𝑣 2 + 5𝑣 + 140 𝑢 + 𝐼𝑠𝑦𝑛
𝑑𝑡
𝑑𝑢
= 𝑎(𝑏𝑣 − 𝑢)
𝑑𝑡
Avec une réinitialisation après chaque spike :
𝑠𝑖 𝑣 ≥ 30 𝑚𝑉 𝑎𝑙𝑜𝑟𝑠
𝑣 ←𝑐
𝑢 ←𝑢+𝑑
Où 𝑣 et 𝑢 sont des variables sans dimension : 𝑣 représente le potentiel de membrane du neurone et
𝑢 est un paramètre de récupération de la membrane qui rend compte de l’activation des canaux
ioniques sélectifs au 𝐾 + et de l’inactivation des canaux ioniques sélectifs au 𝑁𝑎+ . 𝑎, 𝑏, 𝑐 𝑒𝑡 𝑑 sont
des paramètres sans dimension, qui permettent de rendre compte des divers types de
comportement de neurones observés électrophysiologiquement. 𝑎 décrit l’échelle de temps de la
variable de récupération. 𝑏 décrit la sensibilité de la variable de récupération aux fluctuations sous le
seuil. 𝑐 décrit la valeur auquel le potentiel est réinitialisé après un spike, et 𝑑 décrit la valeur ajoutée
au paramètre de récupération après un spike. Pour notre modèle on utilise deux types de neurones :

des neurones excitateurs en utilisant des paramètres correspondant à des neurones de type
𝑎 = 0.02
𝑏 = 0.2 + 0.04 𝑟𝑎𝑛𝑑 2
« Regular spiking » :
𝑐 = −65 + 10 𝑟𝑎𝑛𝑑 2
𝑑 = 8 − 2 𝑟𝑎𝑛𝑑 2
9

des neurones inhibiteurs en utilisant des paramètres décrivant le comportement de
𝑎 = 0.06 + 0.04 𝑟𝑎𝑛𝑑 2
𝑏 = 0.2
neurones de type « fast spiking » :
𝑐 = −65
𝑑=2
On ajoute une variabilité aux paramètres afin d’obtenir des comportements moins stéréotypés et
plus physiologiques.
Pour modéliser les courants post synaptiques, on se base sur le modèle développé par Brunel et
Wang[22]. On modélise des courants excitateurs glutamatergiques médiés par des récepteurs AMPA
(𝐼𝐴𝑀𝑃𝐴 ) ou NMDA (𝐼𝑁𝑀𝐷𝐴 ). On ne modélise qu’un seul type de courant GABAergique (𝐼𝐺𝐴𝐵𝐴 ). Le total
des entrées synamptiques à un instant t est donné par :
𝐼𝑠𝑦𝑛 𝑡 = 𝐼𝐴𝑀𝑃𝐴 𝑡 + 𝐼𝑁𝑀𝐷𝐴 𝑡 + 𝐼𝐺𝐴𝐵𝐴 𝑡 + 𝐼𝑒𝑥𝑡 (𝑡)
Où 𝐼𝑒𝑥𝑡 est un courant additionnel représentant les entrées provenant de l’extérieur du réseau
modélisé. Tous les neurones sont soumis à un certain niveau de « bruit blanc» de moyenne nulle
mais d’amplitude variable. Les neurones représentant les sorties thalamiques reçoivent en plus un
courant positif constant de la durée des entrées. Les autres courants sont calculés comme suit :
𝐶𝐸
𝑤𝑗𝐴𝑀𝑃𝐴 𝑠𝑗𝐴𝑀𝑃𝐴 (𝑡)
𝐼𝐴𝑀𝑃𝐴 (𝑡) = 𝑔𝐴𝑀𝑃𝐴 𝑉 𝑡 − 𝑉𝐸
𝑗 =1
𝐼𝑁𝑀𝐷𝐴 (𝑡) =
𝐶𝐸
𝑔𝑁𝑀𝐷𝐴 𝑉 𝑡 − 𝑉𝐸
1 + 𝑀𝑔2+ 𝑒𝑥𝑝 −0.062 𝑉(𝑡)/3.57
𝑤𝑗𝑁𝑀𝐷𝐴 𝑠𝑗𝑁𝑀𝐷𝐴 (𝑡)
×
𝑗 =1
𝐶𝐼
𝑤𝑗𝐺𝐴𝐵𝐴 𝑠𝑗𝐺𝐴𝐵𝐴 (𝑡)
𝐼𝐺𝐴𝐵𝐴 (𝑡) = 𝑔𝐺𝐴𝐵𝐴 𝑉 𝑡 − 𝑉𝐼
𝑗 =1
Où 𝑉𝐸 = 40𝑚𝑉 et 𝑉𝐼 = −80𝑚𝑉. Les poids 𝑤𝑗 sont sans dimension et représentent la structure des
connections entre les neurones du réseau modélisé. Les courants NMDA ont une dépendance au
voltage contrôlée par la concentration en magnésium extracellulaire[23]. On prend 𝑀𝑔2+ = 1𝑚𝑀.
Les conductances sont adaptées de Wang et al. pour obtenir l’excitabilité désirée en utilisant les
équations d’Izhikevich. Pour les neurones excitateurs on prend 𝑔𝐴𝑀𝑃𝐴 = 0.3 , 𝑔𝑁𝑀𝐷𝐴 = 0.08,
𝑔𝐺𝐴𝐵𝐴 = 0.3. Pour les neurones inhibiteurs on a 𝑔𝐴𝑀𝑃𝐴 = 0.2, 𝑔𝑁𝑀𝐷𝐴 = 0.065, 𝑔𝐺𝐴𝐵𝐴 = 0.2.
𝑠𝑗 décrit la fraction des canaux ouverts à chaque synapse. Pour les courants AMPA elle suit la
dynamique:
𝑑𝑠𝑗𝐴𝑀𝑃𝐴 𝑡
𝑑𝑡
=
𝑠𝑗𝐴𝑀𝑃𝐴 (𝑡)
𝜏𝐴𝑀𝑃𝐴
𝛿 𝑡 − 𝑡𝑗𝑘
+
𝑘
Où le temps de décroissance des courants AMPA, 𝜏𝐴𝑀𝑃𝐴 = 2𝑚𝑠 et la somme sur k représente la
somme sur les spikes provenant des neurones présynaptiques à l’instant t.
10
La fraction de canaux ouverts aux synapses NMDA est décrite par :
𝑑𝑠𝑗𝑁𝑀𝐷𝐴 𝑡
𝑑𝑡
=
𝑠𝑗𝑁𝑀𝐷𝐴 (𝑡)
𝜏𝑁𝑀𝐷𝐴 ,𝑑𝑒𝑐𝑎𝑦
+ 𝛼𝑥𝑗 𝑡 1 − 𝑠𝑗𝑁𝑀𝐷𝐴 (𝑡)
𝑑𝑥𝑗 𝑡
𝑥𝑗 𝑡
=
+
𝑑𝑡
𝜏𝑁𝑀𝐷𝐴 ,𝑟𝑖𝑠𝑒
𝛿 𝑡 − 𝑡𝑗𝑘
𝑘
Où le temps de décroissance des courants NMDA est 𝜏𝑁𝑀𝐷𝐴 ,𝑑𝑒𝑐𝑎𝑦 = 100 𝑚𝑠, 𝛼 = 0.5 𝑚𝑠 −1 et
𝜏𝑁𝑀𝐷𝐴 ,𝑟𝑖𝑠𝑒 = 2 𝑚𝑠.
Enfin, la variable synaptique GABA suit la dynamique :
𝑑𝑠𝑗𝐺𝐴𝐵𝐴 𝑡
𝑑𝑡
=
𝑠𝑗𝐺𝐴𝐵𝐴 (𝑡)
𝜏𝐺𝐴𝐵𝐴
𝛿 𝑡 − 𝑡𝑗𝑘
+
𝑘
Où le temps de décroissance des courants GABA est 𝜏𝐺𝐴𝐵𝐴 = 10 𝑚𝑠 . On néglige le temps de montée
des courants GABA et AMPA qui sont tous les deux très cours (inférieurs à une milliseconde, qui est
notre pas de temps de simulation).
Toutes les simulations sont exécutées par un ensemble de fonctions écrites pour l’occasion en
Matlab. Le pas de simulation utilisé est de 1ms.
2.2.Organisation du réseau
On l’a vu, l’hypothèse adaptative de la MMN est le modèle le plus précisément implémenté à ce
jour, bien qu’il s’agisse de l’hypothèse la moins couramment admise. Nous cherchons ici à
implémenter un modèle aussi simple que possible mais utilisant des courants synaptiques réalistes,
rendant compte de l’hypothèse de la MMN comme résultat d’une détection de déviance locale par
rapport à des régularités inférées du contexte.
La MMN à la répétition dans un signal alterné et la mismatch d’omission plaident en effet en faveur
d’un modèle prédictif qui émet des prédictions actives en temps réel sur les entrées et les compare
aux entrées réelles. Le modèle que nous mettons en place est donc proche dans son implémentation
d’autres modèles prédictifs qui ont pu être développés pour modéliser les propriétés des champs
récepteurs au sein du cortex visuel primaire. Une différence majeure avec les modèles du cortex
visuels est la dimension sur laquelle porte la prédiction. Les modèles visuels portent en effet
majoritairement sur deux dimensions spatiales, du fait même des relations régulières qui existent
dans les stimuli naturels entre les éléments proches spatialement. Les régularités auditives qui nous
intéressent sont temporelles. Les prédictions du modèle que nous développons ici devront donc être
locales dans le temps au contraire des propriétés des champs récepteurs visuels qui résultent
principalement de prédictions locales dans l’espace.
Les données du paradigme local global sont en accord avec l’idée que les prédictions qui seraient
émises par un tel modèle se basent sur une fenêtre de temps ou d’éléments limitées : dans la
condition où les groupes AAAAB sont la règle, le dernier B est parfaitement prédictible sur la base
des 4 éléments précédents, cependant la réponse de mismatch existe quelque soit le contexte
général. Ce résultat est cohérent avec l’idée que le modèle prédictif n’est capable de prendre en
11
compte qu’un nombre limité d’éléments pour émettre ses prédictions et fixe ici ce nombre
d’éléments à moins de 4 ou à une fenêtre temporelle inférieure à 1s.
Un parti pris du modèle est de proposer un mécanisme purement local permettant de rendre compte
de la majeure partie des résultats expérimentaux décrits ci-dessus. Cette brique de base pourrait
ainsi être implémentée dans un contexte plus large que le cas particulier du cortex auditif primaire
étudié ici, en particulier on pourrait imaginer une organisation hiérarchique de telles briques
permettant de rendre compte des stimuli à des niveaux de plus en plus intégrés.
Figure 6 : Schéma du modèle proposé pour rendre compte de la MMN à des séquences de 2 sons purs de fréquences
respectives A et B
Le modèle proposé ici (Figure 6) se propose donc d’implémenter l’idée simple selon laquelle le
cerveau extrait les régularités statistiques des stimuli entrants et construit un modèle prédictif pour
anticiper les sons attendus. Les prédictions du modèle sont comparées au stimulus entrant. La
comparaison des stimuli prédits aux entrées réelle permet deux choses : identifier les stimuli
« surprenants » c'est-à-dire imprévus, qui sont susceptibles de demander une certaine attention et
adapter le modèle dans le cas où les régularités du stimulus entrant changent.
Par soucis d’économie computationnelle, on s’est limité ici à modéliser les populations de neurones
de 2 colonnes répondant à 2 sons de fréquences suffisamment différentes pour que chaque
population ne réponde pas à la fréquence préférée de l’autre. On modélise également 2 populations
12
correspondant aux sorties thalamiques répondant respectivement aux même fréquences préférées
que les deux colonnes corticales. On choisit la modélisation la plus simple de ces entrées : l’activité
des populations est imposée par un courant positif en créneau lorsque leur fréquence préférée est
présente dans le stimulus.
Outre les entrées thalamiques, le modèle comporte 3 grands types de populations excitatrices :



Une population « prédictive » qui est le cœur du modèle. Le modèle est construit pour que
l’activité de cette population cherche à anticiper les entrées thalamiques. Si l’activité de
cette population n’anticipe pas les entrées présentes, elle reçoit un signal d’erreur utilisé
pour ajuster le modèle prédictif.
La population d’erreur de prédiction qui calcule la différence entre les entrées réelles et
l’activité de la population prédictive et augmente son activité dans le cas ou les entrées
réelles ne sont pas annulés par les prédictions du modèle.
Un réseau récurrent assez large utilisé comme mémoire évanescente du passé proche appelé
ici réseau des états d’écho du passé. Les poids synaptiques entre cette population et la
population prédictive constituent le modèle prédictif à proprement parler. Ce réseau à échos
a en effet pour rôle de présenter une activité spécifique des entrées passées et du temps
écoulé depuis ces entrées.
Décrivons à présent avec plus de détail le rôle et les relations entre ces différentes populations.
Réseau des états d’écho du passé
Afin de d’émettre des prédictions en fonction du passé proche, il est nécessaire de donner une
certaine « épaisseur » au passé, c'est-à-dire d’en garder une trace caractéristique à la fois de sa
nature et du temps écoulé depuis son occurrence pendant un temps. Si un son de fréquence A est
présenté au système on souhaite qu’une activité dépendante de cette entrée existe dans le réseau
quelques centaines de millisecondes après l’entrée, que cette activité soit reproductible pour chaque
présentation de A et différente de celle évoquée par d’autres fréquences. On souhaite également
que le pattern d’activité évoqué par A varie au cours du temps, toujours de manière reproductible.
Ainsi, un pattern d’activité donné donne une information sur les fréquences présentées au réseau et
sur le temps écoulé depuis leur présentation. Seule l’information présente dans ce réseau peut être
utilisée pour construire le modèle prédictif. Les propriétés de ce réseau sont donc une importante
variable du modèle. Par soucis de simplicité on choisit dans un premier temps un modèle simpliste
consistant en une ligne à retard : on modélise une ligne à retard pour chaque fréquence et on laisse
l’activité se propager de proche en proche dans le réseau jusqu’à arriver au bout de la population. Ce
modèle extrêmement simple présente de nombreuses propriétés indésirables sur lesquelles nous
reviendrons plus tard mais présente l’avantage d’avoir un comportement parfaitement maitrisé qui
facilite la compréhension des résultats du modèle pour une première approche.
Population d’erreur de prédiction
Cette population calcule la différence entre les entrées prédites et réelles. Pour réaliser cette
computation à l’échelle du neurone il est nécessaire de construire une copie inhibitrice de l’activité
de la population prédictive. La population prédictive projette donc sur une population
d’interneurones. Le calcul de la différence se fait par intégration des entrées excitatrices thalamiques
et des entrées inhibitrices des interneurones reproduisant le pattern d’activité de la population
prédictive.
13
De façon intéressante, une question rarement abordée par des modèles plus formels est ici
soulevée : la différence calculée ici peut être algébriquement positive ou négative. Si les deux signes
peuvent être traités de façon symétrique dans un modèle formel, il n’en est pas de même pour un
modèle neuronal. En effet, l’effet de chaque possibilité est radicalement asymétrique. Si le signe de
cette différence est positif, l’intégration donne lieu à une augmentation de l’activité du neurone. En
revanche, si la différence est négative, l’intégration aboutit à une réduction du taux de décharge par
rapport à l’activité basale, signal beaucoup plus complexe à utiliser computationnellement. Nous
reviendrons sur les conséquences de ce fait lorsque nous considérerons les règles d’apprentissage de
plasticité synaptique.
Par analogie avec d’autres modèles de codage prédictif [24] on propose que cette population
corresponde à la couche IV du cortex auditif primaire.
Population prédictive
Cette population reçoit des entrées des 2 types de populations présentées précédemment : les
populations à échos du passé qui contiennent l’information sur le passé proche, et la population
d’erreur de prédiction. Le modèle prédictif à proprement parler est stocké dans les pondérations
synaptiques entre le réseau à échos et la population prédictive. Par exemple, si les poids synaptiques
entre les neurones de la ligne à retard de A correspondant aux neurones actifs lorsqu’un son de
fréquence A a été présenté 200ms auparavant et la sous population prédictive de B sont élevés, cela
équivaut à la prédiction « si un son de fréquence A et présenté à instant t, alors il est probable (et
donc attendu) qu’un son de fréquence B survienne 200ms plus tard ».
La population prédictive reçoit également un signal d’erreur dans le cas où les entrées n’ont pas été
anticipées. Ce signal doit être utilisé pour mettre à jour le modèle.
2.3.Règles de plasticité
Les seules connections plastiques dans ce modèle sont celles entre le réseau à échos du passé et la
population prédictive. Le but de la plasticité est d’adapter les poids synaptiques afin de prédire au
mieux les entrées probables sur la base du contexte.
Les données de l’étude d’électrophysiologie chez le singe montrent que la différence entre standard
et déviant provient essentiellement d’un signal supplémentaire dépendant crucialement de
récepteurs NMDA. Un effet similaire est reproduit chez l’humain : on observe une réduction de la
MMN et du taux de détection des déviants si on administre de la kétamine (antagoniste des
récepteurs NMDA) à des sujets saints. Ces données sont cohérentes avec l’hypothèse que le signal
entre la population d’erreur de prédiction et la population prédictive serait médié par des synapses
où les récepteurs NMDA seraient majoritaires. De plus, on sait que les récepteurs NMDA induisent un
signal calcique dont dépend la plasticité de type « spike timing dependant plasticity » (STDP). Le
signal d’erreur peut ainsi être utilisé pour superviser l’apprentissage du modèle prédictif entre le
réseau à échos du passé et la population prédictive.
Ce mode d’apprentissage suppose que 2 conditions soient vérifiées : que seules les synapses entre le
réseau à échos du passé et le modèle possèdent la machinerie nécessaire à la plasticité synaptique et
que les synapses provenant de la population d’erreur de prédiction soient sur les mêmes dendrites et
proches des synapses plastiques afin que le signal calcique local puisse être utilisé.
14
On utilise donc une règle de plasticité dépendant d’une part du timing entre les spikes
présynaptiques provenant du réseau à échos du passé et les spikes post synaptiques de la population
prédictive. Cette plasticité est d’autant plus forte que le signal calcique induit par l’erreur de
prédiction est fort. On suit donc une règle de type :

Si spike post :
∆𝑤𝑝𝑟 é,𝑝𝑜𝑠𝑡 = 𝑐𝑝 𝐼𝐶𝑎 2+ − 𝑇ℎ exp(𝑡 − 𝑡𝑠𝑝𝑖𝑘𝑒

𝑝𝑟 é )
Si spike pré :
∆𝑤𝑝𝑟 é,𝑝𝑜𝑠𝑡 = −𝑐𝑝 𝐼𝐶𝑎 2+ − 𝑇ℎ exp(𝑡 − 𝑡𝑠𝑝𝑖𝑘𝑒
𝑝𝑜𝑠𝑡 )
Où 𝑇ℎ est un seuil correspondant au courant calcique moyen lorsque la population de signal
d’erreur présente une activité basale. On choisit 𝑐𝑝 = 30 𝑒𝑡 𝑇ℎ = 0.5
Cette règle d’apprentissage permet donc de renforcer les synapses entre les neurones du réseau à
échos du passé qui déchargent de façon reproductible avant le signal d’erreur. Les paramètres des
synapses entre la population d’erreur de prédiction et la population prédictive sont également fixés
afin qu’une erreur de prédiction importante impose une activité des neurones prédictifs, nécessaire
à la STDP.
Cette règle d’apprentissage permet d’apprendre des probabilités de transition du type « A implique B
100 ms plus tard ». Cependant elle est insuffisante pour détruire des régularités qui ne seraient plus
vérifiées. Par exemple si le réseau a appris que « A implique B 100ms plus tard » et que les
régularités du stimulus changent de telle façon que « A implique B 200ms plus tard mais jamais
100ms plus tard » désormais, la règle présentée ci-dessus permet d’apprendre aisément la nouvelle
association temporelle entre A et B mais pas d’apprendre que l’ancienne règle n’est plus valable. En
effet, 100ms après l’occurrence d’un son de fréquence A le modèle prédictif produit des entrées
excitatrices sur la population prédictive de B alors que rien de particulier ne se produit au niveau de
la population d’erreur de prédiction. Les poids synaptiques ne sont donc pas modifiés par la règle de
plasticité car 𝐼𝐶𝑎 2+ ≅ 𝑇ℎ cependant les entrées excitatrices vont entrainer une réponse non
souhaitée de la population prédictive. Cette prédiction non compensée par des arrivées thalamiques
va certes entrainer une réduction du taux de décharge de la population d’erreur de prédiction mais
ce signal est difficilement exploitable car il n’existe pas à notre connaissance de règle de plasticité
biologiquement informée où une absence de signal entraine une dépression.
Afin de remédier à cet inconvénient on ajoute une règle complémentaire où toute activité pré
synaptique qui n’entraine pas d’activité post synaptique entraine une dépression des synapses :
∆𝑤𝑝𝑟 é,𝑝𝑜𝑠𝑡 = −𝑐𝑑 𝛿(𝑡 − 𝑡𝑠𝑝𝑖𝑘𝑒
𝑝𝑟 é )
On prend 𝑐𝑑 = 40.
Une telle règle de plasticité est supportée par les travaux de Fregnac et al[25]. : si la réponse post
synaptique est artificiellement supprimée en imposant un courant dépolarisant sur un neurone, la
force d’association entre les neurones pré synaptiques amenant le neurone à décharger et le
neurone dépolarisé est diminuée.
15
On propose que la population prédictive corresponde aux couches supragranulaires du cortex auditif
primaire, ce qui serait en accord avec la notion que cette couche reçoit un signal d’erreur
d’amplitude plus importante dans le cas ou le stimulus est déviant et donc non anticipé par le
modèle prédictif. Dans notre modèle le signal d’erreur est en outre médié par des récepteurs NMDA,
ce qui rendrait ce signal sensible aux manipulations pharmacologiques.
2.4.Implémentation du réseau
Sauf exception chaque population représentée par un rectangle blanc ou un cercle noir est
implémentée comme une population de 40 neurones. Par défaut on utilise les paramètres
𝑤𝐸𝐸 = 2.2 , 𝑤𝐸𝐼 = 4.5, 𝑤𝐼𝐸 = 22 pour les connections entre respectivement 2neurones de
population excitatrices, d’un neurone excitateur vers un neurone inhibiteur et d’un neurone
inhibiteur vers un neurone excitateur. Par défaut également, pour les connections excitatrices le
poids des connections NMDA est de 0.2𝑤𝐸 .
Au sein de chaque colonne, les neurones thalamiques projettent sur la population d’erreur de
prédiction avec une probabilité de connexion de 0.9. La population d’erreur de prédiction projette
sur la population prédictive avec une probabilité de connexion de 0.9 et un poids des connections
NMDA 𝑤𝑛 = 1.2 𝑒𝑡 𝑤𝐸𝐸 = 0.2𝑤𝑛 . La population prédictive projette sur les interneurones inhibiteurs
de la colonne avec une probabilité de connexion de 0.5 et ces neurones projettent à leur tour sur la
population d’erreur de prédiction avec une probabilité de 0.5. La population prédictive alimente
également la ligne à retard correspondant à la fréquence codée en projetant sur une sous population
de 10 neurones parmi les 400 que compte la ligne à retard. Les lignes à retard projettent sur les deux
sous-populations prédictives avec une probabilité 0.6 et une distribution gaussienne de poids de
départ de moyenne 0.4. Tous les poids synaptiques sont soumis à une variance de 20% autour de la
moyenne indiquée ici.
Chaque ligne à retard est modélisée par une population de 400 neurones excitateurs de 100
neurones inhibiteurs. Les neurones excitateurs sont connectés localement entre eux avec une
probabilité de connexion inversement proportionnelle à la distance entre les deux neurones avec un
poids synaptique moyen de 4.5 et un rayon moyen de connectivité de 12 neurones. Ces synapses
sont exclusivement AMPA. Les neurones excitateurs sont connectés aux neurones inhibiteurs
localement avec un rayon moyen de connectivité de 12 neurones et un poids synaptique moyen de
4. Ces neurones projettent sur les neurones excitateurs localement avec le même rayon de
connectivité et un poids synaptique moyen de 4.
Le réseau est initialisé avec les 𝑠𝑗 = 0 pour tous les neurones et tous les types de canaux. Les
potentiels de membrane sont initialisés à −65 + 5𝑟𝑎𝑛𝑑. La première seconde de simulation est
exclue des analyses et les règles de plasticité ne s’y appliquent pas, afin d’éviter des effets arté
factuels dus à l’initialisation du réseau.
Les délais synaptiques sont de 1 à 3ms, exceptés dans le réseau à échos ou les délais synaptiques
sont fixés à 10ms pour obtenir la dynamique désirée.
16
2.5.Séquences test des simulations.
Nous avons choisi de tester le modèle sur des séquences nous permettant d’évaluer si le modèle
rend compte des effets identifiés en introduction et sur le paradigme duquel nous somme partis pour
poser notre question.
On utilise une variante récemment acquise au sein du laboratoire du paradigme local/Global, ce qui
nous permettra à terme de comparer les prédictions du modèle aux données expérimentales
effectives. Ces séquences sont :
1) 20 AAAAA puis 100 groupes dont 70 AAAAA, 20 AAAAB, 10 AAAA
2) 20 AAAAB puis 100 groupes dont 70 AAAAB, 20 AAAAA, 10 AAAA
3) 100 AAAA
Une séquence AAAA(AouB) est constituée de 4 sons de même fréquence et d’un cinquième de même
fréquence ou non, d’une durée de 50 ms avec un SOA de 150ms. La durée entre le début du dernier
son d’une séquence de 5 sons et le début du premier son de la séquence suivante est de 600ms.
Dans le cas des séquences de 4 sons, cette durée est de 750 ms.
Les groupes sont pseudo randomisés de telle façon que 2 déviants à la règle fixée par les 20 premiers
groupes ne soient jamais successifs. On exclut de l’analyse les groupes « standards » qui se trouvent
après un déviant.
On teste également le modèle sur des séquences alternées :
4) 20 ABABA puis 100 groupes dont 70 ABABA, 20 ABABB, 10 ABAB
On teste également le modèle sur un paradigme oddball classique avec différences fréquences
d’occurrence du déviant : 10%, 20%, 30%.
3. Résultats
Dans cette section nous présentons les résultats de différentes simulations. Pour chaque type de
séquence, la simulation a été effectuée avec au moins trois réseaux générés selon les règles décrites
ci-dessus. Les 20 premiers essais d’un bloc ainsi que les essais standards suivant immédiatement un
essai rare (déviant ou omission) sont exclus des analyses. Les figures présentent les taux de décharge
des neurones ainsi que les courants synaptiques reçus par chacune des principales sous-populations.
3.1.Paradigme local/global
Un réseau initialement vierge de tout apprentissage est entrainé sur 20 séquences « standard », puis
testé sur un bloc composé de 20 séquences déviantes, 10 omissions et 70 standard. La réponse au
standard est moyennée sur les essais test ne suivant pas un déviant ou une omission. Les essais rares
(déviant ou omission) sont pseudo randomisés de telle façon qu’ils suivent toujours un essai
standard.
3.1.1. Contexte AAAAA
Comportement du réseau à écho
Le comportement qualitatif du modèle développé ici est dépendant des propriétés du réseau à écho
choisi. Pour ces simulations on a choisi un réseau simpliste mais dont les propriétés sont bien
17
contrôlées : la ligne à retard. Ce réseau propage l’activité de proche en proche par le biais de
connections locales.
Figure 7 : Probabilité de réponse de chaque neurone de la ligne à retard associée aux sons de fréquence A, en fonction du
temps depuis le début du premier son A dans le contexte AAAA.
On observe que ce réseau propage l’activité de façon linéaire avec le temps (Figure 7). On voit aussi
que l’entrée de l’information se fait près de 100ms après le début du son A. Cet effet est du aux
délais de propagation de l’activité dans le réseau.
18
Figure 8: probabilité de réponse en fonction du temps après le début du premier son d'une séquence. Fit gaussien de
cette probabilité pour chaque neurone.
Figure 9 : écart type (en ms) du modèle gaussien pour chaque neurone de la Figure 8
La Figure 8 montre le fit gaussien de la distribution des réponses de différents neurones de la ligne à
retard après le début du premier son de la séquence. On voit que la réponse est de plus en plus
étalée dans le temps. La Figure 9 montre l’écart type du modèle gaussien des données de la Figure 8
en fonction de la position du neurone dans la ligne à retard. On voit que la précision du timing de
réponse suit une loi de Weber.
19
Du fait de la taille finie de la ligne (réduite pour des raisons de vitesse computationnelle), la mémoire
d’un son disparait du réseau quand « l’onde » générée par ce son atteint le bout de la ligne ou
lorsque cette onde se dissipe si l’activité échoue à se propager aux neurones suivants. La durée de
vie maximale de la mémoire d’un son est d’environ 350ms dans notre cas.
Réponse au standard local
La Figure 10 présente la moyenne des réponses à une séquence AAAAA dans le contexte où cette
séquence est majoritaire, enregistrées pour 5 réseaux différents générés selon les règles présentées
ci-dessus. On peut voir les taux de décharge moyen de la population prédictive, de la population
d’erreur de prédiction et des entrées thalamiques. On montre également les entrées synaptiques,
qui correspondent aux quantités qui sont enregistrées en imagerie fonctionnelle
(electroencephalographie ou magnétoencéphalographie), ou en électrophysiologie (local field
potentials). Pour chaque couche, les deux sous populations modélisées sont distinguées par un code
couleur. Il est à noter que les entrées AMPA sur la population prédictive prédictif, qui ne corrèlent
pas avec une variation dans les entrées médiées par le NMDA sont le reflet des entrées provenant
des lignes à retard. Ce sont les prédictions du modèle. Les courants NMDA sont le reflet de l’erreur
de prédiction.
La population thalamique présente une amplitude de réponse constante pour les 5 sons. On vérifie
ainsi que les neurones présentent des qualités d’adaptation synaptique faibles. Les propriétés du
modèle sont donc dues à ses qualités prédictives.
La population prédictive présente un taux de décharge faible au moment de l’arrivée du premier son.
On voit que les courants excitateurs AMPA provenant du réseau à échos sont faibles : le modèle
prédictif n’est pas capable de prédire l’arrivée du premier son de la séquence. En effet, aucune
entrée n’est arrivée dans le modèle depuis une durée supérieure à la fenêtre de mémoire de la ligne
à retard, le modèle prédictif ne peut baser ses prédictions sur aucune entrée passée.
Pour les sons suivant on observe que l’activité de la population prédictive augmente avant le début
du stimulus et est capable d’annuler en partie les entrées thalamiques. Les entrées AMPA anticipent
l’arrivée du son suivant. En conséquence on voit que l’erreur de prédiction est maximale pour le
premier son qui n’est pas anticipé par le modèle prédictif. Les sons suivants sont bien prédits par le
modèle prédictif comme en témoignent les courant AMPA sur la sous population prédictive
correspondant au son attendu. En conséquence, l’intégration des entrées thalamiques et de la copie
inhibitrice de la population prédictive aboutit à une réduction de la réponse aux sons suivants au
niveau de la population d’erreur de prédiction.
En fin de séquence, on observe une prédiction d’un 6ème son de fréquence A, voire d’un 7ème ou 8ème.
Cette prédiction est la conséquence directe de l’apprentissage local dans le temps effectué par le
modèle. Les probabilités apprises sont limitées à une fenêtre temporelle de 300ms prédisent donc la
poursuite de la régularité locale de répétition. L’observation de l’activité moyenne de la ligne à retard
(voir annexe) montre que les prédictions générées induisent parfois la génération de nouvelles traces
de mémoire dans la ligne à retard. Les prédictions sont ainsi capables de s’auto entretenir pendant
un certain temps comme un système oscillant amorti. Cette dynamique est de fait observée en fin de
séquences oddball, et pourraient avoir une utilité pour la compréhension de stimuli dégradés en
biaisant le modèle vers les régularités apprises sur une période plus longue que celle de la trace de
mémoire du dernier stimulus intact.
20
Figure 10 : moyenne sur 5 réseaux sur des séquences Standard dans la règle AAAAA. Droite : taux de décharge des
neurones des principales populations du modèle. Gauche : Moyenne des courants synaptiques AMPA, NMDA et GABA
sur les populations de prédiction et d’erreur de prédiction. Les barres vertic ales pointillées représentent le début des 5
sons de chaque séquence.
On peut remarquer que l’erreur de prédiction n’est jamais nulle. Ceci est imposé par le fait que les
poids synaptiques entre les lignes à retard et le réseau diminuent dès lors que le signal calcique est
trop faible pour compenser la règle de dépression synaptique. Ce phénomène impose le maintien
d’une erreur de prédiction résiduelle. Cela signifie également que cette règle de plasticité empêche
l’explosion des poids synaptiques dans des conditions physiologiques.
21
Réponse au déviant local
Figure 11 : Taux de décharge et entrées synaptiques moyens pour un déviant (AAAAB) à la règle AAAAA. Détails voir
Figure 10
La réponse au quatre premiers sons de la séquence déviante (Figure 11) est similaire à celle décrite
pour la séquence standard. Au niveau du dernier son différent des précédents, on observe que la
sous population prédictive associée au son A présente une augmentation d’activité : le modèle
prédictif prédit un « A ». Cette prédiction n’annule pas les entrées thalamiques car c’est un son de
fréquence B qui est présenté. On observe en conséquence une erreur de prédiction importante, qui
se traduit par un large courant excitateur médié par des récepteurs NMDA sur la sous population
prédisant la fréquence B.
22
Contraste entre AAAAA et AAAAB
Figure 12 : Différence des entrées synaptiques moyennes entre les essais standards et déviants dans la règle AAAAA.
Gauche : Différence pour chaque sous population entre les conditions standard et déviant. Droite : somme sur les deux
sous-populations (courant net)
La Figure 12 montre la différence entre les courants synaptiques observés pour une séquence
standard ou déviante. La différence est calculée pour chaque sous population (gauche) puis sommée
pour obtenir le bilan net sur la population entière. On voit que le bilan sur les entrées thalamiques
est nul comme on s’y attendait, car les différences au niveau des deux sous populations se
compensent parfaitement.
La différence au niveau de la population prédictive est assez faible car les entrées thalamiques sont
très proches : cela résulte en une faible différence dans les entrées excitatrices.
On observe en revanche que l’essentiel de la différence se trouve au niveau de la population
prédictive (couches supragranulaires) et est médiée par des courants NMDA. L’augmentation du taux
23
de décharge se traduit par une différence dans les entrées inhibitrices sur la population d’erreur de
prédiction. Cette distribution des courants selon les couches est proche de celle décrite par Javitt et
al[16].
3.1.2. Contexte AAAAB
Les résultats des simulations pour le contexte AAAAB sont proches de ceux pour la séquence AAAAA
(voir annexes). Une différence qualitative importante est cependant la présence d’une prédiction sur
la sous population prédisant les sons de fréquence B après chaque son de fréquence A. Cette
prédiction reflète l’augmentation de la fréquence de présentation de B dans les entrées. Du fait de la
localité des prédictions, le modèle n’est pas capable de distinguer les A pertinents pour prédire un B
dans le contexte global.
Comparaison des mismatch en fonction du contexte global
Figure 13 : différence standard-déviant dans les courants synaptiques sur la population prédictive en fonction du
contexte global : noir = contexte AAAAA, rouge = contexte AAAAB.
La Figure 13 montre l’amplitude relative de la réponse de mismatch au niveau de la population
prédictive en fonction du contexte global. On observe une différence sensible dans l’amplitude de la
MMN en fonction de la règle. La MMN est plus faible lorsque la séquence XXXXY est plus
fréquente. Cet effet est retrouvé dans les données du paradigme local/global.
Forme du modèle prédictif
La forme simple du réseau à écho permet d’observer aisément la forme du modèle prédictif contenu
dans les poids synaptiques entre les deux lignes à retards et la population prédictive.
24
Figure 14 : poids synaptiques moyens entre les neurones de la ligne à retard de A et les neurones des deux sous
populations prédicitves (moitié supérieure = A, moitié inférieure = B)
La Figure 14 permet de visualiser le modèle prédictif. La linéarité entre l’indice des neurones de ligne
à retard et le temps écoulé depuis une entrée de fréquence A permet d’interpréter aisément les
poids synaptiques observés. On peut voir que dans les deux contextes, le modèle prédictif de A
(moitié supérieure) a appris que l’arrivée d’un son de fréquence A est prédit par l’arrivée d’un son A
sur deux intervalles de temps de sa fenêtre de mémoire qui correspondent respectivement à une et
deux fois l’intervalle entre deux sons successifs.
On peut constater que le modèle prédictif de B se base sur les mêmes fenêtres temporelles pour
prédire B mais avec une atténuation importante des poids synaptiques en fonction du contexte.
3.2.Séquences alternées
Winkler et al. ont montré qu’une déviance à la règle d’alternance évoque une MMN. On teste le
réseau sur des séquences alternées construites sur le même mode que les séquences précédentes : 5
sons de 50ms séparés de 100ms d’ISI avec un intervalle de 600ms entre deux séquences de 5 sons.
Cela nous permet de comparer les réponses à cette séquence et à ses déviations de la même façon
que précédemment.
25
3.2.1. Contexte ABABA
Réponse au standard
Figure 15 : taux de décharge et courants synaptiques moyens pour une séquence ABABA dans le contexte où elle est
standard. Détails voir Figure 10
La Figure 15 montre la réponse moyenne du réseau à une séquence standard alternée ABABA. On
voit que de la même façon que pour une séquence standard répétée AAAAA, le premier son génère
une réponse maximale de l’erreur de prédiction car aucune activité de la population prédictive ne
l’anticipe. Les sons suivants sont anticipés de façon conforme aux régularités du stimulus, ce qui
entraine une réduction de la réponse de la population d’erreur de prédiction. On observe une
continuation des courants générés par le modèle prédictif après la fin de la séquence respectant
l’alternance de stimuli prédits.
Le modèle est donc capable de prédire les stimuli dans une séquence alternée avec autant de succès
que la prédiction dans une séquence répétée.
26
Réponse au déviant
Figure 16 : taux de décharge et courants synaptiques moyens pour une séquence ABABB où la répétition finale
représente une déviation à la règle d'alternance (ABABA). Détails voir Figure 10
La Figure 16 montre la réponse à la violation de la règle d’alternance sur le dernier stimulus de la
séquence. Comme pour le déviant à la règle de répétition, la prédiction pour le déviant à la règle
d’alternance ne correspond pas au stimulus présenté, et n’annule donc pas l’entrée thalamique au
niveau de la population d’erreur de prédiction. La réponse de cette population est donc plus
importante.
27
Figure 17 : différence des courants synaptiques pour une séquence déviante par rapport à une séquence standard pour
la règle ABABA
La Figure 17 montre la différence de courants synaptiques entre les deux conditions précédentes.
Comme pour la règle de répétition, l’essentiel de la différence se trouve au niveau de la population
prédictive. On retrouve un large courant NMDA à la suite du stimulus déviant.
Contrairement à la règle de répétition, on observe également une différence dans les courants
générés par le modèle prédictif après le 5ème son. Cette différence provient de l’ambigüité dans les
prédictions générées par le déviant. En effet, le modèle prédit un B sur la base du B en 4ème position
mais aussi un A sut la base du B en 5ème position.
28
3.3.Paradigme Oddball
Amplitude de la MMN en fonction de la fréquence du déviant.
Figure 18 : amplitude de la différence entre les courants synaptiques sommée sur chaque population pour un déviant et
un standard en fonction de la fréquence du déviant
La Figure 18 montre la variation de l’amplitude de la mismatch en fonction de la fréquence du
déviant. Comme pour les paradigmes précédents, l’essentiel de la différence provient des courants
d’erreur de prédiction médiés par des récepteurs NMDA. On observe que cette différence est
proportionnelle à la probabilité du déviant, ce qui reproduit qualitativement les résultats
d’expérimentaux présentés en introduction.
29
4. Discussion et perspectives
Bilan
Nous avons proposé ici un modèle neuronal minimal de codage prédictif dans le temps appliqué à la
modélisation de la MMN. Nous avons identifié un certain nombre de paradigmes capturant une liste
d’effets non triviaux connus dans la littérature sur la MMN et simulé de façon exhaustive la réponse
de notre modèle à ces paradigmes.
Ce modèle est minimal en ce sens qu’il prend en compte un nombre limité de caractéristiques du
cortex auditif primaire dont il cherche à reproduire le comportement. Nous n’avons, par exemple,
pas pris en compte des propriétés de codage temporel complexe décrites dans le cortex auditif. Nous
avons au contraire exploré l’hypothèse qu’un nombre de propriétés réduites permet de rendre
compte qualitativement d’une partie importante des données expérimentales.
Bien que simple dans son architecture, le modèle est constitué d’unités biologiquement réalistes du
point de vue des courants synaptiques et des règles d’apprentissage appliquées. Il permet ainsi de
confronter les idées de codage prédictif développées jusque là de façon très mathématisée [26] à la
réalité de contraintes biologiques.
Notre modèle se proposait d’implémenter des idées proches de celles développées par Friston mais
dans un réseau biologiquement plausible au lieu d’adopter la démarche d’optimisation développée
par Friston. Notre idée d’utiliser un signal NMDA pour signaler le besoin d’adapter le modèle
prédictif est en accord avec les propositions de cet auteur. Cependant, l’implémentation du modèle
dans un réseau plus réaliste met en évidence un point important : une erreur de prédiction
provenant d’une prédiction insuffisante des entrées ne peut être codée ni utilisée dans une règle
d’apprentissage de la même manière qu’une erreur de prédiction où les entrées prédites
n’adviennent pas. Si ces deux erreurs de prédictions peuvent être traitées de la même façon par un
réseau mathématique, l’utilisation de l’erreur de prédiction correspondant à une prédiction qui
n’advient pas est plus complexe à intégrer à des règles de plasticité réalistes.
Confrontation avec les données expérimentales
Nous avons identifié dans l’introduction six effets contraignants pour un modèle computationnel de
la MMN. Examinons à présent dans quelle mesure nous sommes parvenus à en rendre compte.
Effets 1 et 2 : production d’une MMN d’amplitude dépendante de la probabilité d’occurrence
du déviant
Le premier effet est l’existence même d’une MMN pour un son déviant dans un flux régulier de
stimuli répétés à intervalle régulier. Notre modélisation du paradigme oddball a permis de mettre en
évidence que cet effet est reproduit par le modèle : on identifie une différence dans les courants
synaptiques générés entre les conditions standard et déviant. Cette différence provient
essentiellement de l’atténuation de la réponse de la population d’erreur de prédiction du fait de
l’anticipation des entrées par la population prédictive. En faisant varier la proportion de déviants, on
a pu mettre en évidence que notre modèle reproduit également le deuxième effet : l’amplitude de la
différence entre les réponses au standard et au déviant est proportionnelle à la probabilité du
déviant.
30
Effet3 : MMN à la répétition dans une séquence alternée
Notre modèle réplique également la MMN à la répétition dans un signal alterné. Il prédit l’existence
d’une MMN semblable à celle enregistrée pour un déviant dans le cadre d’un paradigme oddball. Il
prédit en outre une réponse particulière du modèle prédictif pour le stimulus suivant la répétition.
Les prédictions du modèle prédictif sont ambigües ce qui se traduit par la décharge des deux sous
populations modélisées après la fin de la séquence. Il serait intéressant de tester ces prédictions.
Effet4 : MMN à l’omission
Le paradigme local/global permet de tester l’existence d’une MMN à l’omission à un son attendu.
On observe en effet une réponse du modèle prédictif en l’absence du 5ème son. Cependant, notre
modèle prédit une réponse identique dans le cas où la séquence de 4 sons est présentée de façon
standard (voir annexe). Le modèle prédit donc également une MMN à la fin de toute séquence
régulière même si la fin de cette séquence est prévisible et que son interruption ne représente pas
une omission à proprement parler. Cette prédiction reste à explorer plus avant expérimentalement.
Des données non publiées ont cependant été récoltées au sein de l’équipe de Stanislas Dehaene sur
une variante du paradigme de Bekinstein et al. proche de celle simulée dans ce rapport. La réponse à
4 sons semble différer significativement en fonction de l’attente ou non d’un 5 ème son. Cette
prédiction semble donc constituer une limite de notre modèle.
Le modèle propose que les réponses à l’omission et aux déviants toutes deux nommées MMN dans la
littérature ont des origines fondamentalement différentes : la MMN à un déviant est le résultat des
courants synaptiques venant des synapses entre la population d’erreur de prédiction et la population
prédictive alors que la réponse à l’omission proviendrait du modèle prédictif et donc des synapses
entre les lignes à retard et la population prédictive. Cette seconde réponse n’est à aucun moment le
résultat d’une comparaison entre les entrées prédites et observées. Elle ne correspond pas dans
notre modèle à une erreur de prédiction « négative ». Bien que ces deux réponses aient des
significations fondamentalement différentes, elles ont toutes deux la même topographie de réponse
en imagerie, car proviennent de courants synaptiques sur les mêmes dendrites. En revanche, les
prédictions quant à leur sensibilité aux manipulations pharmacologiques sont différentes : les
courants d’erreur de prédiction sont très sensibles aux inhibiteurs des récepteurs NMDA.
Effet 5 : Génération d’une MMN même si le déviant est prédictible.
La simulation du paradigme local/global a permis de reproduire les effets observés sur la MMN. Il
existe une MMN au déviant local quelque soit le contexte, même si le déviant est prédictible. On
observe une atténuation de l’amplitude de la MMN lorsque la déviance locale est la règle. Cet effet
d’atténuation correspond à l’effet de la fréquence du déviant (effet2).
Le modèle n’est en revanche pas à même d’expliquer la réponse P300. Un objectif de poursuite de ce
travail est de construire un modèle hiérarchique à partir ce cette première brique permettant de
rendre compte d’effets plus complexes sur des fenêtres de temps plus importantes et portant sur
des propriétés plus abstraites du stimulus.
Effet6 : Bases cérébrales des populations du modèle
Nous avons proposé dans notre modèle que la population d’erreur de prédiction corresponde à la
couche 4 et que la population prédictive corresponde aux couches supragranulaires. La distribution
des courants synaptiques, en particulier le profil de répartition des différences entre réponse au
standard et réponse au déviant concordent avec les données expérimentales de Javitt et al.
31
Ce modèle est capable d’apprendre des probabilités de transition entre des éléments distants de
quelques centaines de millisecondes. La capacité du modèle à émettre des prédictions dans le temps
dépend de l’existence d’un réseau capable de contenir une information reproductible sur le passé.
Nous avons utilisé ici un type de réseau récurrent simple : la ligne à retard. Ce réseau nous a permis
de visualiser facilement le type de régularités apprises par le modèle prédictif grâce à la linéarité du
codage temporel. Nous n’avons cependant pas proposé de bases cérébrales pour ce réseau.
L’existence de lignes à retard n’a pas été décrite dans le cortex auditif. Une première possibilité serait
qu’il existe une structure cérébrale, corticale ou non, qui présente cette capacité. Il faudrait
cependant supposer des délais synaptiques raisonnables et une forte connectivité entre ces régions.
Une autre possibilité serait d’utiliser le cortex auditif primaire (par exemple la couche
supragranulaire dans notre modèle) lui-même comme réseau récurrent à écho. Cette hypothèse
impliquerait la superposition de deux types de codes dans pour une même population : un code
tonotopique bien décrit dans la littérature, et un code temporel, mémoire du passé. Pour interférer
le moins possible avec le premier code, le code temporel doit lui être orthogonal. De cette façon le
code temporel se comporte comme un bruit blanc pour le code tonotopique et inversement.
Buonomano et al[27] ont décrit des dynamiques dans des tranches de cortex auditif intéressantes
pour cette hypothèse: pour une stimulation à un site donné, on enregistre un pattern de réponses
reproductibles étalées sur des latences allant jusqu’à quelques centaines de millisecondes. Les
latences des réponses sont sans relation avec la proximité spatiale entre le neurone enregistré et le
neurone initialement stimulé. La précision temporelle des réponses suit une loi de Weber. Bien qu’il
ne soit pas démontré que ces propriétés sont maintenues in vivo, la dynamique décrite présente des
caractéristiques idéales pour notre modèle. Elle permettrait ainsi de réinterpréter le « bruit » dans le
code tonotopique comme une superposition d’un autre code.
Prédictions et test du modèle
Adaptation et prédiction
On a montré que le modèle prédictif est capable de rendre compte d’un nombre important d’effets
connus dans la littérature concernant la mismatch negativity. Cependant, cela ne saurait constituer
une réfutation de l’hypothèse adaptative. Il serait donc intéressant de trouver une condition
expérimentale pour laquelle les prédictions de ces deux modèles soient clairement différentes.
Le modèle suppose explicitement que les prédictions sont basées sur l’apprentissage des régularités
dans les patterns temporels de transitions entre les stimuli présentés au système. Ce principe
implique que le réseau est sensible à la probabilité qu’une certaine transition soit vérifiée
( P(B|At−∆t ) ) même si la transition est rarement rencontrée alors que le modèle adaptatif est
sensible à la probabilité temporelle d’occurrence d’un son particulier P B .
Afin de tester si l’adaptation est suffisante pour expliquer la MMN comme le défendent May et
Tiitinen, on s’appuie sur une propriété fondamentale de l’adaptation : les neurones récupèrent leur
capacité à répondre de façon maximale avec une constante de temps inférieure à une vingtaine de
seconde. La présentation de stimuli espacés d’une durée supérieure à 20s devrait donc être
indépendante de la régularité de ces séquences dans un contexte plus large.
32
Si on présente de façon standard la paire AB avec un intervalle d’une trentaine de seconde :
100ms
~30s
et de façon rare on présente un déviant :
Le modèle adaptatif prédit une MMN au B de la seconde paire car les neurones répondant au son A
subissent une adaptation entre les deux sons alors que les neurones répondant spécifiquement au
son B n’ont pas été stimulés depuis plus de 30s.
Le modèle prédictif apprend au contraire les probabilités de transition. La probabilité de A vers B
étant vérifiée à chaque fois qu’un A est présenté, la réponse au B devrait être réduite. L’occurrence
d’un deuxième son identique pour le déviant n’est pas prédite, le signe de la mismatch entre
standard et déviant devrait être opposé à celui prédit par le modèle adaptatif.
Le modèle prédictif que nous avons développé n’implique volontairement aucun paramètre
d’adaptation synaptique, bien que cet effet soit bien décrit dans la littérature. Ce choix nous a
permis d’étudier les comportements dus à une prédiction pure. L’adaptation est cependant un
phénomène largement décrit dans les données électrophysiologiques, et il est possible que la MMN
soit le résultat d’une combinaison de ces deux effets.
On peut évaluer la part éventuelle d’adaptation de 2 manières :
On peut comparer les réponses aux deux paires à l’intérieur de blocs où AB ou AA est la règle (sur le
même principe que le paradigme local/global). Le modèle adaptatif prédit une invariance de la
réponse en fonction du contexte, le modèle prédictif prédit une inversion de la MMN en fonction du
contexte.
En faisant varier l’intervalle entre les paires, on devrait également pouvoir quantifier la part des deux
processus dans les réponses aux stimuli présentés habituellement dans les paradigmes oddball. La
part prédictive de la mismatch ne devrait pas varier avec la fréquence temporelle de la paire
(seulement fonction de la fréquence d’association des deux sons), alors que la part d’adaptation
augmente si les paires sont présentées plus fréquemment.
Test chez l’animal
Une autre perspective intéressante est l’acquisition de données électrophysiologiques chez le rat.
Une collaboration avec l’équipe d’Alain Destexhe a été lancée pour recueillir des données
électrophysiologiques dans le cortex primaire du rat. Je devrais ainsi pouvoir confronter le modèle à
ces données au cours de mes années de thèse, sous la direction de Stanislas Dehaene, dans la
continuité des ce projet. Ces données devraient nous permettre de tester nos prédictions en termes
d’origine des courants, en particulier des courants du modèle prédictif dans la condition d’omission
d’un son attendu.
33
Limites et extensions possibles du modèle
Limitation à 2 sons purs
Le modèle développé ici ne permet de simuler qu’une réponse à des séquences de deux sons purs. La
généralisation du modèle à un plus grand nombre de sons est assez naturelle. Il suffit d’ajouter
autant de colonnes corticales connectées aux autres selon les mêmes règles.
Limitation à une dimension
Le modèle ne permet pas non plus de simuler les données de déviance par rapport à plusieurs
dimensions du stimulus [28]. Ce modèle est essentiellement construit pour la modélisation de sons
de fréquence différente. Le cortex auditif présentant également une cartographie de l’amplitude des
sons, on peut aisément proposer une adaptation de ce modèle aux déviants en amplitude. Le modèle
est aisément adaptable pour les cas ou il existe un code explicite des dimensions considérées dans le
cortex. Il est à noter que certaines extensions pourraient s’avérer couteuses en terme
computationnel, étant donné l’existence d’une ligne à retard pour chaque son codé.
Types de régularités
Les transitions pouvant être apprises par le système dépend de façon importante des propriétés du
réseau à échos du passé. Nous avons choisi d’utiliser des lignes à retard, notre modèle est donc
incapable de prendre en compte des combinaisons d’éléments pour prédire les entrées. Par
exemple, il est incapable d’apprendre que seule la combinaison de 4 A prédit un B car il n’existe pas
de trace spécifique de « AAAA ». On pourra seulement apprendre que le son de fréquence A prédit
un B avec une certaine probabilité sur plusieurs intervalles de temps. Nous avons émis l’idée que le
réseau à échos du passé soit en fait un seul réseau présentant des patterns d’activité complexes et
reproductibles. Etudier quel type d’information est disponible de façon reproductible dans un tel
réseau permettrait de mieux appréhender les propriétés potentielles d’un tel réseau.
MMN à des propriétés plus abstraites
Un ensemble de données suggèrent que la mismatch serait évoquée pour à des déviations à des
régularités plus abstraites que la violation de probabilités de transition[29]. Par exemple si les sons
sont présentés en paires de sons ascendants (l’écart de fréquence entre les deux sons étant constant
entre les paires), on observe une mismatch pour des paires de sons descendants ou répétés. Le
modèle, tel qu’il est implémenté ne permet pas de simuler ce paradigme. Cependant il permet de
proposer une interprétation différente de ces résultats.
Le cortex auditif primaire présente en effet une organisation tonotopique qui implique que chaque
neurone répond non seulement à sa fréquence préférée mais aussi à une bande de fréquence autour
de cette fréquence. Si on considère deux populations dont les fréquences préférées sont distantes de
la valeur de la différence standard dans la séquence présentée. Même si la fréquence préférée de ces
deux populations n’ont jamais été présenté, des fréquences proches l’ont déjà été car les fréquences
sont choisies au hasard parmi des valeurs qui sont trop proches les unes des autres pour que les
populations répondant aux différents stimuli ne se recoupent pas. Ces deux populations, donc ont
déjà été associées dans cet ordre. Bien qu’elles n’aient jamais été rencontrées en elles même, leur
probabilité de transition n’est donc pas nulle du point de vue de la réponse neuronale. Les données
présentées dans la littérature peuvent donc être expliquées sans recourir à un comparateur capable
d’extraire des régularités de haut niveau. Il est même inutile d’avoir recourt, comme May et Tiitinen,
à l’hypothèse de neurones codant pour des sens ou des amplitudes particulières de transition. Après
34
un certain nombre de présentations de paires dont les relations sont constantes, le modèle présenté
ici devrait apprendre une sorte de cartographie systématique selon la relation « A=>A+dfreq au
temps t + dt ».
S’il reste à vérifier que la MMN évoquée par certaines déviations quant à des propriétés
apparemment abstraites des stimuli n’est pas un artéfact de paradigmes expérimentaux mal
contrôlés, comprendre la détection de la déviance à des régularités abstraites ou impliquant des
échelles de temps supérieures à celle d’une fenêtre locale reste un challenge. Le paradigme de
Bekinstein et al a montré qu’il existe différents niveau de traitement des régularités et que la P3b
rend compte de processus capable d’identifier des régularités plus complexes que celles identifiables
par le réseau développé ici. Un objectif de poursuite de ce travail est de reprendre le principe
d’organisation hiérarchique proposé dans la théorie du codage prédictif pour tenter de rendre
compte de propriétés plus complexes. En particulier, on cherche à comprendre quelles peuvent être
les bases d’une cognition consciente de la structure régulière globale qui permettraient de rendre
compte des caractéristiques expérimentales de la P3b.
35
ANNEXES
Omission du 5ème son- Contexte AAAAAA
Figure 19 : Taux de décharge et entrées synaptiques moyens pour une séquence où le dernier son est omis dans la règle
AAAAA. Détails voir Figure 10
36
Réponse au standard local- contexte AAAAB
Figure 20 : Taux de décharge et entrées synaptiques moyens pour un standard dans la règle AAAAB. Détails voir Figure 10
37
Réponse au déviant local-Contextes AAAAB
Figure 21 : Taux de décharge et entrées synaptiques moyens pour un déviant (AAAAA) dans la règle AAAAB. Détails voir
Figure 10
38
Contrastes entre AAAAA et AAAAB- Contexte AAAAB
Figure 22 : Différence au niveau des entrées synaptiques moyennes entre les essais standards et déviants dans la règle
AAAAB. Détails voir Figure 12.
39
Bibliographie
[1]
A.M. Owen, M.R. Coleman, M. Boly, M.H. Davis, S. Laureys, J.D. Pickard, Detecting
awareness in the vegetative state., Science (New York, N.Y.). 313 (2006) 1402.
[2]
T. Bekinschtein, S. Dehaene, B. Rohaut, F. Tadel, L. Cohen, L. Naccache, Neural
signature of the conscious processing of auditory regularities, Proceedings Of The
National Academy Of Sciences. 106 (2009) 1672-1677.
[3]
N. Squires, K. Squires, S. Hillyard, Two varieties of long-latency positive waves evoked
by unpredictable auditory stimuli in man, Electroencephalography And Clinical
Neurophysiology. 38 (1975) 387–401.
[4]
R. Näätänen, M. Tervaniemi, E. Sussman, P. Paavilainen, I. Winkler, "Primitive
intelligence" in the auditory cortex., Trends In Neurosciences. 24 (2001) 283-8.
[5]
R. Naatanen, T. Jacobsen, I. Winkler, Memory-based or afferent processes in
mismatch negativity ( MMN ): A review of the evidence, Psychophysiology. 42 (2005)
25-32.
[6]
P. May, H. Tiitinen, Mismatch negativity (MMN), the deviance-elicited auditory
deflection, explained, Psychophysiology. 47 (2009) 66–122.
[7]
R. Näätänen, A. Gaillard, S. Mäntysalo, Early selective-attention effect on evoked
potential reinterpreted., Acta Psychologica. 42 (1978) 313-329.
[8]
K. Squires, C. Wickens, N. Squires, E. Donchin, The effect of stimulus sequence on the
waveform of the cortical event-related potential, Science. 193 (1976) 1142–1146.
[9]
N. Shinozaki, H. Yabe, T. Sutoh, T. Hiruma, S. Kaneko, Somatosensory automatic
responses to deviant stimuli., Cognitive Brain Research. 7 (1998) 165-71.
[10]
B.M. Pause, K. Krauel, Chemosensory event-related potentials (CSERP) as a key to the
psychology of odors., International Journal Of Psychophysiology : Official Journal Of
The International Organization Of Psychophysiology. 36 (2000) 105-22.
[11]
A. Tales, P. Newton, T. Troscianko, S. Butler, Mismatch negativity in the visual
modality, NeuroReport. 10 (1999) 3363–3367.
[12]
Y. Sato, H. Yabe, T. Hiruma, T. Sutoh, N. Shinozaki, N. Tadayoshi, et al., The effect of
deviant stimulus probability on the human mismatch process, Neuroreport. 11 (2000)
3703-3708.
[13]
J. Horváth, I. Winkler, How the human auditory system treats repetition amongst
change, Neuroscience Letters. 368 (2004) 157–161.
[14]
H. Yabe, M. Tervaniemi, K. Reinikainen, R. Näätänen, Temporal window of integration
revealed by MMN to sound omission, NeuroReport. 8 (1997) 1971-1974.
40
[15]
H. Hughes, T. Darcey, H. Barkan, P. Williamson, D. Roberts, C. Aslin, Responses of
human auditory association cortex to the omission of an expected acoustic event,
Neuroimage. 13 (2001) 1073–1089.
[16]
D. Javitt, M. Steinschneider, C. Schroeder, J. Arezzo, Role of cortical N-methyl-Daspartate receptors in auditory sensory memory and mismatch negativity generation:
implications for schizophrenia, Proceedings Of The National Academy Of Sciences. 93
(1996) 11962-11967.
[17]
I. Jaaskelainen, J. Ahveninen, G. Bonmassar, A. Dale, R. Ilmoniemi, S. Levanen, et al.,
Human posterior auditory cortex gates novel sounds to consciousness, Proceedings
Of The National Academy Of Sciences. 101 (2004) 6809–6814.
[18]
R.P. Rao, D.H. Ballard, Predictive coding in the visual cortex: a functional
interpretation of some extra-classical receptive field effects, Nature Neuroscience. 2
(1999) 79-87.
[19]
K. Friston, A theory of cortical responses, Philosophical Transactions Of The Royal
Society B. 360 (2005) 815-836.
[20]
K. Friston, J. Kilner, L. Harrison, A free energy principle for the brain, Journal Of
Physiology. 100 (2006) 70-87.
[21]
E. Izhikevich, Simple model of spiking neurons, IEEE Transactions On Neural
Networks. 14 (2003) 1569–1572.
[22]
N. Brunel, X. Wang, Effects of neuromodulation in a cortical network model of object
working memory dominated by recurrent inhibition, Journal Of Computational
Neuroscience. 11 (2001) 63-85.
[23]
C. Jahr, C. Stevens, Voltage Dependence of NMDA-Activated Predicted by SingleChannel Kinetics Macroscopic Conductances, Journal Of Neuroscience. 10 (1990)
3178-3182.
[24]
M. Spratling, Predictive Coding as a Model of Response Properties in Cortical Area
V1, Journal Of Neuroscience. 30 (2010) 3531-3543.
[25]
D. Debanne, D.E. Shulz, Y. Fregnac, Activity-dependent regulation of 'on' and 'off'
responses in cat visual cortical receptive fields., The Journal Of Physiology. 508 ( Pt 2
(1998) 523-48.
[26]
K. Friston, K. Stephan, Free-energy and the brain, Synthese. 159 (2007) 417–458.
[27]
D. Buonomano, Timing of neural responses in cortical organotypic slices, Proceedings
Of The National Academy Of Sciences. 100 (2003) 4897-4902.
41
[28]
C. Wolff, E. Schröger, Human pre-attentive auditory change-detection with single,
double, and triple deviations as revealed by mismatch negativity additivity,
Neuroscience Letters. 311 (2001) 37-40.
[29]
E. Schröger, A. Bendixen, N. Trujillo-Barreto, U. Roeber, Processing of abstract rule
violations in audition, PLoS One. 2 (2007).
42
Téléchargement