COGMASTER 2009-2010 Un modèle de codage prédictif par populations de neurones appliqué à la réponse à la nouveauté du cortex auditif primaire Mémoire de Master 2 Catherine Wacongne – Sous la direction de Stanislas Dehaene 04/06/2010 Unité de Neuroimagerie Cognitive – CEA/INSERM Sommaire Sommaire ................................................................................................................................................ 2 1. 2. 3. Introduction .................................................................................................................................... 3 1.1. Données expérimentales sur la MMN ..................................................................................... 5 1.2. Cadre théorique....................................................................................................................... 7 Matériel et Méthodes..................................................................................................................... 9 2.1. Choix du type de modèle ......................................................................................................... 9 2.2. Organisation du réseau ......................................................................................................... 11 2.3. Règles de plasticité ................................................................................................................ 14 2.4. Implémentation du réseau .................................................................................................... 16 2.5. Séquences test des simulations. ........................................................................................... 17 Résultats........................................................................................................................................ 17 3.1. Paradigme local/global .......................................................................................................... 17 3.1.1. Contexte AAAAA ............................................................................................................ 17 3.1.2. Contexte AAAAB ............................................................................................................ 24 3.2. Séquences alternées.............................................................................................................. 25 3.2.1. 3.3. 4. Contexte ABABA ............................................................................................................ 26 Paradigme Oddball ................................................................................................................ 29 Discussion et perspectives............................................................................................................ 30 Bilan ................................................................................................................................................... 30 Confrontation avec les données expérimentales .............................................................................. 30 Prédictions et test du modèle ........................................................................................................... 32 Limites et extensions possibles du modèle ....................................................................................... 34 ANNEXES ............................................................................................................................................... 36 2 1. Introduction Reconnaitre un organisme conscient est un challenge non résolu. Lorsque nous tentons d’évaluer l’état de conscience des êtres humains qui nous entourent, nous nous basons essentiellement sur le rapport subjectif qu’ils sont capable de faire. Si une personne est capable de communiquer le fait qu’elle se sent subjectivement consciente, dans un contexte où il est improbable que cette réponse soit due au hasard, nous admettons que cette personne est consciente. Lorsque des patients perdent la capacité de communiquer avec l’extérieur, poser la question de l’état de conscience devient complexe. Malgré tout, ce diagnostique est crucial pour adapter la prise en charge clinique des patients en état apparemment végétatif. Récemment, ce problème a reçu une attention particulière de la part des cliniciens, qui commencent à exploiter l’imagerie fonctionnelle, en particulier l’IRM fonctionnelle, comme interface de communication avec des patients potentiellement conscients mais prisonniers de leur corps [1]. Si ces méthodes ont permis d’obtenir des résultats spectaculaires sur quelques cas, elles souffrent de divers inconvénients. D’une part les protocoles IRM sont couteux et complexes à mettre en place de façon systématique, d’autre part, les méthodes utilisées demandent que le patient maintienne une imagerie mentale sur de longues périodes, ce qui requiert une attention soutenue. Il est possible que des patients dont les états de conscience sont fluctuants, appelés patients minimalement conscients, passent au travers de telles méthodes. Il serait donc souhaitable de développer des techniques plus théoriquement fondées et utilisant des méthodes moins couteuses et plus simple d’implémentation. Une telle approche permet un enrichissement mutuel de la clinique par la recherche et vice versa. Dans cette perspective Bekinstein et al.[2] ont développé un protocole auditif passif utilisant des enregistrements MEG/EEG aisément applicable à des patients. Des données de la littérature montrent qu’il existe deux types de réponses évoquées par un son inattendu [3] : une réponse précoce à la déviance dans un flux régulier (connu dans la littérature sous le nom de MMN) et le complexe P300. La MMN a plutôt été associée à une réponse pré attentionnelle automatique et inconsciente [4] alors que la composante tardive de la P300 (P3b) est considérée comme un indice du rafraichissement de la mémoire de travail et associée à l’accès conscient. Partant de ces données, le protocole mis en place teste l’hypothèse que différents types de déviance affecteront différemment les deux réponses évoquées. Le protocole (Figure 1), auquel on fera référence par la suite sous le nom de « local/global », consiste en l’écoute passive de stimuli sonores, il ne nécessite donc pas de concentration particulière. Les sujets entendent des groupes de 5 sons, pouvant appartenir à 2 catégories : soit les 5 sons sont identiques (XXXXX), soit seuls les 4 premiers sont identiques et le dernier diffère (XXXXY). Dans ce cas le dernier son représente une violation de la règle locale de répétition établie par les premiers sons. Le sujet entend ces groupes de sons au sein d’un bloc de quelques minutes au cours duquel une des catégories est majoritairement représentée : 25 groupes de la catégorie dominante fixent la « règle » en début de bloc. Une centaine de groupes de 5 sons sont présentés ensuite, dont 20% de groupes appartenant à l’autre catégorie. Ces groupes constituent une déviance à la règle globale. Un déviant à la règle locale peut ainsi se trouver être la séquence globalement régulière. La déviance est dans ce cas parfaitement prédictible. 3 Figure 1: design expérimental du protocole développé par Bekinstein et al. L’analyse des résultats montre que les deux types de déviance évoquent deux types de réponses différentes. La déviance à la règle locale évoque une composante précoce, 150 ms environ après le début du dernier son. Cette composante est bien connue dans la littérature sous le nom de Mismatch negativity (MMN). La déviance à la règle globale évoque une réponse plus tardive sous forme d’une P300. De façon intéressante, alors que la mismatch negativity est peu affectée par les états de conscience des sujets ou leur état d’attention, la P3 est très diminuée chez les sujets ne portant pas attention au stimulus, et disparait complètement chez les patients végétatifs. Ce paradigme fournit donc une dissociation entre 2 niveaux de traitement : un niveau « automatique » peu dépendant des ressources attentionnelles, apparemment local dans le temps ; et un niveau conscient capable de coder pour des régularités de plus haut niveau. Afin de mieux comprendre la spécificité du niveau conscient, on souhaite développer un modèle neuronal biologiquement plausible permettant de rendre compte de ces effets. Dans un premier temps on s’intéressera au niveau « automatique » afin de mieux comprendre ses capacités et la nature de l’information codée. De façon surprenante, malgré une littérature plus qu’abondante, il n’existe pas de consensus théorique sur la façon dont la MMN est générée ou même sur sa signification computationnelle [5][6]. Après une revue des principales données expérimentales de la littérature contraignant le modèle, ainsi que des principales pistes théoriques pertinentes, nous proposerons un modèle possible de la mismatch negativity à l’échelle locale et en discuterons les performances. 4 1.1.Données expérimentales sur la MMN Le terme mismatch negativity a été introduit en 1978 par Näätänen et al.[7] pour décrire une composante des potentiels évoqués (ERP) décrite auparavant par Squires [8] produite par un changement dans le flux de stimuli. Cette composante n’est apparemment pas spécifique de la modalité auditive car des analogues on pu être décrites dans la modalité somato-sensorielle [9], olfactive [10] et visuelle [11]. L’immense majorité de la littérature sur la MMN reste cependant concentrée sur la modalité auditive. Effet1 : MMN à la déviance dans un flux de sons purs répétés à intervalles réguliers Dans le paradigme dit « oddball » un stimulus auditif est répété à intervalle régulier (le standard). De façon rare, un son de fréquence, d’amplitude, de durée différente est présenté : c’est un déviant. La MMN est la composante négative obtenue de façon reproductive en soustrayant les ERP produits par un stimulus donnée entre la condition ou il est en position de déviant et celle où il est en position de standard. De façon générale, on trouve une mismatch negativity significative entre 100 et 200 ms après le début du stimulus déviant. Effet2 : Sensibilité de l’amplitude de la MMN à la fréquence du déviant L’amplitude de la mismatch negativity varie en fonction de la magnitude de la différence physique entre le standard et le déviant : si le déviant est un son pur d’une fréquence différente mais proche du standard, l’amplitude de la mismatch est proportionnelle à l’écart entre les fréquences des deux sons. Pour des fréquences suffisamment différentes, l’amplitude de la mismatch est constante. L’amplitude de la mismatch varie également avec la probabilité d’occurrence du son déviant. Dans un paradigme oddball, une étude [12] a pu montrer que l’amplitude de la mismatch augmente quand la différence entre les probabilités d’occurrence du standard et du déviant augmente (Figure 2). Figure 2 : Mismatch negativity (déviant-standard) en fonction de la fréquence du déviant dans un paradigme oddball. Repris de Sato et al. Effet3 : MMN à la répétition dans un signal alterné La mismatch negativity est cependant sensible à des relations plus complexes que la simple fréquence relative des stimuli. Dans un signal alterné (ABABA… ) la répétition d’un élément (ABABABBABABA..) évoque une MMN [13]. 5 Effet4 : MMN à l’omission d’un son attendu En outre, plusieurs études ont pu montrer l’existence d’une MMN à l’omission [14]. Cette MMN est décrite en cas d’interruption de séquences régulières longues telles qu’une séquence oddball, mais aussi pour l’omission d’un son attendu dans des séquences courtes répétées. Par exemple, si on présente régulièrement des paires de sons identiques, en omettant de façon rare le second son, le déviant est un son isolé. On peut comparer la réponse au déviant à la réponse au même son présenté de façon isolée dans un bloc contrôle. On observe que les deux réponses à ce même stimulus sont très différentes : la réponse au son isolé dans le conteste ou une paire est attendue est plus proche de la réponse à la paire que de la réponse au son isolé en condition contrôle [15]. Cette observation va à l’encontre d’une théorie purement feedforward de la réponse auditive. Effet5 : insensibilité à la prédictibilité du déviant local dans le paradigme « Local/Global » Dans le paradigme développé par Bekinstein et al, on observe qu’une MMN est évoquée pour un son différent après 4 sons identiques même si le son déviant est parfaitement prédictible dans le contexte global.(Figure 3, haut) Effet Local Effet Global Figure 3 : ERP des effets local et global au niveau de l’électrode Fz. On peut identifier les pics de réponse aux 5 sons avec une différence entre le standard et le déviant local sur le 5ème son indépendamment du contexte (significative sur une autre électrode). On peut également observer un effet de la déviance globale (bas) sur la réponse précoce (significative sur des données MEG non publiées) Effet6 : localisation électrophysiologiques des sources de courants de la MMN Les données électrophysiologiques de l’équivalent animal de la mismatch negativity sont rares. On dispose cependant de quelques études chez le singe où des électrodes placées dans le cortex auditif primaire (A1) permettent de décomposer les sources de courant en fonction des couches corticales [16] (Figure 4). Ces études montrent que la plus grande partie de la différence entre la réponse au standard et la réponse au déviant provient essentiellement des couches supragranulaires. Effet7 : Sensibilité de la MMN aux inhibiteurs des récepteurs NMDA Cette étude montre également que l’injection au site d’enregistrement d’un inhibiteur non compétitif des récepteurs NMDA (le PCP) affecte peu la réponse au standard, et supprime la différence entre la réponse au standard et la réponse au déviant. La mismatch semble donc dépendre crucialement d’un signal dépendant de récepteurs NMDA. 6 Figure 4 : Profile « Current Source Density » (CSD) dans le cortex auditif primaire du singe en réponse à un stimulus standard (haut) ou déviant (centre) dans le cadre d'un paradigme oddball. Différence de ces deux profiles (bas). A droite, effet de la phéncyclidine (PCP - inhibiteur non compétitif des récepteurs NMDA) injectée localement sur ces profils. 1.2. Cadre théorique Malgré la littérature abondante sur la MMN, aucune théorie n’est parvenue à s’imposer pour rendre compte de la génération de la mismatch negativity. Cependant, différentes théories ont été proposées. Modèle adaptatif La théorie la plus simple est celle de l’habituation synaptique. Le phénomène d’adaptation ou d’habituation synaptique est largement décrit dans la littérature : lorsque la même synapse est stimulée de façon répétée, les potentiels post synaptiques sont souvent de plus en plus réduits. La réponse maximale est récupérée avec une constante de temps variant d’une à une vingtaine de secondes. Ainsi, la fraction des neurones du cortex primaire qui répondent au stimulus standard subit une adaptation synaptique qui engendre l’amoindrissement de la réponse. La fraction de neurones qui répondent seulement au déviant ne subit pas cette adaptation et produit donc une réponse de plus forte amplitude que la réponse au standard. Cette théorie dans sa forme la plus simple permet de rendre aisément compte de l’effet de la fréquence du déviant sur l’amplitude de la mismatch, car l’adaptation synaptique spécifique au déviant est d’autant plus forte en moyenne que le déviant est fréquent. Il est plus difficile de rendre compte de la mimsatch à la répétition dans un signal alterné ou de la réponse à l’omission. May et al. défendent cependant que la plupart de ces 7 effets peuvent être modélisés par un modèle d’adaptation à condition de supposer l’existence de neurones codant pour des propriétés plus complexes qu’une simple tonotopie et de prendre en compte le caractère dynamique du système. Par exemple, si un neurone répond spécifiquement non seulement à une fréquence sonore mais aussi à un certain ISI dans la présentation des sons, l’effet de mismatch à la répétition est rendu car la répétition implique une stimulation des neurones répondant à la fréquence d’un des 2 sons pour un ISI égal à la moitié de l’ISI « adapté » et engendre donc une réponse plus importante. L’interprétation de chaque phénomène requiert cependant l’existence de neurones codant pour une propriété spécifique du stimulus (sens de la variation, longueur de la séquence de stimulation…). Modèle basé sur une mémoire du passé (« memory based model ») La théorie qui prévaut dans la littérature est le « memory based model ». Ce modèle suppose que la MMNest générée de façon spécifique par un comparateur entre une mémoire du stimulus et les entrées sensorielles. Si les entrées sensorielles ne sont pas conformes aux régularités de la mémoire, le comparateur émet un signal : la MMN. Ce modèle n’est cependant pas implémenté de façon convaincante dans un réseau neurocomputationel réaliste. Il ne précise pas de quelle façon, ni sur quelle durée les entrées sont conservées en mémoire, ni comment la comparaison s’effectuerait. L’un des arguments majeurs de cette théorie est l’apparente dissociation des sources générant la N1 et la MMN. Ce point a cependant été remis en question depuis quelques années[17] : la N1 comprendrait 2 sources qui seraient altérées de façon différentes par les stimuli précédents. Cela déplacerait le centre de gravité apparent de la source menant à la conclusion erronée qu’il existerait 2 sources distinctes. Codage prédictif (« predictive coding ») Depuis une décennie, l’hypothèse du codage prédictif(Figure 5) connait un succès grandissant. Cette approche du fonctionnement du cerveau postule que le système apprend les régularités statistiques du monde et utilise cette information pour signaler aux niveaux supérieurs de traitement les déviations de ces régularités, c'est-à-dire les éléments non prédictibles du signal qui contiennent des informations nouvelles par rapport à ce que le système est capable d’anticiper. Cette théorie rompt avec une tradition psychophysique consistant à considérer le cerveau comme un organe passif réagissant à des stimulations extérieures et postule au contraire que le cerveau émet en permanence des prédictions actives quant aux entrées attendues. Elle a été appliquée avec succès par Rao et Ballard [18] à la modélisation des champs récepteurs du cortex visuel primaire pour en expliquer certaines propriétés. Figure 5 : schéma du principe de codage prédictif. Repris de Rao et Ballard, 1999 Cette théorie a été reprise dans un cadre plus général par Karl Friston[19]. Il explore l’hypothèse que de manière générale tout organisme biologique tend vers une optimisation de son énergie libre[20]. Le principe de codage prédictif découlerait mathématiquement de ce principe plus général. Ne coder 8 que les éléments surprenants est le mode de codage le plus économique de l’information. Friston propose d’interpréter la MMN en termes d’erreur de prédiction dans un cadre Bayésien : par une modification des connections plastiques venant de projections descendantes ou latérales, le système apprendrait à minimiser son énergie libre en prédisant mieux le stimulus. Une hypothèse forte de la théorie fristonienne est que le système biologique est optimal et peut être décrit de façon mathématique en développant les conséquences logiques de ce principe général. Nous choisissons au contraire ici de partir des données empiriques et de construire un modèle tenant compte des contraintes biologiques en termes de courants synaptiques et de plasticité. 2. Matériel et Méthodes 2.1.Choix du type de modèle Notre but est de développer un modèle aussi simple que possible mais biologiquement plausible de la mismatch. Pour approximer au mieux les dynamiques des courants synaptiques, et de la dynamique de membrane des neurones on choisit un modèle de spiking neurones. Les équations développées par Izhikevich[21] permettent d’approximer au mieux les dynamiques de membrane de différents types de neurones à moindre coût computationnel. Ces équations sont issues de l’étude des équations d’Hodgkin-Huxley dans la théorie des bifurcations et permettent de rendre compte d’un grand nombre de comportements physiologiques données par ces équations avec un système à 2 dimensions obéissant aux équations différentielles suivantes : 𝑑𝑣 = 0.04𝑣 2 + 5𝑣 + 140 𝑢 + 𝐼𝑠𝑦𝑛 𝑑𝑡 𝑑𝑢 = 𝑎(𝑏𝑣 − 𝑢) 𝑑𝑡 Avec une réinitialisation après chaque spike : 𝑠𝑖 𝑣 ≥ 30 𝑚𝑉 𝑎𝑙𝑜𝑟𝑠 𝑣 ←𝑐 𝑢 ←𝑢+𝑑 Où 𝑣 et 𝑢 sont des variables sans dimension : 𝑣 représente le potentiel de membrane du neurone et 𝑢 est un paramètre de récupération de la membrane qui rend compte de l’activation des canaux ioniques sélectifs au 𝐾 + et de l’inactivation des canaux ioniques sélectifs au 𝑁𝑎+ . 𝑎, 𝑏, 𝑐 𝑒𝑡 𝑑 sont des paramètres sans dimension, qui permettent de rendre compte des divers types de comportement de neurones observés électrophysiologiquement. 𝑎 décrit l’échelle de temps de la variable de récupération. 𝑏 décrit la sensibilité de la variable de récupération aux fluctuations sous le seuil. 𝑐 décrit la valeur auquel le potentiel est réinitialisé après un spike, et 𝑑 décrit la valeur ajoutée au paramètre de récupération après un spike. Pour notre modèle on utilise deux types de neurones : des neurones excitateurs en utilisant des paramètres correspondant à des neurones de type 𝑎 = 0.02 𝑏 = 0.2 + 0.04 𝑟𝑎𝑛𝑑 2 « Regular spiking » : 𝑐 = −65 + 10 𝑟𝑎𝑛𝑑 2 𝑑 = 8 − 2 𝑟𝑎𝑛𝑑 2 9 des neurones inhibiteurs en utilisant des paramètres décrivant le comportement de 𝑎 = 0.06 + 0.04 𝑟𝑎𝑛𝑑 2 𝑏 = 0.2 neurones de type « fast spiking » : 𝑐 = −65 𝑑=2 On ajoute une variabilité aux paramètres afin d’obtenir des comportements moins stéréotypés et plus physiologiques. Pour modéliser les courants post synaptiques, on se base sur le modèle développé par Brunel et Wang[22]. On modélise des courants excitateurs glutamatergiques médiés par des récepteurs AMPA (𝐼𝐴𝑀𝑃𝐴 ) ou NMDA (𝐼𝑁𝑀𝐷𝐴 ). On ne modélise qu’un seul type de courant GABAergique (𝐼𝐺𝐴𝐵𝐴 ). Le total des entrées synamptiques à un instant t est donné par : 𝐼𝑠𝑦𝑛 𝑡 = 𝐼𝐴𝑀𝑃𝐴 𝑡 + 𝐼𝑁𝑀𝐷𝐴 𝑡 + 𝐼𝐺𝐴𝐵𝐴 𝑡 + 𝐼𝑒𝑥𝑡 (𝑡) Où 𝐼𝑒𝑥𝑡 est un courant additionnel représentant les entrées provenant de l’extérieur du réseau modélisé. Tous les neurones sont soumis à un certain niveau de « bruit blanc» de moyenne nulle mais d’amplitude variable. Les neurones représentant les sorties thalamiques reçoivent en plus un courant positif constant de la durée des entrées. Les autres courants sont calculés comme suit : 𝐶𝐸 𝑤𝑗𝐴𝑀𝑃𝐴 𝑠𝑗𝐴𝑀𝑃𝐴 (𝑡) 𝐼𝐴𝑀𝑃𝐴 (𝑡) = 𝑔𝐴𝑀𝑃𝐴 𝑉 𝑡 − 𝑉𝐸 𝑗 =1 𝐼𝑁𝑀𝐷𝐴 (𝑡) = 𝐶𝐸 𝑔𝑁𝑀𝐷𝐴 𝑉 𝑡 − 𝑉𝐸 1 + 𝑀𝑔2+ 𝑒𝑥𝑝 −0.062 𝑉(𝑡)/3.57 𝑤𝑗𝑁𝑀𝐷𝐴 𝑠𝑗𝑁𝑀𝐷𝐴 (𝑡) × 𝑗 =1 𝐶𝐼 𝑤𝑗𝐺𝐴𝐵𝐴 𝑠𝑗𝐺𝐴𝐵𝐴 (𝑡) 𝐼𝐺𝐴𝐵𝐴 (𝑡) = 𝑔𝐺𝐴𝐵𝐴 𝑉 𝑡 − 𝑉𝐼 𝑗 =1 Où 𝑉𝐸 = 40𝑚𝑉 et 𝑉𝐼 = −80𝑚𝑉. Les poids 𝑤𝑗 sont sans dimension et représentent la structure des connections entre les neurones du réseau modélisé. Les courants NMDA ont une dépendance au voltage contrôlée par la concentration en magnésium extracellulaire[23]. On prend 𝑀𝑔2+ = 1𝑚𝑀. Les conductances sont adaptées de Wang et al. pour obtenir l’excitabilité désirée en utilisant les équations d’Izhikevich. Pour les neurones excitateurs on prend 𝑔𝐴𝑀𝑃𝐴 = 0.3 , 𝑔𝑁𝑀𝐷𝐴 = 0.08, 𝑔𝐺𝐴𝐵𝐴 = 0.3. Pour les neurones inhibiteurs on a 𝑔𝐴𝑀𝑃𝐴 = 0.2, 𝑔𝑁𝑀𝐷𝐴 = 0.065, 𝑔𝐺𝐴𝐵𝐴 = 0.2. 𝑠𝑗 décrit la fraction des canaux ouverts à chaque synapse. Pour les courants AMPA elle suit la dynamique: 𝑑𝑠𝑗𝐴𝑀𝑃𝐴 𝑡 𝑑𝑡 = 𝑠𝑗𝐴𝑀𝑃𝐴 (𝑡) 𝜏𝐴𝑀𝑃𝐴 𝛿 𝑡 − 𝑡𝑗𝑘 + 𝑘 Où le temps de décroissance des courants AMPA, 𝜏𝐴𝑀𝑃𝐴 = 2𝑚𝑠 et la somme sur k représente la somme sur les spikes provenant des neurones présynaptiques à l’instant t. 10 La fraction de canaux ouverts aux synapses NMDA est décrite par : 𝑑𝑠𝑗𝑁𝑀𝐷𝐴 𝑡 𝑑𝑡 = 𝑠𝑗𝑁𝑀𝐷𝐴 (𝑡) 𝜏𝑁𝑀𝐷𝐴 ,𝑑𝑒𝑐𝑎𝑦 + 𝛼𝑥𝑗 𝑡 1 − 𝑠𝑗𝑁𝑀𝐷𝐴 (𝑡) 𝑑𝑥𝑗 𝑡 𝑥𝑗 𝑡 = + 𝑑𝑡 𝜏𝑁𝑀𝐷𝐴 ,𝑟𝑖𝑠𝑒 𝛿 𝑡 − 𝑡𝑗𝑘 𝑘 Où le temps de décroissance des courants NMDA est 𝜏𝑁𝑀𝐷𝐴 ,𝑑𝑒𝑐𝑎𝑦 = 100 𝑚𝑠, 𝛼 = 0.5 𝑚𝑠 −1 et 𝜏𝑁𝑀𝐷𝐴 ,𝑟𝑖𝑠𝑒 = 2 𝑚𝑠. Enfin, la variable synaptique GABA suit la dynamique : 𝑑𝑠𝑗𝐺𝐴𝐵𝐴 𝑡 𝑑𝑡 = 𝑠𝑗𝐺𝐴𝐵𝐴 (𝑡) 𝜏𝐺𝐴𝐵𝐴 𝛿 𝑡 − 𝑡𝑗𝑘 + 𝑘 Où le temps de décroissance des courants GABA est 𝜏𝐺𝐴𝐵𝐴 = 10 𝑚𝑠 . On néglige le temps de montée des courants GABA et AMPA qui sont tous les deux très cours (inférieurs à une milliseconde, qui est notre pas de temps de simulation). Toutes les simulations sont exécutées par un ensemble de fonctions écrites pour l’occasion en Matlab. Le pas de simulation utilisé est de 1ms. 2.2.Organisation du réseau On l’a vu, l’hypothèse adaptative de la MMN est le modèle le plus précisément implémenté à ce jour, bien qu’il s’agisse de l’hypothèse la moins couramment admise. Nous cherchons ici à implémenter un modèle aussi simple que possible mais utilisant des courants synaptiques réalistes, rendant compte de l’hypothèse de la MMN comme résultat d’une détection de déviance locale par rapport à des régularités inférées du contexte. La MMN à la répétition dans un signal alterné et la mismatch d’omission plaident en effet en faveur d’un modèle prédictif qui émet des prédictions actives en temps réel sur les entrées et les compare aux entrées réelles. Le modèle que nous mettons en place est donc proche dans son implémentation d’autres modèles prédictifs qui ont pu être développés pour modéliser les propriétés des champs récepteurs au sein du cortex visuel primaire. Une différence majeure avec les modèles du cortex visuels est la dimension sur laquelle porte la prédiction. Les modèles visuels portent en effet majoritairement sur deux dimensions spatiales, du fait même des relations régulières qui existent dans les stimuli naturels entre les éléments proches spatialement. Les régularités auditives qui nous intéressent sont temporelles. Les prédictions du modèle que nous développons ici devront donc être locales dans le temps au contraire des propriétés des champs récepteurs visuels qui résultent principalement de prédictions locales dans l’espace. Les données du paradigme local global sont en accord avec l’idée que les prédictions qui seraient émises par un tel modèle se basent sur une fenêtre de temps ou d’éléments limitées : dans la condition où les groupes AAAAB sont la règle, le dernier B est parfaitement prédictible sur la base des 4 éléments précédents, cependant la réponse de mismatch existe quelque soit le contexte général. Ce résultat est cohérent avec l’idée que le modèle prédictif n’est capable de prendre en 11 compte qu’un nombre limité d’éléments pour émettre ses prédictions et fixe ici ce nombre d’éléments à moins de 4 ou à une fenêtre temporelle inférieure à 1s. Un parti pris du modèle est de proposer un mécanisme purement local permettant de rendre compte de la majeure partie des résultats expérimentaux décrits ci-dessus. Cette brique de base pourrait ainsi être implémentée dans un contexte plus large que le cas particulier du cortex auditif primaire étudié ici, en particulier on pourrait imaginer une organisation hiérarchique de telles briques permettant de rendre compte des stimuli à des niveaux de plus en plus intégrés. Figure 6 : Schéma du modèle proposé pour rendre compte de la MMN à des séquences de 2 sons purs de fréquences respectives A et B Le modèle proposé ici (Figure 6) se propose donc d’implémenter l’idée simple selon laquelle le cerveau extrait les régularités statistiques des stimuli entrants et construit un modèle prédictif pour anticiper les sons attendus. Les prédictions du modèle sont comparées au stimulus entrant. La comparaison des stimuli prédits aux entrées réelle permet deux choses : identifier les stimuli « surprenants » c'est-à-dire imprévus, qui sont susceptibles de demander une certaine attention et adapter le modèle dans le cas où les régularités du stimulus entrant changent. Par soucis d’économie computationnelle, on s’est limité ici à modéliser les populations de neurones de 2 colonnes répondant à 2 sons de fréquences suffisamment différentes pour que chaque population ne réponde pas à la fréquence préférée de l’autre. On modélise également 2 populations 12 correspondant aux sorties thalamiques répondant respectivement aux même fréquences préférées que les deux colonnes corticales. On choisit la modélisation la plus simple de ces entrées : l’activité des populations est imposée par un courant positif en créneau lorsque leur fréquence préférée est présente dans le stimulus. Outre les entrées thalamiques, le modèle comporte 3 grands types de populations excitatrices : Une population « prédictive » qui est le cœur du modèle. Le modèle est construit pour que l’activité de cette population cherche à anticiper les entrées thalamiques. Si l’activité de cette population n’anticipe pas les entrées présentes, elle reçoit un signal d’erreur utilisé pour ajuster le modèle prédictif. La population d’erreur de prédiction qui calcule la différence entre les entrées réelles et l’activité de la population prédictive et augmente son activité dans le cas ou les entrées réelles ne sont pas annulés par les prédictions du modèle. Un réseau récurrent assez large utilisé comme mémoire évanescente du passé proche appelé ici réseau des états d’écho du passé. Les poids synaptiques entre cette population et la population prédictive constituent le modèle prédictif à proprement parler. Ce réseau à échos a en effet pour rôle de présenter une activité spécifique des entrées passées et du temps écoulé depuis ces entrées. Décrivons à présent avec plus de détail le rôle et les relations entre ces différentes populations. Réseau des états d’écho du passé Afin de d’émettre des prédictions en fonction du passé proche, il est nécessaire de donner une certaine « épaisseur » au passé, c'est-à-dire d’en garder une trace caractéristique à la fois de sa nature et du temps écoulé depuis son occurrence pendant un temps. Si un son de fréquence A est présenté au système on souhaite qu’une activité dépendante de cette entrée existe dans le réseau quelques centaines de millisecondes après l’entrée, que cette activité soit reproductible pour chaque présentation de A et différente de celle évoquée par d’autres fréquences. On souhaite également que le pattern d’activité évoqué par A varie au cours du temps, toujours de manière reproductible. Ainsi, un pattern d’activité donné donne une information sur les fréquences présentées au réseau et sur le temps écoulé depuis leur présentation. Seule l’information présente dans ce réseau peut être utilisée pour construire le modèle prédictif. Les propriétés de ce réseau sont donc une importante variable du modèle. Par soucis de simplicité on choisit dans un premier temps un modèle simpliste consistant en une ligne à retard : on modélise une ligne à retard pour chaque fréquence et on laisse l’activité se propager de proche en proche dans le réseau jusqu’à arriver au bout de la population. Ce modèle extrêmement simple présente de nombreuses propriétés indésirables sur lesquelles nous reviendrons plus tard mais présente l’avantage d’avoir un comportement parfaitement maitrisé qui facilite la compréhension des résultats du modèle pour une première approche. Population d’erreur de prédiction Cette population calcule la différence entre les entrées prédites et réelles. Pour réaliser cette computation à l’échelle du neurone il est nécessaire de construire une copie inhibitrice de l’activité de la population prédictive. La population prédictive projette donc sur une population d’interneurones. Le calcul de la différence se fait par intégration des entrées excitatrices thalamiques et des entrées inhibitrices des interneurones reproduisant le pattern d’activité de la population prédictive. 13 De façon intéressante, une question rarement abordée par des modèles plus formels est ici soulevée : la différence calculée ici peut être algébriquement positive ou négative. Si les deux signes peuvent être traités de façon symétrique dans un modèle formel, il n’en est pas de même pour un modèle neuronal. En effet, l’effet de chaque possibilité est radicalement asymétrique. Si le signe de cette différence est positif, l’intégration donne lieu à une augmentation de l’activité du neurone. En revanche, si la différence est négative, l’intégration aboutit à une réduction du taux de décharge par rapport à l’activité basale, signal beaucoup plus complexe à utiliser computationnellement. Nous reviendrons sur les conséquences de ce fait lorsque nous considérerons les règles d’apprentissage de plasticité synaptique. Par analogie avec d’autres modèles de codage prédictif [24] on propose que cette population corresponde à la couche IV du cortex auditif primaire. Population prédictive Cette population reçoit des entrées des 2 types de populations présentées précédemment : les populations à échos du passé qui contiennent l’information sur le passé proche, et la population d’erreur de prédiction. Le modèle prédictif à proprement parler est stocké dans les pondérations synaptiques entre le réseau à échos et la population prédictive. Par exemple, si les poids synaptiques entre les neurones de la ligne à retard de A correspondant aux neurones actifs lorsqu’un son de fréquence A a été présenté 200ms auparavant et la sous population prédictive de B sont élevés, cela équivaut à la prédiction « si un son de fréquence A et présenté à instant t, alors il est probable (et donc attendu) qu’un son de fréquence B survienne 200ms plus tard ». La population prédictive reçoit également un signal d’erreur dans le cas où les entrées n’ont pas été anticipées. Ce signal doit être utilisé pour mettre à jour le modèle. 2.3.Règles de plasticité Les seules connections plastiques dans ce modèle sont celles entre le réseau à échos du passé et la population prédictive. Le but de la plasticité est d’adapter les poids synaptiques afin de prédire au mieux les entrées probables sur la base du contexte. Les données de l’étude d’électrophysiologie chez le singe montrent que la différence entre standard et déviant provient essentiellement d’un signal supplémentaire dépendant crucialement de récepteurs NMDA. Un effet similaire est reproduit chez l’humain : on observe une réduction de la MMN et du taux de détection des déviants si on administre de la kétamine (antagoniste des récepteurs NMDA) à des sujets saints. Ces données sont cohérentes avec l’hypothèse que le signal entre la population d’erreur de prédiction et la population prédictive serait médié par des synapses où les récepteurs NMDA seraient majoritaires. De plus, on sait que les récepteurs NMDA induisent un signal calcique dont dépend la plasticité de type « spike timing dependant plasticity » (STDP). Le signal d’erreur peut ainsi être utilisé pour superviser l’apprentissage du modèle prédictif entre le réseau à échos du passé et la population prédictive. Ce mode d’apprentissage suppose que 2 conditions soient vérifiées : que seules les synapses entre le réseau à échos du passé et le modèle possèdent la machinerie nécessaire à la plasticité synaptique et que les synapses provenant de la population d’erreur de prédiction soient sur les mêmes dendrites et proches des synapses plastiques afin que le signal calcique local puisse être utilisé. 14 On utilise donc une règle de plasticité dépendant d’une part du timing entre les spikes présynaptiques provenant du réseau à échos du passé et les spikes post synaptiques de la population prédictive. Cette plasticité est d’autant plus forte que le signal calcique induit par l’erreur de prédiction est fort. On suit donc une règle de type : Si spike post : ∆𝑤𝑝𝑟 é,𝑝𝑜𝑠𝑡 = 𝑐𝑝 𝐼𝐶𝑎 2+ − 𝑇ℎ exp(𝑡 − 𝑡𝑠𝑝𝑖𝑘𝑒 𝑝𝑟 é ) Si spike pré : ∆𝑤𝑝𝑟 é,𝑝𝑜𝑠𝑡 = −𝑐𝑝 𝐼𝐶𝑎 2+ − 𝑇ℎ exp(𝑡 − 𝑡𝑠𝑝𝑖𝑘𝑒 𝑝𝑜𝑠𝑡 ) Où 𝑇ℎ est un seuil correspondant au courant calcique moyen lorsque la population de signal d’erreur présente une activité basale. On choisit 𝑐𝑝 = 30 𝑒𝑡 𝑇ℎ = 0.5 Cette règle d’apprentissage permet donc de renforcer les synapses entre les neurones du réseau à échos du passé qui déchargent de façon reproductible avant le signal d’erreur. Les paramètres des synapses entre la population d’erreur de prédiction et la population prédictive sont également fixés afin qu’une erreur de prédiction importante impose une activité des neurones prédictifs, nécessaire à la STDP. Cette règle d’apprentissage permet d’apprendre des probabilités de transition du type « A implique B 100 ms plus tard ». Cependant elle est insuffisante pour détruire des régularités qui ne seraient plus vérifiées. Par exemple si le réseau a appris que « A implique B 100ms plus tard » et que les régularités du stimulus changent de telle façon que « A implique B 200ms plus tard mais jamais 100ms plus tard » désormais, la règle présentée ci-dessus permet d’apprendre aisément la nouvelle association temporelle entre A et B mais pas d’apprendre que l’ancienne règle n’est plus valable. En effet, 100ms après l’occurrence d’un son de fréquence A le modèle prédictif produit des entrées excitatrices sur la population prédictive de B alors que rien de particulier ne se produit au niveau de la population d’erreur de prédiction. Les poids synaptiques ne sont donc pas modifiés par la règle de plasticité car 𝐼𝐶𝑎 2+ ≅ 𝑇ℎ cependant les entrées excitatrices vont entrainer une réponse non souhaitée de la population prédictive. Cette prédiction non compensée par des arrivées thalamiques va certes entrainer une réduction du taux de décharge de la population d’erreur de prédiction mais ce signal est difficilement exploitable car il n’existe pas à notre connaissance de règle de plasticité biologiquement informée où une absence de signal entraine une dépression. Afin de remédier à cet inconvénient on ajoute une règle complémentaire où toute activité pré synaptique qui n’entraine pas d’activité post synaptique entraine une dépression des synapses : ∆𝑤𝑝𝑟 é,𝑝𝑜𝑠𝑡 = −𝑐𝑑 𝛿(𝑡 − 𝑡𝑠𝑝𝑖𝑘𝑒 𝑝𝑟 é ) On prend 𝑐𝑑 = 40. Une telle règle de plasticité est supportée par les travaux de Fregnac et al[25]. : si la réponse post synaptique est artificiellement supprimée en imposant un courant dépolarisant sur un neurone, la force d’association entre les neurones pré synaptiques amenant le neurone à décharger et le neurone dépolarisé est diminuée. 15 On propose que la population prédictive corresponde aux couches supragranulaires du cortex auditif primaire, ce qui serait en accord avec la notion que cette couche reçoit un signal d’erreur d’amplitude plus importante dans le cas ou le stimulus est déviant et donc non anticipé par le modèle prédictif. Dans notre modèle le signal d’erreur est en outre médié par des récepteurs NMDA, ce qui rendrait ce signal sensible aux manipulations pharmacologiques. 2.4.Implémentation du réseau Sauf exception chaque population représentée par un rectangle blanc ou un cercle noir est implémentée comme une population de 40 neurones. Par défaut on utilise les paramètres 𝑤𝐸𝐸 = 2.2 , 𝑤𝐸𝐼 = 4.5, 𝑤𝐼𝐸 = 22 pour les connections entre respectivement 2neurones de population excitatrices, d’un neurone excitateur vers un neurone inhibiteur et d’un neurone inhibiteur vers un neurone excitateur. Par défaut également, pour les connections excitatrices le poids des connections NMDA est de 0.2𝑤𝐸 . Au sein de chaque colonne, les neurones thalamiques projettent sur la population d’erreur de prédiction avec une probabilité de connexion de 0.9. La population d’erreur de prédiction projette sur la population prédictive avec une probabilité de connexion de 0.9 et un poids des connections NMDA 𝑤𝑛 = 1.2 𝑒𝑡 𝑤𝐸𝐸 = 0.2𝑤𝑛 . La population prédictive projette sur les interneurones inhibiteurs de la colonne avec une probabilité de connexion de 0.5 et ces neurones projettent à leur tour sur la population d’erreur de prédiction avec une probabilité de 0.5. La population prédictive alimente également la ligne à retard correspondant à la fréquence codée en projetant sur une sous population de 10 neurones parmi les 400 que compte la ligne à retard. Les lignes à retard projettent sur les deux sous-populations prédictives avec une probabilité 0.6 et une distribution gaussienne de poids de départ de moyenne 0.4. Tous les poids synaptiques sont soumis à une variance de 20% autour de la moyenne indiquée ici. Chaque ligne à retard est modélisée par une population de 400 neurones excitateurs de 100 neurones inhibiteurs. Les neurones excitateurs sont connectés localement entre eux avec une probabilité de connexion inversement proportionnelle à la distance entre les deux neurones avec un poids synaptique moyen de 4.5 et un rayon moyen de connectivité de 12 neurones. Ces synapses sont exclusivement AMPA. Les neurones excitateurs sont connectés aux neurones inhibiteurs localement avec un rayon moyen de connectivité de 12 neurones et un poids synaptique moyen de 4. Ces neurones projettent sur les neurones excitateurs localement avec le même rayon de connectivité et un poids synaptique moyen de 4. Le réseau est initialisé avec les 𝑠𝑗 = 0 pour tous les neurones et tous les types de canaux. Les potentiels de membrane sont initialisés à −65 + 5𝑟𝑎𝑛𝑑. La première seconde de simulation est exclue des analyses et les règles de plasticité ne s’y appliquent pas, afin d’éviter des effets arté factuels dus à l’initialisation du réseau. Les délais synaptiques sont de 1 à 3ms, exceptés dans le réseau à échos ou les délais synaptiques sont fixés à 10ms pour obtenir la dynamique désirée. 16 2.5.Séquences test des simulations. Nous avons choisi de tester le modèle sur des séquences nous permettant d’évaluer si le modèle rend compte des effets identifiés en introduction et sur le paradigme duquel nous somme partis pour poser notre question. On utilise une variante récemment acquise au sein du laboratoire du paradigme local/Global, ce qui nous permettra à terme de comparer les prédictions du modèle aux données expérimentales effectives. Ces séquences sont : 1) 20 AAAAA puis 100 groupes dont 70 AAAAA, 20 AAAAB, 10 AAAA 2) 20 AAAAB puis 100 groupes dont 70 AAAAB, 20 AAAAA, 10 AAAA 3) 100 AAAA Une séquence AAAA(AouB) est constituée de 4 sons de même fréquence et d’un cinquième de même fréquence ou non, d’une durée de 50 ms avec un SOA de 150ms. La durée entre le début du dernier son d’une séquence de 5 sons et le début du premier son de la séquence suivante est de 600ms. Dans le cas des séquences de 4 sons, cette durée est de 750 ms. Les groupes sont pseudo randomisés de telle façon que 2 déviants à la règle fixée par les 20 premiers groupes ne soient jamais successifs. On exclut de l’analyse les groupes « standards » qui se trouvent après un déviant. On teste également le modèle sur des séquences alternées : 4) 20 ABABA puis 100 groupes dont 70 ABABA, 20 ABABB, 10 ABAB On teste également le modèle sur un paradigme oddball classique avec différences fréquences d’occurrence du déviant : 10%, 20%, 30%. 3. Résultats Dans cette section nous présentons les résultats de différentes simulations. Pour chaque type de séquence, la simulation a été effectuée avec au moins trois réseaux générés selon les règles décrites ci-dessus. Les 20 premiers essais d’un bloc ainsi que les essais standards suivant immédiatement un essai rare (déviant ou omission) sont exclus des analyses. Les figures présentent les taux de décharge des neurones ainsi que les courants synaptiques reçus par chacune des principales sous-populations. 3.1.Paradigme local/global Un réseau initialement vierge de tout apprentissage est entrainé sur 20 séquences « standard », puis testé sur un bloc composé de 20 séquences déviantes, 10 omissions et 70 standard. La réponse au standard est moyennée sur les essais test ne suivant pas un déviant ou une omission. Les essais rares (déviant ou omission) sont pseudo randomisés de telle façon qu’ils suivent toujours un essai standard. 3.1.1. Contexte AAAAA Comportement du réseau à écho Le comportement qualitatif du modèle développé ici est dépendant des propriétés du réseau à écho choisi. Pour ces simulations on a choisi un réseau simpliste mais dont les propriétés sont bien 17 contrôlées : la ligne à retard. Ce réseau propage l’activité de proche en proche par le biais de connections locales. Figure 7 : Probabilité de réponse de chaque neurone de la ligne à retard associée aux sons de fréquence A, en fonction du temps depuis le début du premier son A dans le contexte AAAA. On observe que ce réseau propage l’activité de façon linéaire avec le temps (Figure 7). On voit aussi que l’entrée de l’information se fait près de 100ms après le début du son A. Cet effet est du aux délais de propagation de l’activité dans le réseau. 18 Figure 8: probabilité de réponse en fonction du temps après le début du premier son d'une séquence. Fit gaussien de cette probabilité pour chaque neurone. Figure 9 : écart type (en ms) du modèle gaussien pour chaque neurone de la Figure 8 La Figure 8 montre le fit gaussien de la distribution des réponses de différents neurones de la ligne à retard après le début du premier son de la séquence. On voit que la réponse est de plus en plus étalée dans le temps. La Figure 9 montre l’écart type du modèle gaussien des données de la Figure 8 en fonction de la position du neurone dans la ligne à retard. On voit que la précision du timing de réponse suit une loi de Weber. 19 Du fait de la taille finie de la ligne (réduite pour des raisons de vitesse computationnelle), la mémoire d’un son disparait du réseau quand « l’onde » générée par ce son atteint le bout de la ligne ou lorsque cette onde se dissipe si l’activité échoue à se propager aux neurones suivants. La durée de vie maximale de la mémoire d’un son est d’environ 350ms dans notre cas. Réponse au standard local La Figure 10 présente la moyenne des réponses à une séquence AAAAA dans le contexte où cette séquence est majoritaire, enregistrées pour 5 réseaux différents générés selon les règles présentées ci-dessus. On peut voir les taux de décharge moyen de la population prédictive, de la population d’erreur de prédiction et des entrées thalamiques. On montre également les entrées synaptiques, qui correspondent aux quantités qui sont enregistrées en imagerie fonctionnelle (electroencephalographie ou magnétoencéphalographie), ou en électrophysiologie (local field potentials). Pour chaque couche, les deux sous populations modélisées sont distinguées par un code couleur. Il est à noter que les entrées AMPA sur la population prédictive prédictif, qui ne corrèlent pas avec une variation dans les entrées médiées par le NMDA sont le reflet des entrées provenant des lignes à retard. Ce sont les prédictions du modèle. Les courants NMDA sont le reflet de l’erreur de prédiction. La population thalamique présente une amplitude de réponse constante pour les 5 sons. On vérifie ainsi que les neurones présentent des qualités d’adaptation synaptique faibles. Les propriétés du modèle sont donc dues à ses qualités prédictives. La population prédictive présente un taux de décharge faible au moment de l’arrivée du premier son. On voit que les courants excitateurs AMPA provenant du réseau à échos sont faibles : le modèle prédictif n’est pas capable de prédire l’arrivée du premier son de la séquence. En effet, aucune entrée n’est arrivée dans le modèle depuis une durée supérieure à la fenêtre de mémoire de la ligne à retard, le modèle prédictif ne peut baser ses prédictions sur aucune entrée passée. Pour les sons suivant on observe que l’activité de la population prédictive augmente avant le début du stimulus et est capable d’annuler en partie les entrées thalamiques. Les entrées AMPA anticipent l’arrivée du son suivant. En conséquence on voit que l’erreur de prédiction est maximale pour le premier son qui n’est pas anticipé par le modèle prédictif. Les sons suivants sont bien prédits par le modèle prédictif comme en témoignent les courant AMPA sur la sous population prédictive correspondant au son attendu. En conséquence, l’intégration des entrées thalamiques et de la copie inhibitrice de la population prédictive aboutit à une réduction de la réponse aux sons suivants au niveau de la population d’erreur de prédiction. En fin de séquence, on observe une prédiction d’un 6ème son de fréquence A, voire d’un 7ème ou 8ème. Cette prédiction est la conséquence directe de l’apprentissage local dans le temps effectué par le modèle. Les probabilités apprises sont limitées à une fenêtre temporelle de 300ms prédisent donc la poursuite de la régularité locale de répétition. L’observation de l’activité moyenne de la ligne à retard (voir annexe) montre que les prédictions générées induisent parfois la génération de nouvelles traces de mémoire dans la ligne à retard. Les prédictions sont ainsi capables de s’auto entretenir pendant un certain temps comme un système oscillant amorti. Cette dynamique est de fait observée en fin de séquences oddball, et pourraient avoir une utilité pour la compréhension de stimuli dégradés en biaisant le modèle vers les régularités apprises sur une période plus longue que celle de la trace de mémoire du dernier stimulus intact. 20 Figure 10 : moyenne sur 5 réseaux sur des séquences Standard dans la règle AAAAA. Droite : taux de décharge des neurones des principales populations du modèle. Gauche : Moyenne des courants synaptiques AMPA, NMDA et GABA sur les populations de prédiction et d’erreur de prédiction. Les barres vertic ales pointillées représentent le début des 5 sons de chaque séquence. On peut remarquer que l’erreur de prédiction n’est jamais nulle. Ceci est imposé par le fait que les poids synaptiques entre les lignes à retard et le réseau diminuent dès lors que le signal calcique est trop faible pour compenser la règle de dépression synaptique. Ce phénomène impose le maintien d’une erreur de prédiction résiduelle. Cela signifie également que cette règle de plasticité empêche l’explosion des poids synaptiques dans des conditions physiologiques. 21 Réponse au déviant local Figure 11 : Taux de décharge et entrées synaptiques moyens pour un déviant (AAAAB) à la règle AAAAA. Détails voir Figure 10 La réponse au quatre premiers sons de la séquence déviante (Figure 11) est similaire à celle décrite pour la séquence standard. Au niveau du dernier son différent des précédents, on observe que la sous population prédictive associée au son A présente une augmentation d’activité : le modèle prédictif prédit un « A ». Cette prédiction n’annule pas les entrées thalamiques car c’est un son de fréquence B qui est présenté. On observe en conséquence une erreur de prédiction importante, qui se traduit par un large courant excitateur médié par des récepteurs NMDA sur la sous population prédisant la fréquence B. 22 Contraste entre AAAAA et AAAAB Figure 12 : Différence des entrées synaptiques moyennes entre les essais standards et déviants dans la règle AAAAA. Gauche : Différence pour chaque sous population entre les conditions standard et déviant. Droite : somme sur les deux sous-populations (courant net) La Figure 12 montre la différence entre les courants synaptiques observés pour une séquence standard ou déviante. La différence est calculée pour chaque sous population (gauche) puis sommée pour obtenir le bilan net sur la population entière. On voit que le bilan sur les entrées thalamiques est nul comme on s’y attendait, car les différences au niveau des deux sous populations se compensent parfaitement. La différence au niveau de la population prédictive est assez faible car les entrées thalamiques sont très proches : cela résulte en une faible différence dans les entrées excitatrices. On observe en revanche que l’essentiel de la différence se trouve au niveau de la population prédictive (couches supragranulaires) et est médiée par des courants NMDA. L’augmentation du taux 23 de décharge se traduit par une différence dans les entrées inhibitrices sur la population d’erreur de prédiction. Cette distribution des courants selon les couches est proche de celle décrite par Javitt et al[16]. 3.1.2. Contexte AAAAB Les résultats des simulations pour le contexte AAAAB sont proches de ceux pour la séquence AAAAA (voir annexes). Une différence qualitative importante est cependant la présence d’une prédiction sur la sous population prédisant les sons de fréquence B après chaque son de fréquence A. Cette prédiction reflète l’augmentation de la fréquence de présentation de B dans les entrées. Du fait de la localité des prédictions, le modèle n’est pas capable de distinguer les A pertinents pour prédire un B dans le contexte global. Comparaison des mismatch en fonction du contexte global Figure 13 : différence standard-déviant dans les courants synaptiques sur la population prédictive en fonction du contexte global : noir = contexte AAAAA, rouge = contexte AAAAB. La Figure 13 montre l’amplitude relative de la réponse de mismatch au niveau de la population prédictive en fonction du contexte global. On observe une différence sensible dans l’amplitude de la MMN en fonction de la règle. La MMN est plus faible lorsque la séquence XXXXY est plus fréquente. Cet effet est retrouvé dans les données du paradigme local/global. Forme du modèle prédictif La forme simple du réseau à écho permet d’observer aisément la forme du modèle prédictif contenu dans les poids synaptiques entre les deux lignes à retards et la population prédictive. 24 Figure 14 : poids synaptiques moyens entre les neurones de la ligne à retard de A et les neurones des deux sous populations prédicitves (moitié supérieure = A, moitié inférieure = B) La Figure 14 permet de visualiser le modèle prédictif. La linéarité entre l’indice des neurones de ligne à retard et le temps écoulé depuis une entrée de fréquence A permet d’interpréter aisément les poids synaptiques observés. On peut voir que dans les deux contextes, le modèle prédictif de A (moitié supérieure) a appris que l’arrivée d’un son de fréquence A est prédit par l’arrivée d’un son A sur deux intervalles de temps de sa fenêtre de mémoire qui correspondent respectivement à une et deux fois l’intervalle entre deux sons successifs. On peut constater que le modèle prédictif de B se base sur les mêmes fenêtres temporelles pour prédire B mais avec une atténuation importante des poids synaptiques en fonction du contexte. 3.2.Séquences alternées Winkler et al. ont montré qu’une déviance à la règle d’alternance évoque une MMN. On teste le réseau sur des séquences alternées construites sur le même mode que les séquences précédentes : 5 sons de 50ms séparés de 100ms d’ISI avec un intervalle de 600ms entre deux séquences de 5 sons. Cela nous permet de comparer les réponses à cette séquence et à ses déviations de la même façon que précédemment. 25 3.2.1. Contexte ABABA Réponse au standard Figure 15 : taux de décharge et courants synaptiques moyens pour une séquence ABABA dans le contexte où elle est standard. Détails voir Figure 10 La Figure 15 montre la réponse moyenne du réseau à une séquence standard alternée ABABA. On voit que de la même façon que pour une séquence standard répétée AAAAA, le premier son génère une réponse maximale de l’erreur de prédiction car aucune activité de la population prédictive ne l’anticipe. Les sons suivants sont anticipés de façon conforme aux régularités du stimulus, ce qui entraine une réduction de la réponse de la population d’erreur de prédiction. On observe une continuation des courants générés par le modèle prédictif après la fin de la séquence respectant l’alternance de stimuli prédits. Le modèle est donc capable de prédire les stimuli dans une séquence alternée avec autant de succès que la prédiction dans une séquence répétée. 26 Réponse au déviant Figure 16 : taux de décharge et courants synaptiques moyens pour une séquence ABABB où la répétition finale représente une déviation à la règle d'alternance (ABABA). Détails voir Figure 10 La Figure 16 montre la réponse à la violation de la règle d’alternance sur le dernier stimulus de la séquence. Comme pour le déviant à la règle de répétition, la prédiction pour le déviant à la règle d’alternance ne correspond pas au stimulus présenté, et n’annule donc pas l’entrée thalamique au niveau de la population d’erreur de prédiction. La réponse de cette population est donc plus importante. 27 Figure 17 : différence des courants synaptiques pour une séquence déviante par rapport à une séquence standard pour la règle ABABA La Figure 17 montre la différence de courants synaptiques entre les deux conditions précédentes. Comme pour la règle de répétition, l’essentiel de la différence se trouve au niveau de la population prédictive. On retrouve un large courant NMDA à la suite du stimulus déviant. Contrairement à la règle de répétition, on observe également une différence dans les courants générés par le modèle prédictif après le 5ème son. Cette différence provient de l’ambigüité dans les prédictions générées par le déviant. En effet, le modèle prédit un B sur la base du B en 4ème position mais aussi un A sut la base du B en 5ème position. 28 3.3.Paradigme Oddball Amplitude de la MMN en fonction de la fréquence du déviant. Figure 18 : amplitude de la différence entre les courants synaptiques sommée sur chaque population pour un déviant et un standard en fonction de la fréquence du déviant La Figure 18 montre la variation de l’amplitude de la mismatch en fonction de la fréquence du déviant. Comme pour les paradigmes précédents, l’essentiel de la différence provient des courants d’erreur de prédiction médiés par des récepteurs NMDA. On observe que cette différence est proportionnelle à la probabilité du déviant, ce qui reproduit qualitativement les résultats d’expérimentaux présentés en introduction. 29 4. Discussion et perspectives Bilan Nous avons proposé ici un modèle neuronal minimal de codage prédictif dans le temps appliqué à la modélisation de la MMN. Nous avons identifié un certain nombre de paradigmes capturant une liste d’effets non triviaux connus dans la littérature sur la MMN et simulé de façon exhaustive la réponse de notre modèle à ces paradigmes. Ce modèle est minimal en ce sens qu’il prend en compte un nombre limité de caractéristiques du cortex auditif primaire dont il cherche à reproduire le comportement. Nous n’avons, par exemple, pas pris en compte des propriétés de codage temporel complexe décrites dans le cortex auditif. Nous avons au contraire exploré l’hypothèse qu’un nombre de propriétés réduites permet de rendre compte qualitativement d’une partie importante des données expérimentales. Bien que simple dans son architecture, le modèle est constitué d’unités biologiquement réalistes du point de vue des courants synaptiques et des règles d’apprentissage appliquées. Il permet ainsi de confronter les idées de codage prédictif développées jusque là de façon très mathématisée [26] à la réalité de contraintes biologiques. Notre modèle se proposait d’implémenter des idées proches de celles développées par Friston mais dans un réseau biologiquement plausible au lieu d’adopter la démarche d’optimisation développée par Friston. Notre idée d’utiliser un signal NMDA pour signaler le besoin d’adapter le modèle prédictif est en accord avec les propositions de cet auteur. Cependant, l’implémentation du modèle dans un réseau plus réaliste met en évidence un point important : une erreur de prédiction provenant d’une prédiction insuffisante des entrées ne peut être codée ni utilisée dans une règle d’apprentissage de la même manière qu’une erreur de prédiction où les entrées prédites n’adviennent pas. Si ces deux erreurs de prédictions peuvent être traitées de la même façon par un réseau mathématique, l’utilisation de l’erreur de prédiction correspondant à une prédiction qui n’advient pas est plus complexe à intégrer à des règles de plasticité réalistes. Confrontation avec les données expérimentales Nous avons identifié dans l’introduction six effets contraignants pour un modèle computationnel de la MMN. Examinons à présent dans quelle mesure nous sommes parvenus à en rendre compte. Effets 1 et 2 : production d’une MMN d’amplitude dépendante de la probabilité d’occurrence du déviant Le premier effet est l’existence même d’une MMN pour un son déviant dans un flux régulier de stimuli répétés à intervalle régulier. Notre modélisation du paradigme oddball a permis de mettre en évidence que cet effet est reproduit par le modèle : on identifie une différence dans les courants synaptiques générés entre les conditions standard et déviant. Cette différence provient essentiellement de l’atténuation de la réponse de la population d’erreur de prédiction du fait de l’anticipation des entrées par la population prédictive. En faisant varier la proportion de déviants, on a pu mettre en évidence que notre modèle reproduit également le deuxième effet : l’amplitude de la différence entre les réponses au standard et au déviant est proportionnelle à la probabilité du déviant. 30 Effet3 : MMN à la répétition dans une séquence alternée Notre modèle réplique également la MMN à la répétition dans un signal alterné. Il prédit l’existence d’une MMN semblable à celle enregistrée pour un déviant dans le cadre d’un paradigme oddball. Il prédit en outre une réponse particulière du modèle prédictif pour le stimulus suivant la répétition. Les prédictions du modèle prédictif sont ambigües ce qui se traduit par la décharge des deux sous populations modélisées après la fin de la séquence. Il serait intéressant de tester ces prédictions. Effet4 : MMN à l’omission Le paradigme local/global permet de tester l’existence d’une MMN à l’omission à un son attendu. On observe en effet une réponse du modèle prédictif en l’absence du 5ème son. Cependant, notre modèle prédit une réponse identique dans le cas où la séquence de 4 sons est présentée de façon standard (voir annexe). Le modèle prédit donc également une MMN à la fin de toute séquence régulière même si la fin de cette séquence est prévisible et que son interruption ne représente pas une omission à proprement parler. Cette prédiction reste à explorer plus avant expérimentalement. Des données non publiées ont cependant été récoltées au sein de l’équipe de Stanislas Dehaene sur une variante du paradigme de Bekinstein et al. proche de celle simulée dans ce rapport. La réponse à 4 sons semble différer significativement en fonction de l’attente ou non d’un 5 ème son. Cette prédiction semble donc constituer une limite de notre modèle. Le modèle propose que les réponses à l’omission et aux déviants toutes deux nommées MMN dans la littérature ont des origines fondamentalement différentes : la MMN à un déviant est le résultat des courants synaptiques venant des synapses entre la population d’erreur de prédiction et la population prédictive alors que la réponse à l’omission proviendrait du modèle prédictif et donc des synapses entre les lignes à retard et la population prédictive. Cette seconde réponse n’est à aucun moment le résultat d’une comparaison entre les entrées prédites et observées. Elle ne correspond pas dans notre modèle à une erreur de prédiction « négative ». Bien que ces deux réponses aient des significations fondamentalement différentes, elles ont toutes deux la même topographie de réponse en imagerie, car proviennent de courants synaptiques sur les mêmes dendrites. En revanche, les prédictions quant à leur sensibilité aux manipulations pharmacologiques sont différentes : les courants d’erreur de prédiction sont très sensibles aux inhibiteurs des récepteurs NMDA. Effet 5 : Génération d’une MMN même si le déviant est prédictible. La simulation du paradigme local/global a permis de reproduire les effets observés sur la MMN. Il existe une MMN au déviant local quelque soit le contexte, même si le déviant est prédictible. On observe une atténuation de l’amplitude de la MMN lorsque la déviance locale est la règle. Cet effet d’atténuation correspond à l’effet de la fréquence du déviant (effet2). Le modèle n’est en revanche pas à même d’expliquer la réponse P300. Un objectif de poursuite de ce travail est de construire un modèle hiérarchique à partir ce cette première brique permettant de rendre compte d’effets plus complexes sur des fenêtres de temps plus importantes et portant sur des propriétés plus abstraites du stimulus. Effet6 : Bases cérébrales des populations du modèle Nous avons proposé dans notre modèle que la population d’erreur de prédiction corresponde à la couche 4 et que la population prédictive corresponde aux couches supragranulaires. La distribution des courants synaptiques, en particulier le profil de répartition des différences entre réponse au standard et réponse au déviant concordent avec les données expérimentales de Javitt et al. 31 Ce modèle est capable d’apprendre des probabilités de transition entre des éléments distants de quelques centaines de millisecondes. La capacité du modèle à émettre des prédictions dans le temps dépend de l’existence d’un réseau capable de contenir une information reproductible sur le passé. Nous avons utilisé ici un type de réseau récurrent simple : la ligne à retard. Ce réseau nous a permis de visualiser facilement le type de régularités apprises par le modèle prédictif grâce à la linéarité du codage temporel. Nous n’avons cependant pas proposé de bases cérébrales pour ce réseau. L’existence de lignes à retard n’a pas été décrite dans le cortex auditif. Une première possibilité serait qu’il existe une structure cérébrale, corticale ou non, qui présente cette capacité. Il faudrait cependant supposer des délais synaptiques raisonnables et une forte connectivité entre ces régions. Une autre possibilité serait d’utiliser le cortex auditif primaire (par exemple la couche supragranulaire dans notre modèle) lui-même comme réseau récurrent à écho. Cette hypothèse impliquerait la superposition de deux types de codes dans pour une même population : un code tonotopique bien décrit dans la littérature, et un code temporel, mémoire du passé. Pour interférer le moins possible avec le premier code, le code temporel doit lui être orthogonal. De cette façon le code temporel se comporte comme un bruit blanc pour le code tonotopique et inversement. Buonomano et al[27] ont décrit des dynamiques dans des tranches de cortex auditif intéressantes pour cette hypothèse: pour une stimulation à un site donné, on enregistre un pattern de réponses reproductibles étalées sur des latences allant jusqu’à quelques centaines de millisecondes. Les latences des réponses sont sans relation avec la proximité spatiale entre le neurone enregistré et le neurone initialement stimulé. La précision temporelle des réponses suit une loi de Weber. Bien qu’il ne soit pas démontré que ces propriétés sont maintenues in vivo, la dynamique décrite présente des caractéristiques idéales pour notre modèle. Elle permettrait ainsi de réinterpréter le « bruit » dans le code tonotopique comme une superposition d’un autre code. Prédictions et test du modèle Adaptation et prédiction On a montré que le modèle prédictif est capable de rendre compte d’un nombre important d’effets connus dans la littérature concernant la mismatch negativity. Cependant, cela ne saurait constituer une réfutation de l’hypothèse adaptative. Il serait donc intéressant de trouver une condition expérimentale pour laquelle les prédictions de ces deux modèles soient clairement différentes. Le modèle suppose explicitement que les prédictions sont basées sur l’apprentissage des régularités dans les patterns temporels de transitions entre les stimuli présentés au système. Ce principe implique que le réseau est sensible à la probabilité qu’une certaine transition soit vérifiée ( P(B|At−∆t ) ) même si la transition est rarement rencontrée alors que le modèle adaptatif est sensible à la probabilité temporelle d’occurrence d’un son particulier P B . Afin de tester si l’adaptation est suffisante pour expliquer la MMN comme le défendent May et Tiitinen, on s’appuie sur une propriété fondamentale de l’adaptation : les neurones récupèrent leur capacité à répondre de façon maximale avec une constante de temps inférieure à une vingtaine de seconde. La présentation de stimuli espacés d’une durée supérieure à 20s devrait donc être indépendante de la régularité de ces séquences dans un contexte plus large. 32 Si on présente de façon standard la paire AB avec un intervalle d’une trentaine de seconde : 100ms ~30s et de façon rare on présente un déviant : Le modèle adaptatif prédit une MMN au B de la seconde paire car les neurones répondant au son A subissent une adaptation entre les deux sons alors que les neurones répondant spécifiquement au son B n’ont pas été stimulés depuis plus de 30s. Le modèle prédictif apprend au contraire les probabilités de transition. La probabilité de A vers B étant vérifiée à chaque fois qu’un A est présenté, la réponse au B devrait être réduite. L’occurrence d’un deuxième son identique pour le déviant n’est pas prédite, le signe de la mismatch entre standard et déviant devrait être opposé à celui prédit par le modèle adaptatif. Le modèle prédictif que nous avons développé n’implique volontairement aucun paramètre d’adaptation synaptique, bien que cet effet soit bien décrit dans la littérature. Ce choix nous a permis d’étudier les comportements dus à une prédiction pure. L’adaptation est cependant un phénomène largement décrit dans les données électrophysiologiques, et il est possible que la MMN soit le résultat d’une combinaison de ces deux effets. On peut évaluer la part éventuelle d’adaptation de 2 manières : On peut comparer les réponses aux deux paires à l’intérieur de blocs où AB ou AA est la règle (sur le même principe que le paradigme local/global). Le modèle adaptatif prédit une invariance de la réponse en fonction du contexte, le modèle prédictif prédit une inversion de la MMN en fonction du contexte. En faisant varier l’intervalle entre les paires, on devrait également pouvoir quantifier la part des deux processus dans les réponses aux stimuli présentés habituellement dans les paradigmes oddball. La part prédictive de la mismatch ne devrait pas varier avec la fréquence temporelle de la paire (seulement fonction de la fréquence d’association des deux sons), alors que la part d’adaptation augmente si les paires sont présentées plus fréquemment. Test chez l’animal Une autre perspective intéressante est l’acquisition de données électrophysiologiques chez le rat. Une collaboration avec l’équipe d’Alain Destexhe a été lancée pour recueillir des données électrophysiologiques dans le cortex primaire du rat. Je devrais ainsi pouvoir confronter le modèle à ces données au cours de mes années de thèse, sous la direction de Stanislas Dehaene, dans la continuité des ce projet. Ces données devraient nous permettre de tester nos prédictions en termes d’origine des courants, en particulier des courants du modèle prédictif dans la condition d’omission d’un son attendu. 33 Limites et extensions possibles du modèle Limitation à 2 sons purs Le modèle développé ici ne permet de simuler qu’une réponse à des séquences de deux sons purs. La généralisation du modèle à un plus grand nombre de sons est assez naturelle. Il suffit d’ajouter autant de colonnes corticales connectées aux autres selon les mêmes règles. Limitation à une dimension Le modèle ne permet pas non plus de simuler les données de déviance par rapport à plusieurs dimensions du stimulus [28]. Ce modèle est essentiellement construit pour la modélisation de sons de fréquence différente. Le cortex auditif présentant également une cartographie de l’amplitude des sons, on peut aisément proposer une adaptation de ce modèle aux déviants en amplitude. Le modèle est aisément adaptable pour les cas ou il existe un code explicite des dimensions considérées dans le cortex. Il est à noter que certaines extensions pourraient s’avérer couteuses en terme computationnel, étant donné l’existence d’une ligne à retard pour chaque son codé. Types de régularités Les transitions pouvant être apprises par le système dépend de façon importante des propriétés du réseau à échos du passé. Nous avons choisi d’utiliser des lignes à retard, notre modèle est donc incapable de prendre en compte des combinaisons d’éléments pour prédire les entrées. Par exemple, il est incapable d’apprendre que seule la combinaison de 4 A prédit un B car il n’existe pas de trace spécifique de « AAAA ». On pourra seulement apprendre que le son de fréquence A prédit un B avec une certaine probabilité sur plusieurs intervalles de temps. Nous avons émis l’idée que le réseau à échos du passé soit en fait un seul réseau présentant des patterns d’activité complexes et reproductibles. Etudier quel type d’information est disponible de façon reproductible dans un tel réseau permettrait de mieux appréhender les propriétés potentielles d’un tel réseau. MMN à des propriétés plus abstraites Un ensemble de données suggèrent que la mismatch serait évoquée pour à des déviations à des régularités plus abstraites que la violation de probabilités de transition[29]. Par exemple si les sons sont présentés en paires de sons ascendants (l’écart de fréquence entre les deux sons étant constant entre les paires), on observe une mismatch pour des paires de sons descendants ou répétés. Le modèle, tel qu’il est implémenté ne permet pas de simuler ce paradigme. Cependant il permet de proposer une interprétation différente de ces résultats. Le cortex auditif primaire présente en effet une organisation tonotopique qui implique que chaque neurone répond non seulement à sa fréquence préférée mais aussi à une bande de fréquence autour de cette fréquence. Si on considère deux populations dont les fréquences préférées sont distantes de la valeur de la différence standard dans la séquence présentée. Même si la fréquence préférée de ces deux populations n’ont jamais été présenté, des fréquences proches l’ont déjà été car les fréquences sont choisies au hasard parmi des valeurs qui sont trop proches les unes des autres pour que les populations répondant aux différents stimuli ne se recoupent pas. Ces deux populations, donc ont déjà été associées dans cet ordre. Bien qu’elles n’aient jamais été rencontrées en elles même, leur probabilité de transition n’est donc pas nulle du point de vue de la réponse neuronale. Les données présentées dans la littérature peuvent donc être expliquées sans recourir à un comparateur capable d’extraire des régularités de haut niveau. Il est même inutile d’avoir recourt, comme May et Tiitinen, à l’hypothèse de neurones codant pour des sens ou des amplitudes particulières de transition. Après 34 un certain nombre de présentations de paires dont les relations sont constantes, le modèle présenté ici devrait apprendre une sorte de cartographie systématique selon la relation « A=>A+dfreq au temps t + dt ». S’il reste à vérifier que la MMN évoquée par certaines déviations quant à des propriétés apparemment abstraites des stimuli n’est pas un artéfact de paradigmes expérimentaux mal contrôlés, comprendre la détection de la déviance à des régularités abstraites ou impliquant des échelles de temps supérieures à celle d’une fenêtre locale reste un challenge. Le paradigme de Bekinstein et al a montré qu’il existe différents niveau de traitement des régularités et que la P3b rend compte de processus capable d’identifier des régularités plus complexes que celles identifiables par le réseau développé ici. Un objectif de poursuite de ce travail est de reprendre le principe d’organisation hiérarchique proposé dans la théorie du codage prédictif pour tenter de rendre compte de propriétés plus complexes. En particulier, on cherche à comprendre quelles peuvent être les bases d’une cognition consciente de la structure régulière globale qui permettraient de rendre compte des caractéristiques expérimentales de la P3b. 35 ANNEXES Omission du 5ème son- Contexte AAAAAA Figure 19 : Taux de décharge et entrées synaptiques moyens pour une séquence où le dernier son est omis dans la règle AAAAA. Détails voir Figure 10 36 Réponse au standard local- contexte AAAAB Figure 20 : Taux de décharge et entrées synaptiques moyens pour un standard dans la règle AAAAB. Détails voir Figure 10 37 Réponse au déviant local-Contextes AAAAB Figure 21 : Taux de décharge et entrées synaptiques moyens pour un déviant (AAAAA) dans la règle AAAAB. Détails voir Figure 10 38 Contrastes entre AAAAA et AAAAB- Contexte AAAAB Figure 22 : Différence au niveau des entrées synaptiques moyennes entre les essais standards et déviants dans la règle AAAAB. Détails voir Figure 12. 39 Bibliographie [1] A.M. Owen, M.R. Coleman, M. Boly, M.H. Davis, S. Laureys, J.D. Pickard, Detecting awareness in the vegetative state., Science (New York, N.Y.). 313 (2006) 1402. [2] T. Bekinschtein, S. Dehaene, B. Rohaut, F. Tadel, L. Cohen, L. Naccache, Neural signature of the conscious processing of auditory regularities, Proceedings Of The National Academy Of Sciences. 106 (2009) 1672-1677. [3] N. Squires, K. Squires, S. Hillyard, Two varieties of long-latency positive waves evoked by unpredictable auditory stimuli in man, Electroencephalography And Clinical Neurophysiology. 38 (1975) 387–401. [4] R. Näätänen, M. Tervaniemi, E. Sussman, P. Paavilainen, I. Winkler, "Primitive intelligence" in the auditory cortex., Trends In Neurosciences. 24 (2001) 283-8. [5] R. Naatanen, T. Jacobsen, I. Winkler, Memory-based or afferent processes in mismatch negativity ( MMN ): A review of the evidence, Psychophysiology. 42 (2005) 25-32. [6] P. May, H. Tiitinen, Mismatch negativity (MMN), the deviance-elicited auditory deflection, explained, Psychophysiology. 47 (2009) 66–122. [7] R. Näätänen, A. Gaillard, S. Mäntysalo, Early selective-attention effect on evoked potential reinterpreted., Acta Psychologica. 42 (1978) 313-329. [8] K. Squires, C. Wickens, N. Squires, E. Donchin, The effect of stimulus sequence on the waveform of the cortical event-related potential, Science. 193 (1976) 1142–1146. [9] N. Shinozaki, H. Yabe, T. Sutoh, T. Hiruma, S. Kaneko, Somatosensory automatic responses to deviant stimuli., Cognitive Brain Research. 7 (1998) 165-71. [10] B.M. Pause, K. Krauel, Chemosensory event-related potentials (CSERP) as a key to the psychology of odors., International Journal Of Psychophysiology : Official Journal Of The International Organization Of Psychophysiology. 36 (2000) 105-22. [11] A. Tales, P. Newton, T. Troscianko, S. Butler, Mismatch negativity in the visual modality, NeuroReport. 10 (1999) 3363–3367. [12] Y. Sato, H. Yabe, T. Hiruma, T. Sutoh, N. Shinozaki, N. Tadayoshi, et al., The effect of deviant stimulus probability on the human mismatch process, Neuroreport. 11 (2000) 3703-3708. [13] J. Horváth, I. Winkler, How the human auditory system treats repetition amongst change, Neuroscience Letters. 368 (2004) 157–161. [14] H. Yabe, M. Tervaniemi, K. Reinikainen, R. Näätänen, Temporal window of integration revealed by MMN to sound omission, NeuroReport. 8 (1997) 1971-1974. 40 [15] H. Hughes, T. Darcey, H. Barkan, P. Williamson, D. Roberts, C. Aslin, Responses of human auditory association cortex to the omission of an expected acoustic event, Neuroimage. 13 (2001) 1073–1089. [16] D. Javitt, M. Steinschneider, C. Schroeder, J. Arezzo, Role of cortical N-methyl-Daspartate receptors in auditory sensory memory and mismatch negativity generation: implications for schizophrenia, Proceedings Of The National Academy Of Sciences. 93 (1996) 11962-11967. [17] I. Jaaskelainen, J. Ahveninen, G. Bonmassar, A. Dale, R. Ilmoniemi, S. Levanen, et al., Human posterior auditory cortex gates novel sounds to consciousness, Proceedings Of The National Academy Of Sciences. 101 (2004) 6809–6814. [18] R.P. Rao, D.H. Ballard, Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive field effects, Nature Neuroscience. 2 (1999) 79-87. [19] K. Friston, A theory of cortical responses, Philosophical Transactions Of The Royal Society B. 360 (2005) 815-836. [20] K. Friston, J. Kilner, L. Harrison, A free energy principle for the brain, Journal Of Physiology. 100 (2006) 70-87. [21] E. Izhikevich, Simple model of spiking neurons, IEEE Transactions On Neural Networks. 14 (2003) 1569–1572. [22] N. Brunel, X. Wang, Effects of neuromodulation in a cortical network model of object working memory dominated by recurrent inhibition, Journal Of Computational Neuroscience. 11 (2001) 63-85. [23] C. Jahr, C. Stevens, Voltage Dependence of NMDA-Activated Predicted by SingleChannel Kinetics Macroscopic Conductances, Journal Of Neuroscience. 10 (1990) 3178-3182. [24] M. Spratling, Predictive Coding as a Model of Response Properties in Cortical Area V1, Journal Of Neuroscience. 30 (2010) 3531-3543. [25] D. Debanne, D.E. Shulz, Y. Fregnac, Activity-dependent regulation of 'on' and 'off' responses in cat visual cortical receptive fields., The Journal Of Physiology. 508 ( Pt 2 (1998) 523-48. [26] K. Friston, K. Stephan, Free-energy and the brain, Synthese. 159 (2007) 417–458. [27] D. Buonomano, Timing of neural responses in cortical organotypic slices, Proceedings Of The National Academy Of Sciences. 100 (2003) 4897-4902. 41 [28] C. Wolff, E. Schröger, Human pre-attentive auditory change-detection with single, double, and triple deviations as revealed by mismatch negativity additivity, Neuroscience Letters. 311 (2001) 37-40. [29] E. Schröger, A. Bendixen, N. Trujillo-Barreto, U. Roeber, Processing of abstract rule violations in audition, PLoS One. 2 (2007). 42