Introduction Informatique cognitive

publicité
IFT 703
Informatique cognitive
Introduction
André Mayers
Automne 2010
Plan

Description du plan de cours

Introduction à l’informatique cognitive
◦ Intelligence artificielle
◦ Psychologie cognitive
◦ Neuropsychologie

Introduction aux architectures cognitives
◦ Historique
2
Sciences cognitives

Les sciences cognitives ont pour objet l’étude des systèmes intelligents
dans leurs aspects représentationnels et computationnels.

Les systèmes intelligents sont des systèmes complexes de traitement de
l'information capable d'acquérir, conserver, utiliser et transmettre des
connaissances.

Les sciences cognitives s’intéressent
◦ à la théorie abstraite des processus intelligents,
◦ à l’intelligence des machines artificielles,
◦ à l’étude de l’intelligence humaine et animale.

Les sciences cognitives étudient les phénomènes suivant
◦ la perception, l’attention, le langage, les mécanismes de résolution de problèmes
(conception, planification…)
3
Les disciplines des sciences cognitives
Philosophie
Psychologie
Linguistique
Informatique
Anthropologie
Neurosciences
4
Informatique cognitive

Discipline des sciences cognitives

But de l’informatique cognitive :
◦ Concevoir des modèles computationnels des processus cognitifs

Architecture cognitive
◦ Modèle complet de la cognition humaine

Intégration de modèle computationnel de l’usager dans les systèmes
homme-machine
◦ Systèmes tutoriels intelligents
◦ Habitats intelligents
◦ Contrôle de systèmes complexes
 Centrales nucléaires ou électriques
5
Intelligence artificielle

Résoudre des problèmes pour lequel il n’existe pas d’algorithmes dédiés
connus
◦ Fouille dans un espace d’état
 Symbolique
 Forage de donnée, réseau de neurones, algorithme génétique

Deux approches
◦ Intelligence générale
◦ Simulation de l’intelligence naturelle ou humaine
6
Psychologie

Le behaviorisme considère les processus cognitifs comme une boîte noire
et essaie de prédire le comportement (sortie de la boîte noire) en
fonction des stimuli (entrée de la boîte noire).

La psychologie cognitive essaie de prédire le comportement en fonction
des stimuli et d’hypothèses sur la boîte noire et ses processus
◦ L’individu a un état interne qui influence son comportement
◦ La méthode scientifique aide à choisir l’hypothèse la plus plausible
 Les liens entre un concept théorique et les expériences le mettant en valeur peuvent
être complexes (entre une particule atomique et sa trace sur une photographie).
◦ Les processus cognitifs doivent être plausibles compte tenu des connaissances
que nous avons sur le cerveau
7
Psychologie cognitive

Étude de la pensée et de ses mécanismes pris dans un sens large.
◦ la perception
◦ la résolution de problèmes
◦ la mémoire
◦ les fonctions exécutives





attention
planification
prise de décision
…
4 approches
◦ Traitement de l’information
 utilisation de symboles et d’abstraction
◦ Basé sur la biologie
 voir aussi neuropsychologie
◦ Basé sur les processus de l’évolution
◦ Une combinaison des trois précédentes
8
Approche traitement de l’information

9
Modèle modale
◦ Atkinson & Shiffrin (1968)
◦ Information encodée sous sa forme perceptuelle dans la mémoire sensorielle
◦
Information est transmise dans la mémoire à court terme (MCT)
 Capacité limitée et dégradation rapide de l’information
◦ Information est ensuite transmise avec une certaine probalité dans la mémoire à
long teme (MLT)
 Capacité infinie et dégradation lente
9
Approche traitement de l’information

Modèle de la mémoire
de travail
 Baddeley et Hitch’s
(1974)

Module exécutif central : sélectionne et manipule le contenu des modules
esclaves

Boucle phonologique :
◦ tampon à court terme : encode l’information sous sa forme verbale
◦ boucle articulatoire : processus de rafraichissement de l’information

Tablette Visuo-spatiale Visuo-spatial sketchpad: encode sous
l’information sous sa forme spatiale ou visuelle
10
Neuropsychologie
11

La neuropsychologie est une discipline scientifique et clinique qui étudie
les fonctions mentales supérieures dans leurs rapports avec les structures
cérébrales au moyen d'observations menées auprès de patients présentant
des lésions cérébrales accidentelles, congénitales ou chirurgicales.

Son objectif est la compréhension du système cognitif normal et anormal
par le biais de l'étude de ses dysfonctionnements.
ARCHITECTURE
COGNITIVE
12
Architecture cognitive

Architecture informatique
◦ ensemble de structures fixes permettant à un système d’être programmé

Architecture cognitive
◦ ensemble de structure fixe qui explique l’ensemble des processus cognitifs
 indépendance de la tâche modéliser
◦ une théorie générale de la cognition,
◦ intègre plusieurs théories spécifiques
 perception, attention, mémoire …
◦ une explicitation de la boîte noire
13
Architecture cognitive computationnelle

Une architecture cognitivive pouvant servir de devis pour concevoir un
programme

Un modèle informatique d’une architecture cognitive
◦ de simuler avec un ordinateur des comportements complexes
◦ de générer des hypothèses qui pourront être validés expérimentalement
14
Caractéristiques des architectures cognitives

Degré de dépendance par rapport à un domaine.
◦ généralisation possible

Degré de spécification
◦ sa distance d’un modèle computationnel

Étendue des fonctions cognitives modéliser explicitement
◦ attention, mémoire, processus subsymboliques

15
Adéquation aux résultats expérimentaux
Architecture cognitive : définition

“The fixed (or slowly varying) structure that forms the framework for the
immediate processes of cognitive performance and learning”
◦ Newell, 1990, p. 111

“The functional architecture includes the basic operations provided by the
biological substrate, say, for storing and retrieving symbols, comparing
them, treating them differently”
◦ Pylyshyn, 1984, p. 30

“ A specification of the structure of the brain at a level of abstraction that
explains how it achieves the function of the mind”
◦ Anderson, 2007, p. 7

La notion d’architecture cognitive permet de ne pas s’enfarger
◦ dans la complexité du cerveau humain (1012 cellules) en faisant abstraction du
but des structures du cerveau
◦ dans la multiplicité des explications du comportement humain en faisant
abstraction du cerveau qui doit les produire
16
Les niveaux d’une architecture cognitive (Newell)

Tout dans la nature peut être décrit à différents niveaux
◦ La matière peut être décrit au niveau subatomique, atomique, moléculaire, nano,
…
il en est de même pour les architectures cognitives

Un niveau dans une architecture consiste
◦ en un medium qui est manipulé
◦ des composantes qui permet les opérations de base
◦ des lois de composition qui permet d’assembler les composantes
◦ du système formé à l’aide des lois de composition
◦ des lois comportementales qui décrit le comportement du système
 les lois comportementales découlent du comportement de ses composantes et de la
façon dont elles sont assemblées.
17
Les niveaux de traitement
18

Le niveau du milieu est l’architecture qui manipule le contenu du niveau
supérieur et est en même temps le contenu manipulé par le niveau du bas.

Une architecture offre des outils pour manipuler le contenu, p. ex. un
traitement de texte offre des outils pour manipuler du texte.
Description d’un niveau

Un niveau peut être décrit de deux façons
◦ autonome
 Un programmeur n’a pas besoin de connaître le niveau de la logique
des circuits
 Un concepteur de circuits logiques n’a pas besoin de connaître les
lois régissant le magnétisme ou le courant électrique
◦ par réduction au niveau précédent
 On explique les circuits logiques en terme des circuits électriques
19
Description autonome du niveau connaissance d’un agent
Médium
connaissance
Composantes
sans importance selon Newell
Lois de composition
sans importance selon Newell
Système
agent au sens AI
Lois comportementale
le principe de rationalité

La principale caractéristique du niveau connaissance est que son
comportement est uniquement déterminé par ses connaissances
et non par sa structure ou ses composantes.

Un agent au sens de l’intelligence artificielle possède
◦ des connaissances et des buts
◦ des composantes pour percevoir et agir dans son environnement

Le principe de rationalité
◦ Si un agent a la connaissance qu’une de ses actions lui permettra
d’atteindre un de ses buts alors il choisit cette action

20
Que pensez d’un thermostat ?
La description du niveau connaissance avec le niveau sous-jacent
Attribut \ Niveau Connaissance
Symbolique
Structure symbolique,
Attributs subsymboliques
Sous-systèmes symboliques,
Composantes
N. A.
de perception et moteur
Échange de structures
Lois de composition N. A.
symboliques entre les soussystèmes
Système symbolique complet
Système
Agent intelligent
(architecture cognitive)
Processus symbolique (Modèle
Lois
Principe de
mathématique des traitements
comportementales rationalité
de symboles)
Médium
21
Connaissance
Les niveaux d’architecture pour un agent intelligent informatisé

Connaissance
◦ le médium est constitué des connaissances

Programme
◦ le médium sont les symboles

Registre,
◦ le médium est le vecteur de bits
◦ les actions sont les transferts entre les registres ou la mémoire

Circuit logique
◦ le medium est le bit

Circuit électrique
◦ le médium est le courant électrique

Matériel
◦ le médium est l’électron avec toutes ses propriétés
22
Le niveau intelligence d’une architecture cognitive

Comme au niveau intelligence, les composantes et la structure ne sont pas
importantes alors une description autonome du niveau intelligence d’une
architecture cognitive est la description de la « logique » de ses
comportements en fonction de son environnement.
◦ Pas très réjouissant comme constatation pour des informaticiens

La solution est de le décrire en le réduisant au niveau précédent, i.e. au
niveau d’un système de symbole ou programme.
◦ Tous les programmes ou systèmes de symboles ne sont pas des agents
intelligents, ils doivent respecter le principe de rationalité.

Il ne faut pas non plus s’enfarger dans les détails du programme et l’idéal
est de créer une abstraction au niveau symbolique ainsi que le modèle
mathématique décrivant les manipulations symboliques.
◦ C’est à ce niveau d’abstraction que nous décrirons les architectures cognitives
comme ACT-R et SOAR
 Nous décrirons les modules de ACT-R et l’espace problème de SOAR
◦ C’est aussi à ce niveau que vous devrez décrire les architectures dans vos
travaux et présentations
23
La description du niveau connaissance avec le niveau sous-jacent
(bis)
Attribut \ Niveau Connaissance
Symbolique
Structure symbolique,
Attributs subsymboliques
Sous-systèmes symboliques,
Composantes
N. A.
de perception et moteur
Échange de structures
Lois de composition N. A.
symboliques entre les soussystèmes
Système symbolique complet
Système
Agent intelligent
(architecture cognitive)
Processus symbolique (Modèle
Lois
Principe de
mathématique des traitements
comportementales rationalité
de symboles)
Médium
24
Connaissance
Comment la cognition est-elle possible dans l’univers physique ?

Comment expliquer les fonctions mentales à partir du cerveau ?
◦ Comment expliquer une maison à un extraterrestre ?
 C’est certain qu’il faut décrire l’architecture d’une maison, mais est-ce suffisant ?
 Il faut aussi expliquer pourquoi l’architecture est ce qu’elle est pour répondre aux
besoins humains
 Ce sont les contraintes (humain, économique… ) du marché qui font que les maisons
ont la forme qu’elles ont actuellement.
 Ce sont les contraintes de l’évolution (survie, biologie) qui font que nous avons notre
cerveau actuel et ses fonctions cognitions cognitives
◦ Une architecture cognitive permet d’expliquer la fonction cognitive à partir du
cerveau.
 ce n’est pas toujours le cas
25
3 alternatives pour expliquer la cognition

Une architecture qui ne tient pas compte du cerveau
◦ Le paradigme classique du traitement de l’information

Une architecture qui ne tient pas compte de la fonction cognitive
◦ Le paradigme du connexionnisme sans l’esprit

Un paradigme qui fait abstraction de l’architecture
◦ L’analyse rationnelle de la fonction cognitive i.e. la fonction cognitive est le
résultat d’une adaptation à l’environnement.
26
Alternative 1 pour expliquer la cognition

Le traitement de l’information classique
◦ le paradigme “information processing” classique de la psychologie
◦ présente des théories validées par des expérimentations expliquant la fonction
cognitive
 voir la théorie de Sternberg pour expliquer si un nombre fait partie d’une liste dans la
WM
 sa théorie ne tenait pas compte de la vitesse à laquelle un neurone peut être excitée
◦ ignorer le cerveau, c’est comme concevoir une maison sans tenir compte des
contraintes des matériaux pour la construire
27
Alternative I1 pour expliquer la cognition

Le connexionnisme sans l’esprit
◦ Une description exacte et fonctionnelle du cerveau
◦ C’est comme expliquer une maison à un extraterrestre sans tenir compte des
fonctions de ses parties pour un être humain.
◦ La cognition est un effet de bord du cerveau
 Construire une maison avec des briques, du bois… sans contraintes et constater à la fin
que l’être humain puisse y vivre
◦ C’est comme expliquer le fonctionnement d’un ordinateur sans expliquer
l’intention en arrière de chaque structure
◦ C’est comme expliquer la physiologie en terme d’interactions entre les cellules
du corps en faisant abstraction des fonctionnalités des organes.
◦ Rumelhart and McClelland (1986) ont conçu un réseau de neurones qui
apprenait les participes passés comme un enfant en faisant par exemple les
erreurs de surgénéralisation classique du début de l’apprentissage (runned au
lieu de ran).
◦ Ignorer l’esprit, c’est considéré que ce réseau de neurones a été premièrement
construit et constater ensuite qu’il fait les participes passés
28
Alternative III pour expliquer la cognition

L’analyse rationnelle de la fonction cognitive en faisant abstraction de
l’architecture.
◦ Une des contraintes imposées à la façon dont le cerveau permet la cognition est
que les deux sont le résultat d’une évolution dans un environnement réel
 Le raccourci est de se concentrer sur l’adaptation de la cognition à l’environnement en
faisant abstraction de l’architecture qui doit supporter les fonctions cognitives
◦ C’est un courant très actif actuellement et toutes les variantes sont basées sur
l’approche bayésienne
 Il ne s’agit pas d’expliquer comment les calculs bayésiens sont exécutés mais tout
simplement, sachant qu’il y a adaptation l’environnement, d’élaborer une théorie
prédisant le comportement cognitif en conséquence.
29
L’approche bayésienne de la cognition
1.
L’évolution fait en sorte que nos capacités sont fonction de la probabilité
qu’un évènement survienne a priori
◦
2.
Nous sommes en mesure de connaître les situations dans lesquelles
certains événements se produisent
◦
3.
Pr(pluie), Pr(cumulonimbus)…
Pr(cumulonimbus | pluie)
Connaissant les probabilités conditionnelles et les probabilité a priori,
nous pouvons connaître la probabilité a posteriori que nous sommes dans
tel situation étant donné qu’un tel événement est survenu
◦ Pr(pluie | cumulonimbus) = Pr(cumulonimbus| pluie) * Pr(pluie)
Pr(cumulonimbus).
4.
Basé sur l’information précédente, i.e. les probabilités a posteriori des
situations actuelles, il s’agit de choisir l’action qui maximise l’atteinte des
besoins de l’individu
◦ se mettre à l’abri si la situation la plus probable est qu’il pleuve
30
Architecture cognitive

Architecture informatique
◦ ensemble de structures fixes permettant à un système d’être programmé

Architecture cognitive
◦ ensemble de structure fixe qui explique l’ensemble des processus cognitifs
 indépendance de la tâche modéliser
◦ une théorie générale de la cognition,
◦ intègre plusieurs théories spécifiques
 perception, attention, mémoire …
◦ une explicitation de la boîte noire
31
Architecture cognitive computationnelle

Une architecture cognitivive pouvant servir de devis pour concevoir un
programme

Un modèle informatique d’une architecture cognitive
◦ de simuler avec un ordinateur des comportements complexes
◦ de générer des hypothèses qui pourront être validés expérimentalement
32
Caractéristiques des architectures cognitives

Degré de dépendance par rapport à un domaine.
◦ généralisation possible

Degré de spécification
◦ sa distance d’un modèle computationnel

Étendue des fonctions cognitives modéliser explicitement
◦ attention, mémoire, processus subsymboliques

33
Adéquation aux résultats expérimentaux
Architecture cognitive : les débuts

1957
◦
General Problem Solver




Herbert Simon et Allen Newell
généralise Logic Theorist
un résolveur de problème universel
espace problème (problem space)
 résoudre un problème consiste à explorer et construire un graphe à partir d’un état initial pour
trouver un état final.
 méthode faible (weak method)
 méthode de résolution pouvant être appliquée à plusieurs domaines comme l’analyse moyens-fins
(means-ends analysis, hill-climbing …
 manipule des structures symboliques
 logique, géométrie, jeux d'échecs
34
1973

human associative memory
◦ John Robert Anderson
35
Représentation des propositions
36
1980

validation expérimentale (protocole verbal)
◦ K. Anders Ericsson et Herbert Simon
◦ 2 systèmes sont faiblements équivalents s’ils représentents la même fonction et
fortement équivalents si c’est le même algorithme
37
Les architectures à base de systèmes de production

1943
◦ Les systèmes de production sont apparus sous forme théorique

1972
◦ implantation de systèmes de production
◦ Human problem solving de Newell
38
Évolution des architectures basés sur les systèmes de
production
39
1983

ACT*
◦ Connaissance sémantique (déclarative)
 Réseau sémantique
 Activation de base + activation provenant du contexte
 Dispersion de l’activation
 Pas de distinction entre MCT et MLT, les éléments de la MCT sont les éléments actifs
(perception ou actifs) ??
◦ Connaissances procédurales
 Système de production
 Force d’une production
40
ACT* 1983
41
ACT* : dispersion de l’activation
L’activation part des
objets (unit) actuellement
actifs et via ses attributs
(element) se propage à
d’autres objets dans la
mémoire à long terme.
42
1983

SOAR 1 (State, Operator And Result)
◦ John Laird, Allen Newell, et Paul Rosenbloom
◦ Expliquer le comportement intelligent en proposant l’architecture de base de
tout système intelligent
◦ Mécanisme sophistiqué d’apprentissage de nouvelles connaissances
◦ Initialement peu de fondement psychologique à l’architecture
 Possible de produire des comportements plausibles et non plausibles
 Difficile de modéliser les connaissances sémantiques et épisodiques avec l’architecture
SOAR
 Attention les règles de production ne sont pas des connaissances procédurales
 Il ajoutent des préférences dans la mémoire de travail et complète l’information qui est déjà dans la
mémoire de travail mais cette mémoire de travail n’a aucun rapport avec sa partie correspondante
en psychologie
43
Soar : 1983
44
1983 : Model Human Processor (MHP)
45
1983 :
CPM-GOMS
46
Cognitive, Perceptual, Motor GOMS
Goals, Operators, Methods and Selection rules
Calcul du temps nécessaire pour percevoir un
objet avec GOM/CPM
47
1996 : EPIC
48
Description d’un ordinateur à deux niveaux
Aspects
Register-Transfer
Level
Medium
Bit Vectors
Components
Composition Laws
Systems
Behavior Laws
49
Symbol Level
Symbols,
expressions
Registers
Memories
Functional Units
Operations
Designation,
Transfer Path
association
Digital Systems
Computers
Sequential
Logical Operations
interpretation
Téléchargement