Apprentissage par association

publicité
Apprentissage associatif
Conditionnement classique et
conditionnement opérant
1
Est-ce qu’un rat peut apprendre ?
2
Conditionnement classique
 Ivan
Pavlov :
fondateur
3
Définitions

Stimulus inconditionnel (SI) : stimulus
provoquant une réaction par réflexe.

Réponse inconditionnelle (RI) : réponse
déclenchée par réflexe, sans qu’aucun
apprentissage ne soit nécessaire.
4
Définitions (suite)

Stimulus neutre (SN) : stimulus qui ne déclenche,
de prime abord, aucun réflexe ni aucune réponse.

Stimulus conditionnel (SC) : pendant le
conditionnement, le stimulus neutre change de
statut et devient un stimulus conditionnel
puisqu’il provoque maintenant une réponse,
appelée réponse conditionnelle (RC).

Réponse conditionnelle (RC) : réponse similaire,
ou même identique à la réponse du stimulus
inconditionnel.
5
Schéma

Illustration : expérience de Pavlov
Stimulus
inconditionnel (SI)
Réponse
inconditionnelle
(RI)
Stimulus neutre
(SN)
Aucune réponse
Avant
conditionnement
6
Schéma (suite)
Stimulus neutre
(SN)
Stimulus
inconditionnel
(SI)
Réponse
inconditionnelle
(RI)
Stimulus
conditionnel (SC)
Réponse
conditionnelle
(RC)
Stimulus
inconditionnel
(SI)
Pendant le
conditionnement
Après le
conditionnement
7
Exemples chez les êtres humains

L’expérience du petit Albert (Watson)

Les phobies et les autres
réactions de peur

Les aversions gustatives

La salivation en lisant un menu de
restaurant
8
Phénomène lié : la généralisation

Survient lorsqu’un stimulus semblable à un
stimulus conditionnel provoque une réponse
semblable à la réponse conditionnelle.
 Exemple : après le conditionnement, le petit Albert
n’avait pas seulement peur des souris blanches, mais
de plusieurs autres petits animaux blancs et même
d’un manteau de fourrure blanche.
9
Phénomène lié : la discrimination

La réponse conditionnelle est obtenue face à
certains stimuli bien spécifiques, mais ne se
manifeste pas face à des stimuli semblables.
 Exemple : une personne peut développer une phobie
des gros chiens, sans toutefois avoir peur des petits
chiens.
10
Phénomène lié : l’extinction

La réponse conditionnelle peut diminuer et
disparaître lorsque le stimulus conditionnel est
présenté trop souvent sans le stimulus
inconditionnel.
 Exemple : dans l’expérience de Pavlov, lorsque le son
de la cloche n’est plus suivi de l’apparition de
nourriture, la réponse de salivation diminue, puis
disparaît.
11
Phénomènes liés : récupération spontanée

Réapparition de la réponse conditionnelle après
une période d’extinction.
 Exemple : une personne qui avait autrefois une phobie
des seringues peut soudainement avoir de nouveau
une réaction de peur lors d’une prise de sang chez le
médecin.
12
Pause
13
Conditionnement opérant

Fondateur :
Burrhus Frédéric Skinner

Association entre notre comportement et
l’effet favorable ou défavorable produit sur
l’environnement.

La fréquence du comportement est ensuite
modifiée en fonction des conséquences
engendrées.
14
Expérience de Skinner

Un rat est placé dans une cage (« Boîte de Skinner »).

Le but est d’apprendre au rat à peser sur le levier pour
qu’il puisse s’alimenter par lui-même.
15
Expérience de Skinner (suite)

Pour cela, on utilise la technique du
façonnement, c’est-à-dire qu’on
récompense les comportements se
rapprochant du comportement cible.
◦ Continu
◦ Intermittent

Le rat apprend ainsi en fonction des
conséquences de son comportement.
16
Définitions : renforcement

Augmente la fréquence d’un comportement.

Renforcement positif (R+) : survient quand on
présente un stimulus qui fait augmenter les
probabilités de répétition d’un comportement.
◦ Exemple : gagner au casino.
17
Définitions (suite)

Renforcement négatif (R-) : survient quand on
supprime un stimulus désagréable afin
d’augmenter les probabilités de répétition de la
réponse initiale.
◦ Exemple : être exempté de faire la vaisselle.
18
Définitions : punition

Diminue la fréquence d’un comportement.

Punition positive (P+) : survient lorsque l’ajout
d’un stimulus désagréable diminue la probabilité
de répétition d’un comportement.
 Exemple : recevoir une contravention.
19
Définitions (suite)

Punition négative (P-) : survient lorsque le
retrait d’un stimulus agréable diminue la
probabilité de répétition d’un comportement.
◦ Exemple : être privé de dessert.
20
Tableau résumé
Renforcement
Punition
Positif/ Positive
Négatif/Négative
Ajout d’un
stimulus agréable
Retrait d’un
stimulus
désagréable
Ajout d’un
stimulus
désagréable
Retrait d’un
stimulus agréable
21
Synthèse
Conditionnement classique :
Stimulus inconditionnel amène une réponse inconditionnelle.
 Stimulus neutre + stimulus inconditionnel (association)
provoque la réponse inconditionnelle.
 Stimulus neutre devient un stimulus conditionnel et provoque
la réponse conditionnelle.

Conditionnement opérant :

Renforcement : augmente la fréquence d’un comportement
(R+, R-).

Punition : diminue la fréquence d’un comportement (P+, P-).
22
Téléchargement