Cours 8: LES THEORIES DU CONTIONNEMENT INSTRUMENTAL Flashcards Preview

Psycho de l'apprentissage final > Cours 8: LES THEORIES DU CONTIONNEMENT INSTRUMENTAL > Flashcards

Flashcards in Cours 8: LES THEORIES DU CONTIONNEMENT INSTRUMENTAL Deck (80):
1

Comment pourrait-on qualifier le béhaviorisme de Clark Leonard Hull? Pourquoi?

De béhaviorisme modéré

(avant: si on ne peut pas voir quelque chose, on ne s’en occupe pas)
* Mais lui, dit que si on ne peut pas observer quelque chose, ça veut pas dire que ça existe pas.

Hull a un parcours différent (psychanalyse, hypnose, ce qui lui permet de faire la part des choses)

2

Comment est-ce que Hull en arrive à avoir une vision plus cognitiviste de l'apprentissage que ses prédécesseurs béhavioristes?

La traduction d’un ouvrage de Pavlov (russe —> anglais) va l'initier aux concepts du conditionnement. (sérendipité)

* Il se rend compte qu’il a une opinion sur ce qu’il traduit, il se lance donc en recherche (béhaviorisme) pour élaborer une théorie.
* Entre le stimulus et la réponse: IL Y A QUELQUE CHOSE
* Transition vers le cognitivisme.

3

En quoi Hull fait il un retour à Darwin? (donner exemple d'homéostasie)

* Il revient aux sources: l’apprentissage apporte un avantage: la survie biologique de l’animal. (adaptation du comportement, Darwin)
* Biologie: concept d'homéostasie (idée que plein de choses dans notre corps doivent être maintenues à un certain niveau pour survivre). Existait déjà avant
* ex: pour un être humain on a des réactions physiologiques qui ne fonctionnent qu’à 37,5 degrés celsius.
* On a donc plein de réactions biologiques automatiques afin de ramener à ce niveau de température
* Hypothermie: on meurt.
* Comportement: Monter le chauffage/l’air climatisé.
 Il propose le concept de l’homéostasie comportementale ! (raison du conditionnement)

4

Hull assume l’existence de comportements _____________.

non-observables

5

Schématiser le lien entre le stimulus et la réponse selon Hull.

S —X – R – C

6

Dans S —X – R – C, que signifie "X" ?

* X est appelée une « variable intermédiaire » (ce qui est délaissé par les béhavioristes traditionnels) Au niveau méthodologique: la cause du conditionnement.
* X est hypothétique, car elle ne peut pas être observée
– acceptable si directement liée à S et à R ;
– permet de faire des prédictions concrètes sur le comportement que l’on pourra observer.

7

Quelle est la principale variable intermédiaire proposée par Hull?

La tendance (drive)

8

Homéostasie physiologique et quel est son lien avec la Drive

état dans lequel tous les systèmes biologiques de l’individu sont en équilibre

Tout organisme est motivé à maintenir ou restaurer cet équilibre :
– un déséquilibre de l’homéostasie crée un “besoin” ;
– ce besoin a un corollaire psychologique : la Tendance (ou “Drive”).

Très relié à la notion de besoin, très homéostasique.

9

Donner un exemple de drive

La faim. * Tout le monde prive les animaux de nourriture pour expérience, mais personne parle de la FAIM que ça engendre.
* Tous les besoins (aussi psychologiques) peuvent faire partie de l’homéostasie (homéostasie psychologie)

10

Quel est le rôle des renforcateurs primaires pour la drive?

* out le monde prive les animaux de nourriture pour expérience, mais personne parle de la FAIM que ça engendre.
* Tous les besoins (aussi psychologiques) peuvent faire partie de l’homéostasie (homéostasie psychologique)

11

Autres termes pour la drive

Motivation, tendance.

12

Quelle est la formule de Hull? (sans motivation incentive?)

E = (H x D) - (Ic+nIc)

13

Dans E = (H x D) - (Ic+nIc), que signifie E?

E = la force du comportement observable (RÉSULTAT OBSERVABLE) —> la force et la direction des comportements qu’on voit.

14

Dans E = (H x D) - (Ic+nIc), que signifie H?

H = “Habit” ou apprentissage/conditionnement (représente connaissances acquises, selon le nombre de présentations/pairages préalables, mais il y a un plafond) Pour un béhaviorisme traditionnel il n’y aurait que H.

15

Dans E = (H x D) - (Ic+nIc), que signifie D?

* D = “Drive” ou tendance (motivation de besoin, ex: la faim, si D=0, le rat n’a pas faim et ne fait pas le comportement de presser sur le levier)
* Si H ou D = 0 : il n’y a pas de comportement.
* On peut utiliser la formule de Rescola pour calculer H.

16

Dans E = (H x D) - (Ic+nIc), que signifie Ic?

* Ic = “Inhibition conditionnée” (la peur) —> l’inhibition a été apprise, on apprend des choses négatives qui nous font peut et nous empêchent de faire le comportement (ex: risque de pogner un choc électrique en allant chercher la nourriture)
* selon l’intensité du choc (mini choc, change pas grand chose)

17

Dans E = (H x D) - (Ic+nIc), que signifie nIc?

* nIc = “Inhibition non-conditionnée” (la fatigue, le manque d'énergie)
* ex: priver un rat de nourriture pendant 144h —> sur le bord de mourir, par d’énergie.

18

Quelle est l'utilité de Ic et nIc?

variables inhibitrices qui réduisent la force du comportement (d’ou la soustraction)

19

Quelle est la formule de Hull? (avec la motivation incentive)

E = (H x D x K) - (Ic+nIc)

20

Nommer cheque facteur dans E = (H x D x K) - (Ic+nIc)

 E = la force du comportement observable
 H = “Habit” ou apprentissage/conditionnement
 D = “Drive” ou tendance (motivation de besoin)
 K = “Incentive” (motivation additionnelle)
 Ic = “Inhibition conditionnée” (la peur)
 nIc = “Inhibition non-conditionnée” (la fatigue)

21

Expliquer la motivation incentive (et utilité en terme de nouveau facteur rajouté après)

-Un nouveau facteur : la motivation incentive (additionnelle)

 Une motivation créée par le renforçateur lui-même INDÉPENDANT de sa capacité objective à satisfaire le besoin à l’origine de la Tendance.
– p.e. la crème glacée peut nous faire manger alors que nous n’avons plus vraiment faim

(quelque chose de traditionnellement pas associé à l’espèce, mais notion de préférence personnelle) représente un élément supplémentaire —> surtout pour l’être humain dans un milieu favorisé!! 😃 (applications en marketing)

22

Drive: milieu favorisé ou défavorisé?

défavorisé

23

Incentif: milieu favorisé ou défavorisé?

favorisé

24

Avoir un cellulaire: passe de ______ à ______

incentif ; drive

25

En quoi est-ce que l'incentif éloigne du béhaviorisme traditionnel?

Crée un niveau de différences individuelles (préférences)
On est loin des lois absolues des béhavioristes stricts

26

Expliquer théorie du “Push” et du “Pull”
(ce que push et pull veut dire)

– “Push” : la motivation vient de l’intérieur (p.e. la Tendance) ;
– “Pull” : la motivation vient de l’extérieur (p.e. l’incentive) ;
– Il s’agit d’une approche “téléologique” (c-a-d à caractère “cognitif”).

27

Boite noire de Hull : en quoi ça fait une transition vers le cognitivisme?


Hull ouvre la boite noire des processus mentaux. * Ouvre la pote de nouveaux phénomènes (psycho cognitive) : Motivation, perception, mémoire.
* Il est en train de parler de perception et de mémoire (réactivation des traces de mémoire)
* Connaissance de la tâche, inhibition conditionnée
* aussi signaux biologiques (physiologiques) du drive et fatigue

28

Boite noire de Hull: Comment ça fonctionne?

* —> Une structure dans le cerveau calcule tous les facteurs
Facteurs positifs (x) : Drive, Incentif, Habitude positive (apprise)
Facteurs négatifs (+): inhibition conditionnée, fatigue
* Si valeur positive: ça prend aussi un SEUIL (pour avoir une raison de bouger, pour cesser l’inertie)

29

Donner un exempledu fonctionnement de la boite noire de Hull (avoir faim pendant son émission)

* ex: divan en train de regarder une émission: avoir faim mais pas assez. Les pubs de bouffes font de l'incentif (K), alors on se lève pour manger quand le E est assez élevé.

30

Boite noire de Hull: en quoi ça diffère des autres behavioristes?

Argument de Skinner: Ce qui se passe dans le SNC: on sait pas encore, boite noire. Bien qu’il y a quelque chose: on ne peut pas le voir, on ne peut donc pas l’étudier objectivement (hypothèses qu’on lance dans le ciel)

Alors que Hull ouvre la boite noire.

31

Qu'est-ce qui fait que Hull est encore un béhavioriste?

Il adhère à la loi de l'effet.
* Chaque fois qu’on a une réponse qui a l’effet de réduire le drive, augmente le H. La conséquence fait qu’on apprend (il reste un béhavioriste)
* 4 lois de l’apprentissage (pairage)

32

Nommer quelqu'un qui critique Hull.

Tolman

33

Quel est le rôle de Crespi dans la théorie de Tolman?

a fait l’expérience prévue par Tolman et a obtenu les résultats prévus.

34

Décrire expérience de Crespi (tolman)

Dans un labyrinthe, des rats sont entraînés à courir pour 1 (bleu), 16 (vert) ou 256 (rouge) pilules de nourriture (phase 1) ;

Lors de la phase 2, tous les rats reçoivent 16 pilules. (tt le monde se retrouve au niveau moyen-vert)

35

Qu'observe-t-on à la 1ere étape de l'expérience de Tolman?

* Prédiction standard (loi de l’effet, intensité des stimuli) : les rouges apprennent plus que les bleus
* C’est ce qu’on observe au début!! (première partie de la courbe)

36

Qu'observe-t-on à la 2e étape de l'expérience de Tolman?

* Instantanément, quand les rats du groupe bleu découvrent que récompense plus élevée, GROSSE augmentation de la performance.
* Se comportent comme s’ils avaient appris. Même si en vertu de la loi de l’effet ils ont moins appris.

37

Conclusion de l'expérience de Tolman?

Résultat : la modification de la taille de la récompense influence immédiatement la vitesse de parcours.
- Conclusion : Clairement les rats du groupe bleu avaient appris avant – c’est l’apprentissage latent
Argument: quand on voit un comportement chez un animal: on voit qu'il a appris. MAIS ON NE PEUT PAS CONCLURE DE L’ABSENCE D’UN COMPORTEMENT (ou d’un changement de comportement) COMME UN NON-APPRENTISSAGE DU COMPORTEMENT.
* tous les rats connaissant le labyrinthe aussi bien, mais récompense est proportionnelle a motivation de la parcourir.
* On ne peut pas voir l'apprentissage, mais on peut voir l’effet quand les conditions sont bonnes.
COURBES = PERFORMANCE (pas courbe d’apprentissage ; dépend de apprentissage ET MOTIVATION)

38

Selon l'expérience de Tolman, la loi de_____ ne joue pas de rôle dans l’apprentissage, c’est la loi de______

l'effet ; l'exercice (la pratique)

(Tolman dit que seulement la loi de la pratique est importante : La loi de l’effet n’est plus vraie.)

39

Décrire l'apprentissage latent.

Parfois on ne voit pas l’effet de l’apprentissage (en l’absence de renforcateur, motivation récompense)
Mais selon Tolman : se produit malgré tout. (la seule loi nécessaire pour expliquer l’apprentissage selon Tolman = loi de la pratique/exercice aka, on répète une tâche donc on l’apprend.)

40

Pourquoi la loi de la pratique et la loi de l'effet vont souvent ensemble?

Dans l’environnement naturel, l’être humain ne répète pas les tâches pour lesquelles il n’obtient pas de récompense. (mais aussi, parfois les récompenses sont intérieures – motivation interne, satisfaction personnelle)

Dans l’expérience de Tolman, les rats sont « forcés » à apprendre. (labyrinthe) mais eux aussi, en l’absence de récompense, iraient faire autre chose (choisir un comportement qui donne récompense)

41

Quelle est la conséquence sur le modèle de Rescorla si on dit que la loi de l'effet n,est plus importante?

modèle de Rescorla = contingence entre réponse et conséquence

MAIS on vient de dire qu’on n’a plus besoin de conséquence pour apprendre, ce qui signifierait que le lien entre réponse-conséquence (contingence) n’est plus nécessaire, n’est plus le facteur explicatif du conditionnement instrumental !!!

42

En rejetant la loi de l'effet, quel est le nouveau facteur qui explique l'apprentissage?

On apprend en portant ATTENTION. On ne peut apprendre que ce à quoi on fait attention. (Conséquence ou non, les rats apprennent le contenu du labyrinthe car ils y portent attention – il n’y a rien d’autre sur quoi ils pourraient porter leur attention.)

43

Expliquer comparaison entre attention et filtre.

L’attention : filtre l’énorme quantité d’information normalement disponible dans l’environnement. (au début des processus cognitifs) Elle sélectionne l’info qui rentre dans notre système.

44

Ou se positionne l'attention par rapport à la boite noire?

Au début de la boite noire ( l’attention et la perception = très similaire)

45

Quelle est la nature de la relation entre l'attention et la perception

relation réciproque : on accorde plus d’attention aux choses qui sont plus perceptibles et on fait attention -> on percoit bien ; on ne fait pas attention -> on perçoit mal

46

En quoi le fait de dire que l'attention est le facteur explicatif de l'apprentissage viole la 4e condition de l'apprentissage vue au début du cours?

On peut avoir de l’attention à un seul stimulus -> On n’a plus besoin de parler de pairage/lien entre stimulus !!!

47

Quel serait le nouveau rôle de la loi de l'effet si on dit que le facteur explicatif est l'attention?

Un rôle indirect. La sélection (attention) est influencée, oui, par les facteurs de motivation (récompense), donc pe que la loi de l’effet reviendrait à un facteur qui influence l’attention, car les récompenses attirent l’attention. MAIS la récompense n’est pas la cause de l’apprentissage (elle maximise l’attention)

48

Que fait Mackintosh?

Modèle qui se base sur l'attention, un des premiers modèles de psycho cognitive. – Mackintosh (1975) propose un modèle alternatif à Rescorla dans lequel l’attention du sujet à un SN/SC est liée à la capacité du SN/SC à prédire le SI (« contingence »)

49

Qu'est-ce que le modèle de Rescola n'explique pas?

L'inhibition latente, c'est-à-dire que la pré-exposition du SN entraîne un conditionnement plus lent du SC par la suite

* Stimulus neutre présenté seul (réponse d’orientation) crée habituation (baisse de la réponse d’orientation)
* On n’apprend à l’ignorer puisqu’il n’a pas de conséquence.
* L’habituation n'est pas un apprentissage mais a un effet sur l’apprentissage

50

Comment est-ce que le modèle de Mackintosh explique l'inhibition latente?

Mackintosh déclare que ALPHA va augmenter si SN/SC est un bon prédicteur de SI, et diminuer dans le cas inverse (ce que Rescorla n’a pas voulu modifier pour adapter son modèle à la réalité)

* Dans le fond, Macintosh prend le modèle de Rescorla (qui insiste sur la contingence et le caractère objectif des stimuli) et le rend plus parfait (remplacer alpha par l'attention).
* Stimulus neutre présent plusieurs fois: l’attention portée à ce stimulus baisse. (explique inhibition latente)

On n’a plus de problème: l’attention n'est pas une constante, peut varier (même instantanément). Cela peut donc expliquer des comportements qui changent soudainement (ex: Tolman = les rats qui ont soudainement plus de récompense -> attention plus aiguisée -> meilleure performance)

Aussi: béta n'est plus nécessaire car contingence n'est plus explicatif.

51

Quelle est la formule de Mackintosh?

ΔV = α (λ - V)

52

Que représente V dans la formule de Mackintosh (et Rescorla) ?

– V, la quantité d’apprentissage acquise; (apprentissage déjà fait, somme de tous les apprentissages précédents)

53

Que représente ΔV dans la formule de Mackintosh (et Rescorla) ?

L'apprentissage fait.

54

Que représente α dans la formule de Mackintosh ?

Le niveau d'attention (variable)

55

Selon le modèle de Mackintosh, pourquoi les stimulus nouveaux sont plus faciles à conditionner?

ils attirent particulièrement l’attention (inverse de l’habituation)

Réponse d’orientation = niveau de base d’attention (tout stimulus nouveau)

Nouvelle cloche + nouveau choc = bang on fait la connexion

56

Qu'est-ce que le modèle de Mackintoch permet aussi d'expliquer?

le blocage de Kamin (en termes de non-attention à B lorsque A a déjà été conditionné avec SI)

57

Macintosh: va argumenter que le rat va devenir ______ attentif

de plus en plus

Quand on apprend qu’un stimulus en annonce un autre, on est supposé devenir plus attentif à ce stimulus, c’est logique. Logique bonne mais pas la vérité!!

58

Décrire l'expérience 1 de Pearce et Hall

2 groupes de rats, contrôle et expérimental - conditionnement classique (ne change rien sur le modèle, fonctionne aussi avec conditionnement instrumental, les 2 sont influencés par le mécanisme d'attention)

 Phase 1 – Groupe xp reçoit un SN/SC (ex: lumière) et un choc faible (pairage stimulus neutre et choc) 20 fois (jusqu’à conditionnement)

Groupe contrôle reçoit un choc sans SN (aléatoire et sans pairage, ne peuvent rien apprendre, pas d’apprentissage latent)

 Phase 2 – Groupe xp reçoit un choc plus intense (modéré) avec le SC

Groupe contrôle reçoit le choc plus intense avec le SN/SC (pour la première fois)

59

Qu'est-ce que Mackintosh penserait qui arriverait dans l'expérience de Pearce et Hall.

comme Skinner et Pavlov, Macintosh propose que les rats xp apprennent plus et sursautent plus (mais mécanisme = attention)
Il sont donc plus attentifs dans la phase 2

60

Qu'est-ce que Pearce et Hall font comme hypothèse pour leur expérience? (la vraie) Pourquoi?

* Ils croient que dans la phase 2, les rats xp vont être moins attentifs
* Raison (la bonne) : l’attention est une ressource limitée, un mécanisme sélectif, un filtre (on ne peut pas faire attention à tout). On ne peut pas constamment l’investir en une chose ou plus plus plus constamment.

61

Ainsi, une fois qu’on a compris quelque chose, l’attention ______. (ensuite, on passe à une mode de fonctionnement plus _______, l'attention va ailleurs, ce qui est plus ______)

baisse ; automatique ; efficace/évolutif

62

L’attention est une ressource qu’on utilise seulement quand on sait ou ne sait pas?

ne sait pas

63

On porte attention à quelque chose pas parce que c’est important, mais parce que ça _________.

surprend

64

Quel est le résultat de l'expérience de Pearce et Hall

c'est le groupe xp qui a la moins bonne performance (ce sont ceux qui sursautent plus fort)

Ainsi, bien que les rats contrôles sont exposés à moins de pairages (commencent dans la phase 2) vont être meilleurs que xp.
Les rats contrôle vont finalement apprendre la cause des chocs dans la phase 2, mais avec des gros chocs. Clairement, l’intensité du choc est un facteur dans l’apprentissage.

65

Transfert négatif de Pearce et Hall

* Moins porter attention à ce qui nous est familier. Un apprentissage préalable peut réduire un apprentissage subséquent. Danger!
* Pourquoi? Car l’attention est présente en quantité limitée, donc la garder au même endroit est idiot, pas adaptatif.

66

Donner un bon exemple de mécanisme de réduction de l'attention

La généralisation: Si je montre X, puis X+1 et X-1, on peut penser que c’est la même chose (on assume que quelque chose d’autre s’applique à la même situation, on ne fait pas attention)

Si on a appris quelque chose, on assume que toutes les situations similaires sont les mêmes et le niveau d’attention baisse, mais si en vrai les situations sont différentes on pourrait ne pas le remarquer.

67

Décrire discrimination en terme de retour de l'attention

Cloche différente qui n’annonce pas de choc (l’environnement donne une conséquence différente) -> discrimination (se produit parce qu’on est surpris que la généralisation soit pas vraie)

68

Nommer un autre facteur qui module attention

énergie/motivation

(la capacité des humains à accorder de l’attention peut dépasser ces mécanismes de base/spontanés à cause du cortex frontal, il peut porter volontairement son attention sur quelque chose qu’il sait déjà parce qu’il choisit de le faire, requiert effort et motivation

69

Comment Pearce et Hall expliquent le transfert négatif (en terme de alpha)

Pearce et Hall expliquent le transfert négatif vu précédemment par le fait qu’après phase 1, le stimulus est bien connu et donc moins surprenant. De ce fait, alpha est plus faible que normalement au début de la phase 2.

70

Comment Pearce et Hall expliquent le transfert négatif (en terme de alpha)

Similairement au transfert négatif, le stimulus est déjà bien connu et donc moins surprenant. Ainsi, alpha est plus faible que normalement au début de l'apprentissage

71

Expliquer la différence entre le modèle de Mackintosh et Pearce et Hall.

* Alors que Mackintosh propose que l’attention est attirée par les stimuli utiles (qui apparaissent comme important),
* Pearce et Hall croient qu’il est inutile pour un organisme de gaspiller des ressources sur de tels stimuli et proposent que ce sont les stimuli encore non-compris (p.e. nouveaux, surprenant, etc.) qui attirent l’attention.

72

Qu'est-ce qui est mesuré dans l'expérience 2 de Pearce et Hall?

Mesuré ici: mouvements de tête des rats (pas l'apprentissage) à l’apparition d’un stimulus

73

Décrire les 3 groupes de rats dans l'expérience de Pearce et Hall

1. Continu: le stimulus neutre est constamment associé à un stimulus inconditionnel, pairage parfait, conditionnement classique.
* Le schéma montre que les rats tournent de moins en moins la tête. (on sait que la cloche prédit SI, pu de curiosité)

2. Nul: Entendent la cloche toute seule de façon irrégulière (il n’y a pas d’apprentissage). Situation d’habituation.
* Le schéma montre que, similairement au premier groupe, les rats tournent de moins en moins la tête. (on sait que la cloche fait rien, pu de curiosité)

3. Partiel: On fait un mélange, parfois la cloche annonce un choc, parfois non.
* Les rats ne savent pas vraiment ce que fait la cloche: le mouvement de tête reste relativement stable, ne baisse pas.
* Argument de Pearce et Hall: Les rats n’ont pas encore appris, ne savent par ce que fait la cloche -> ils continuent à être surpris. Ainsi, ils restent attentifs (jusqu’à ce qu’ils apprennent quelque chose de stable)

La lumière est soit associée à un SI (continu), soit à l’absence de SI (nul). Pour le troisième groupe, il y a présentation aléatoire de la lumière et du SI (partiel).

74

Quels sont les résultats de l'expérience 2 de Pearce et Hall?

Pearce & Hall observent que les réponses d’orientation diminuent pour « continu » et « nul » (les 2 rats apprennent des choses différentes, amis les 2 rats ont appris, alors diminution de la réponse d’orientation), mais restent fortes pour « partiel » (qui reste surprenant).

75

Qu'est-ce que l'expérience 2 de Pearce et Hall noud dit sur l'habituation?

* L’habituation est clairement un apprentissage! Autre type, mais son effet est le même sur l’attention. On apprend ce que fait la cloche (rien) donc on n’y fait pas attention.
* Ainsi, argument -> pour apprendre, il faut juste savoir ce que fait quelque chose. Peu importe ce que ça fait. Quand on pense savoir ce que ça fait, c’est appris. (et quand c’est appris, le niveau d’attention est faible). Pour faire réapprendre, il faut surprendre (quelque chose qui change)

76

Est-ce que l'extinction est un apprentissage?

* L’extinction est un apprentissage: c’est quelque chose qui change. On est surpris par le levier qui ne donne plus de nourriture.
* Le manque de surprise explique la résistance à l’extinction
* Si ça marche juste de temps en temps, on n’est pas surpris quand ça commence à ne plus marcher du tout.

77

Quelle est la formule de Pearce et Hall?

DV = α (I - ΣV)

78

Que représente l - ΣV dans la formule de Pearce et Hall ?

le degré de surprise

79

Que représente l - ΣV dans la formule de Pearce et Hall ?

alpha représente l’attention, et dépend du degré de surprise à l’essai précédent (alpha baisse)
* Plus on apprend, plus alpha baisse.

80

L’attention est nécessaire non seulement dans l’apprentissage mais aussi dans la ____________

récupération/performance

ex: porter attention en classe mais aussi quand on fait l’examen