Cours 6 : LE COMPORTEMENT, SES CONSÉQUENCES ET APPRENTISSAGE Flashcards Preview

Psycho de l'apprentissage final > Cours 6 : LE COMPORTEMENT, SES CONSÉQUENCES ET APPRENTISSAGE > Flashcards

Flashcards in Cours 6 : LE COMPORTEMENT, SES CONSÉQUENCES ET APPRENTISSAGE Deck (66):
1

Quelle est LA différence la plus importante entre le conditionnement classique et instrumental

le conditionnement classique permet d’avoir des signaux qui permettent de réagir à l’avance (n’apprend rien de nouveau pour les réponses elles-mêmes, même si c’est utile, ce qui procure un avantage évolutif, surtout dans le cas d’un stimulus aversif) tandis que le conditionnement instrumental permet d’apprendre de nouveaux comportements, certaines conditions vont permettre des réponses qu’il ne connaissait pas et ne faisait pas avant (mais limité par les capacités physiques: les mouvements/réponses motrices peuvent être faits, mais pas utilisés dans tel contexte nouveau, dans telle séquence nouvelle, diversification de l’utilisation des capacités motrices.)

2

Quel est l'avantage évolutif du conditionnement instrumental?

pouvoir apprendre des choses.

3

Béhaviorisme apparu en Amérique du Nord suite au (structuralisme ou fonctionnalisme) ?

fonctionnalisme

4

Skinner a eu un impact énorme en psycho. Pourquoi?

Parce que sait communiquer ses idées (sait bien écrire et organiser ses idées). Tout comme Freud, argumente très bien.

5

Vrai ou Faux? La pensée de Skinner est très radicale

Vrai. (contrairement à la pensée de la psycho cognitive)

6

Au début de la carrière de Skinner, quel est l'état de la psycho par rapport au grand public? Comment est-ce que ce statut de la psychologie évolue tout au long de sa carrière?

* Skinner a très vite compris que (psycho est une discipline âgée de 40 ans quand il commence, gros départements, engouement pour cette nouvelle science) la psycho est une discipline qui n’a pas encore vraiment d’impact pour le public (il n’est pas au courant des idées)
* Le béhaviorisme va briser cette barrière. Devient quelque chose de commun que tt le monde connait.
* Ex: tout le monde connait Pavlov et ses chiens aujourd’hui —> C’est en partie à cause de Skinner. Il encourage l’idée de parler au médias (de l’époque), faire des entrevues avec des journalistes, organiser des conférences avec le grand public.
* Les médias l'appellent parce qu’il dit des idées choquantes. Très radical et se gène pas pour le dire (sensationnalisme) Beaucoup de réactions.
* Relation particulière, car Skinner aime les médias et veut propager les idées de la psycho (lui donne un podium), même s’il est souvent présenté négativement par ceux-ci. Relation « symbiotique ».

7

Vrai ou Faux? Skinner fait des expériences très cruelles sur les humains

Faux, Skinner fait rien de cruel à la Watson avec son expérience du petit Albert. N’a pas fait d’expérience avec les êtres humains (ne voit pas la différence entre l’humain et l’animal, donc pas d'utilité à en faire)

8

Vrai ou Faux? Skinner ne voit pas la différence entre l'humain et l'animal. (expliquer)

Vrai. * La pensée humaine les convictions, processus mentaux = illusion.
* Existe, mais c’est pas ça qui contrôle le comportement des gens:
* c’est un détail, déchet de ce qui se passe réellement à un niveau préfondamental —> mécanismes de conditionnement (qui contrôle le comportement.), COMME LES ANIMAUX.

Conséquence logique que ce que Thorndike fait en faisant des travaux sur les animaux

9

Qu'est-ce que Skinner pense des processus mentaux (objet de la psychologie cognitive qui se développe dès 1970) ??

* La pensée humaine les convictions, processus mentaux = illusion.
* Existe, mais c’est pas ça qui contrôle le comportement des gens

(ce sont les mécanismes de conditionnement qui contrôlent le comportement)

Skinner ne voit donc pas l’utilité d’étudier les processus mentaux, très réductionniste, permet une étude plus objective de la psycho.

10

On dit que Watson est le fondateur du béhaviorisme. Cependant, on pourrait aussi argumenter que c'est Skinner. Pourquoi?

c’est surtout Skinner qui énonce les idées et élabore les concepts

11

La boite de Skinner sert à gérer quoi?

conditions d’apprentissage (pour les conditionnements classiques ou instrumentaux) Il y a une standardisation des outils.

12

Quel problème est-ce que Skinner règle avec l'invention de la boîte de Skinner?

les chercheurs en psycho en université font tous leur petite affaire individuellement. 36 000 personnes avec 36 000 instruments différents: difficile de comparer/mettre ensemble les différentes recherches. La standardisation de ces outils permet d'améliorer le corps des connaissances, donne ce sentiment d’une école de pensée UNIFORME: le béhaviorisme.

13

Nommer quelques composantes de la boite de Skinner et leur utilité (en contidionnement classique ou instrumental?)

* Conditionnement classique
* SN: (haut parleur, lumières)
* SI: plancher en métal (chocs), dispenser de nourriture
* Conditionnement instrumental
* Réponse: levier/bouton
* SI (les mêmes qu'en classique)

14

Quel est le désavantage de standardiser (en créant la boîte de Skinner) ?

On ne peut pas faire certaines choses (ex: l'animal ne peut pas CHOISIR une réponse). Pas l’instrument parfait.

15

Nommer un des apports de Skinner a la psycho (en lien avec les ordis)

l’ordinateur est un bon outil pour la recherche. Il peut automatiser une bonne partie des choses qu’on fait (ex: donner les chocs, enregistrer les réponses, etc.), plus de sciences, plus de découverte. Skinner est un empiriste convaincu (comme les béhavioristes en général)

Aujourd’hui, on peut facilement gérer 4 boîtes à la fois. L’ordi ne fait pas d’erreur (ex: tjrs les bons délais pour donner les chocs)

16

Nommer un des apports de Skinner a la psycho (+ en lien avec l'apprentissage)

Nombre astronomique de types d’expériences, de protocoles, de paradigmes. (ex: paradigme de sommation et de retardation de Rescola) Il ne faut pas inventer une nouvelle procédure si une procédure existante pourrait convenir à votre question de recherche! (ou juste pour le fun d’inventer une procédure)

Invente une sorte de classification des procédures des expériences faites pour le conditionnement/apprentissage:

17

Nommer les 2 types de situations expérimentales

“l’essai discret” et la situation “opérante libre”

18

Décrire la situation expérimentale d'essai discret.

des essais particuliers avec un début et une fin qui sont identifiables ; il requièrent une plus grande implication du chercheur ; plus efficace

l'expérience est terminée quand le sujet fait le comportement attendu. (ex: Quand le chat a activé le levier et a reçu sa récompense de sortir de la boite)

19

Nommer un exemple de situation expérimentale d'essai discret.

la boite d’évasion de Thorndike.

20

Décrire les avantages d'utiliser un protocole d'essai discret

DONNE DES RÉSULTATS
* La corbe d’apprentissage est plus rapide, car c’est beaucoup plus facile de voir qu’il s’est passé quelque chose d’important quand tout change et que l’humain doit le remettre dans la boite.
* Maximise la perception de la contiguité (et éventuellement de la contingence) chez le chat.

21

Décrire les désavantages d'utiliser un protocole d'essai discret

* Pas très réaliste. Dans l’environnement naturel, la récompense n’est pas interrompue par l’intervention de l’humain (remettre le chat dans la boite). Artificiel.
* C’est donc difficile d’appliquer une théorie testée avec essai discret à l’environnement naturel. (critique)

22

À quoi est-ce qu'on s'intéresse davantage dans une situation expérimentale d'essai discret?

L’intérêt est la latence (temps pour s’échapper de la boite du chat)

23

Décrire la situation opérante libre

pas d’essai particulier, réponse disponible en tout temps, mais pour période fixée à l'avance ; plus réaliste

ex: Levier: actionne 1 fois la distributrice de nourriture, quantité minime.

24

Nommer un exemple de situation opérante libre

La boite de Skinner avec levier-nourriture ex: L’expérience de Spence (Go-NoGo)

25

Décrire les avantages d'utiliser une situation opérante libre

* + naturel
* La réponse souhaitée arrive plusieurs fois (ne met pas fin à l’expérience)
L’expérience dure le temps déterminé à l’avance.

26

À quoi est-ce qu'on s'intéresse davantage dans une situation opérante libre?

Souvent l’intérêt est de calculer combien de fois la réponse se produit par minute (fréquence)

27

Paradigme expérimental du conditionnement instrumental

Aussi nommé paradigme s-r

S --> R --> S^R

28

Dans le paradigme expérimental, que signifie S?

S = Situation de stimulation (stimulus)

29

Dans le paradigme expérimental, que signifie R?

R = Réponse (qui a une conséquence)

30

Dans le paradigme expérimental, que signifie S^R?

S^R = stimulus renforçant, conséquence, effet de la réponse

31

nommer les 3 grandes différences entre le conditionnement classique et instrumental.

1- Conditionnement classique = apprendre des signaux pour prédire un stimulus "agréable", alors que conditionnement instrumental = apprendre de nouveaux comportements qui vont causer le stimulus agréable

2-nature du comportement (classique=réponse automatique, instrumental = réponse volontaire émise)

3-Classsique: RC prépare pour la RI ("avantage")
Instrumental: R nous amène à SR a conséquence NE PEUT SE PRODUIRE sans la réponse.

4-

32

Expliquer pourquoi on dit que les 2 conditionnements (classique et instru) s'apprennent pas contingence.

Il faut un pairage. La contingence n’est pas différente.
C classique: Stimulus annonce quelque chose
C instrumental: Réponse annonce (cause) quelque chose.
Donc, les 2 conditionnements sont des prédictions. Une environnementale et une de conséquence. Dans les 2 cas, l’animal apprend une façon de prévoir quelque chose qui l'intéresse (un stimulus inconditionnel ou un autre stimulus inconditionnel dont il peut artificiellement lui-même causer l’apparition)

33

Liste des choses qu'on a appris en conditionnement classique qui vont aussi s'appliquer au conditionnement instrumental

Lois de Thorndike
 Loi de la pratique (plus le rat presse le levier, meilleur il est, presse plus vite)

- Loi de l’effet aussi 😃

 Loi de l'intensité des stimuli (plus grosse récompense, meilleur apprentissage, plus gros bouton, meilleur apprentissage)
 Extinction et récupération spontanée (si presser le levier ne donne plus de nourriture, on arrête, inhibition interne, mais avec un break il y a récupération spontanée)
 Importance de la contiguïté (nécessaire)
 Importance de la contingence (responsable, lien statistique)
 Blocage et masquage

- bloquage: même raisonnement, si le rat apprend à presser levier pour avoir nourriture et qu’on fait apparaitre un bouton qui distribue nourriture, le rat ne va pas appuyer sur le bouton mais continuer d’activer le levier.
- mais: ça va se complexifier, pas tjrs vrai.

 Généralisation et discrimination

- on met le rat dans une autre boite qui ressemble à une boite de Skinner, il va presser le levier par généralisation. Mais si le levier de la 2e boite donne des chocs électriques, il va apprendre la discrimination.

34

Skinner s'inspire beaucoup de la loi de l'effet de Thorndike, mais il y change quelque chose? Qu'est-ce que c'est et pourquoi?

- Skinner reprend la loi de l'effet en s’éloignant de certaines formulations de celle-ci pour avoir une formulation plus objective, plus rationnelle
- Il n’aime pas les mots « agréable » et « désagréable » ne devraient pas être utilisés en psycho, car ça change d’une personne à l’autre, c’est trop subjectif et ça fait trop référence à des processus internes
- La conscience (opinions) n’est pas important. Ce qui compte dans la loi de l’effet = L’EFFET (augmente ou diminue la réponse? c’est ce qu’on essaie d’expliquer.)

35

Conséquence (effet)

centrale, permet l’apprentissage

36

Qu'est-ce qu'un renforcement?

toute situation S-R-C dans laquelle l’effet de C sur R est d’augmenter la probabilité de la réponse R.

- Si on voit que la réponse augmente, la conséquence C est un renforcement.

37

Qu'est-ce qu'une punition?

toute situation S-R-C dans laquelle l’effet de C sur R est de diminuer la probabilité de la réponse R.

- Fait réduire le comportement

38

Qu'est-ce que la contingence positive?

toute situation S-R-C pour laquelle la conséquence C de R est l’apparition d’un stimulus qui n'était pas présent auparavant.

- Apparition de quelque chose (ex: nourriture)

Encore ici, pas de lien avec ce qui est agréable/désagréable.

39

Qu'est-ce que la contingence négative?

Est dite « négative »
– toute situation S-R-C pour laquelle la conséquence C de R est la disparition d’un stimulus présent auparavant.

- Disparition de quelque chose

40

Selon Skinner, que faut-il regarder pour savoir si on affaire à un renforcement ou une punition.

Skinner dit de regarder l'EFFET (augmentation ou diminution de la réponse) pour savoir si renforcement ou punition.

ET NON si c'est agréable ou désagréable. (Skinner comprend bien qu’on ne peut pas présumer à l’avance si quelque chose st un renforcement ou non. Il faut le vérifier.)

41

La contingence en conditionnement instrumental est un peu plus compliquée qu'en conditionnement classique parce qu'il y a 2 aspects à considérer. Lesquels?

-Le type d'effet sur la réponse (renforcement vs punition)
-La nature de la conséquence (positive ou négative)

42

Qu'est-ce que le renforcement positif?

- Le renforcement positif consiste à donner au sujet un stimulus agréable, c'est un événement qui augmente la fréquence d'apparition d'un comportement grâce à un stimulus « agréable ».
- Augmentation de la réponse
- La conséquence apparait
- Par exemple, une gâterie pour un chien qui fait le beau.
(sous entend que la récompense est agréable mais pas besoin de parler de processus mentaux car on voit l'effet.)

43

Est-ce que le renforcement positif est efficace? Sinon, que faire?

- TRÈS EFFICACE! (ex: l'argent, on veut en gagner plus)
- Si ça marche pas, on augmente l'intensité de la récompense (ex: plus d'argent --> ça va vraiment en prendre bcp avant que ça marche pu et que ça motive pu)

44

Est-ce toujours vrai que plus de récompense -> plus d'apprentissage? Donner un exemple (venant de Harry Potter.)

Non, on peut trop récompenser.

PROBLÈME: plus on récompense quelqu'un de l'extérieur plus on a tendance à réduire chez eux cette motivation interne. Surtout si on commence jeune. Les enfants ne naissent pas avec une motivation interne. Ça se développe. Mais si dès la naissance, on commence à les bombarder de récompenses pour tout ce qu'ils font, on va étrangler cette motivation interne, ce qui va possiblement les nuire.

ex: Dudley dans Harry Potter qui se fâche parce qu'il a moins de cadeaux que l'année passée. Il a trop de récompenses externes, pas bon.

Empêche d'être heureux avec moins car le bonheur peut venir de l'intérieur. Dépendance à des renforçateurs superficiels: la littérature dit que ce n'est pas le meilleur pour nous.

45

A part la réduction de la motivation interne, quelle est un autre problème du renforcement positif excessif? Donner un exemple (venant de Harry Potter.)

PROBLÈME no2: Il faut donner les récompenses, viennent de quelque part. (donner un cadeau à son enfant pour chaque bonne note: ça coûte cher) Problème, car réduire une récompense peut être une punition et est confrontée par le sujet.

ex: Dudley dans Harry Potter qui se fâche parce qu'il a moins de cadeaux que l'année passée.

46

Quelle est la différence entre Motivation interne vs motivation externe ?

Ce qui nous renforce peut venir de l'extérieur (ce que l'environnement nous donne, renforcement externe) ou de l'intérieur (vient de nous-même, ex: sentiment de satisfaction personnelle, beaucoup plus relié à notre santé mentale et notre bien être psychologique)

47

Pourquoi les phobies sont aussi fortes? (réponse en lien avec conditionnement insrumental)

Parce que l'évitement de la chose dont on a peur est renforcé négativement (le fait d'avoir une réponse d'évitement permet de retirer quelque chose de désagréable, comme sentiment de panique, palpitations, symptômes d'anxiété) L'évitement "fonctionne"

48

Qu'est-ce que le renforcement négatif?

- Le renforcement négatif consiste à supprimer un stimulus désagréable ou douloureux, c'est un événement qui augmente la fréquence d'apparition d'un comportement grâce à un retrait ou à l'arrêt d'un stimulus « désagréable » .
- Par exemple, prendre une aspirine qui fait disparaître un mal de tête.
- Aussi, rat qui pèse sur un levier pour faire disparaitre des bruits désagréables dans sa cage.

- Augmentation de la réponse
- La conséquence (désagréable) disparait

49

Est-ce que le renforcement négatif est efficace? Qu'est ce qui est nécessaire pour qu'il le soit?

On réagit très fort au renforcement négatif, parfois même aussi fort que pour le renforcement positif.

Efficace si on trouve le bon truc désagréable à enlever, dans des conditions optimales = presque impossible a faire.

(Renforcement: Dur de récompenser quelqu'un qui n'a pas besoin de rien/qui n'est pas dans des conditions désagréables.)

50

Dans l'exemple de la psychologie industrielle. (Entreprise automobile dans les années 70 avec véhicules de qualité horrible, problème de design et de performance des employés sur les chaines de montage.) Les employeurs veulent que les employés travaillent plus et mieux (ça prend du renforcement).

Quelle est la/les solutions proposées par les psychologues industriels?

- Réponse simple: payer mieux les employés? Mais l'entreprise a pas envie de faire ça.
- Puisqu'on ne peut pas faire de renforcement positif ($$), il faut faire du renforcement négatif.
- Va observer l'environnement des employés pour essayer de trouver des stimulus désagréables (à enlever).
- idées: installer ventilateurs qui évacuent mauvaises odeurs. paravents pour le son. Coût unique.
- Quand le tapis accélère, les ventilateurs partent. (employés qui travaillent plus fort, moins d'odeurs)

51

Est-ce que la punition fonctionne?

(nommer le problème qui fait en sorte que ce n'est pas plus utilisé)

Ça fonctionne (si marche pas, doubler la punition, loi de l'intensité des stimuli). Moyen très efficace et très pratique de provoquer un changement dans les réponses (au même titre que le renforcement)

MAIS problèmes éthiques. (fort débat dans la littérature)
- est-ce que le changement est permanent?
- est-ce que la punition a des conséquences supplémentaires?

52

Qu'est-ce que la punition positive?

- Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite à l’ajout d'un stimulus « aversif » ou conséquence désagréable contingente au comportement cible.
- Par exemple, l’ajout d’une obligation, d'une douleur...

- Diminution de la réponse
- La conséquence apparait (l'environnement inflige de la douleur)

53

Quel est le désavantage de la punition positive? (réponse courte)

La punition positive a des effets secondaires indésirables (décourage l'utilisation de la punition positive, en particulier avec des enfants)

54

Nommer 4 effets nocifs indésirables de la punition positive

- Agressivité passive chez les gens punis
– Intensification de l’agressivité chez celui qui administre la punition.
– L'apprentissage de l'agressivité par le sujet puni.
– Comportement d’évitement de la punition (et non d'apprentissage de la réponse adéquate)

***la punition négative a aussi ces problèmes-là (à un degré moins élevé par contre, moins fréquent ou moins intense)

55

Définir agressivité passive.

Forme subtile d’agressivité caractérisée par la bouderie, la procrastination, l’entêtement et l’inefficacité intentionnelle.

Les gens punis développement une tendance à exprimer leur frustration de façon indirecte.

56

Donner un exemple d'agressivité passive (contexte de couple)

Oublier des choses, être absent d'esprit dans un couple: forme de contre-agression, de réaction à la punition de (par exemple) s'être fait crier dessus. Peut être fait consciemment ou inconsciemment.

Quand il y a un déséquilibre de pouvoir:
- Dominant: Se plaint.
- Soumis: agressivité passive. (oublis, retards, manquements qui frustrent l'autre)

57

Expliquer l'intensification de l’agressivité chez celui qui administre la punition.

- Cercle vicieux : le « punisseur » est renforcé d’avoir puni (renforcement négatif: ça fonctionne et on cesse d'être dérangé, en plus, il faut augmenter la punition si ça marche plus.)
- Donc, la punition apprend au punisseur à punir plus.

58

Expliquer l'apprentissage de l'agressivité par le sujet puni.

- Deviennent des punisseurs à leur tour car il ont la preuve que la punition fonctionne (ils en sont eux-mêmes la preuve)
- Littérature: les personnes abusées deviennent abuseurs. Il y a une corrélation.

59

Expliquer le comportement d’évitement de la punition (et non d'apprentissage de la réponse adéquate)

- Quand on punit excessivement les gens, ils développent le risque d'apprendre le moyen d'éviter la punition plutôt que ce qu'on veut leur enseigner. Induit le développement d'une réponse d'adaptation.
- Une punition trop souvent utilisée: On me punira seulement si jme fait prendre. (ex: le feu rouge a 3h du mat dans une rue vide)

60

Donner des exemples de comportement d’évitement de la punition

- Empêcher un ado de sortir pendant 6 mois: il apprend qu'on est puni seulement si on se fait prendre.
- 2 types de criminels (voleurs de banque):
- Pas d'antécédents, peu de risques de récidive, punition courte (la personne comprend qu'on la punit pour ne pas qu'elle le fasse à nouveau.)
- 12e crime, va seulement changer ce qu'il fait pour pas se faire prendre la prochaine fois.
- Autre exemple: Fumer la cigarette. --> Taxes sur la cigarette pour décourager les fumeurs.
- MAIS: ça a développé de la contrebande de cigarettes.

61

La punition est-elle bonne pour le contrat social (l'application de lois dans la société)?

Non, la punition met en péril le contrat social (les gens se rendent compte que tt est permis si on se fait pas prendre)

62

Prison: punition négative ou positive?

En théorie: la prison est une punition négative (perte d'un privilège -> de faire ce qu'on veut). Mais, si la prison est un endroit désagréable (ex: ça pue, les gens sont pas fins...) c'est aussi une punition positive.

63

Définir punition négative

 Procédure par laquelle la probabilité de fréquence d'apparition d’un comportement tend à diminuer suite au retrait contingent d'un stimulus agréable, dit « appétitif ».
 Par exemple: Retrait d’un privilège, d'un droit...

- Diminution de la réponse
- La conséquence disparaît

64

En lab, les comportements ne peuvent pas être renforcés s’ils ne se produisent pas.

- Il faut attendre que l'animal mette la patte par hasard sur le levier. Il faudrait également que le hasard se produise 3-4 fois avant que l'animal comprenne.
- MAIS C'EST LONG et peu probable (il a plein d'autres choses à faire: renifler, gratter, etre assis dans un coin etc.)

Que fait Skinner pour accélérer le processus?

SOLUTION: façonnement (shaping) --> permet de faire apprendre à un animal en 5 min ce qui prend des heures si on ne s'en tient qu'au hasard.

Permet de faire des choses, simples ou compliquées, qui N'ARRIVERAIENT JAMAIS PAR HASARD.

65

Quelle est la procédure pour le façonnement?

Appliquer le principe de renforcement (positif, pour s'assurer que ce soit efficace)

Des approximations successives sont renforcées, débuter avec un critère large pour le renforcement.
- Levier à gauche du rat
- Récompenser le rat qui se tourne vers la gauche (augmente la possibilité du comportement)

Ensuite, augmenter graduellement le critère (exiger de plus en plus de réponses: le sujet va très facilement le faire si étape par étape.)
- On arrête de récompenser le rat qui se tourne a gauche et attendre que le rat se rapproche du levier (maintenant plus probable) pour lui donner une récompense
- Ensuite, on donne la récompense si le rat actionne le levier.
- Ainsi, le façonnement est une façon artificielle d'augmenter graduellement la probabilité que le comportement désiré se produise. (on renforce les ÉTAPES de la réponse. le critère augmente graduellement)

66

Comment faire un apprentissage de chaînes comportementales?

Faire apprendre graduellement en donnant des récompenses massivement

- Faire l’apprentissage des réponses indépendamment, en commencant par le dernier comportement dans la chaine
- Ajouter des liens à la chaine en ordre inverse (vers le premier comportement)
- Pour établir la chaine, chaque comportement est renforcé par la possibilité de faire la réponse suivante.

(relire notes de cours pour exemple et explications plus détaillés)