Cours 8- Behaviorisme IIb, le conditionnement opérant II Flashcards Preview

Motiv' et apprentissage (Marie) > Cours 8- Behaviorisme IIb, le conditionnement opérant II > Flashcards

Flashcards in Cours 8- Behaviorisme IIb, le conditionnement opérant II Deck (25):
1

Quand se produit l'extinction?

L’extinction se produit lorsque l’opérant n’est plus suivi par la conséquence qui lui était préalablement associée

2

Expliquez l'étude de WILLIAMS sur l'extinction (1959) ?

Un petit garçon de 21 mois a reçu 24 heures d’attention quand il était malade.
Une fois guéri, l’enfant a demandé le même niveau d’attention (le renforçateur).
• Nouveau régime de sommeil: Les parents ferment la porte et refusent de réagir aux pleurs et aux cris qui suivent.
• Résultats: Après 45 min, le garçon s’assoupit. Ensuite il s’assoupit en moins de 10 min. Après 6 mises au lit, le garçon ne crie plus du tout

3

Qu'est ce qu'un programme de renforcement continu?

Chaque réaction correcte est renforcée

4

Qu'est ce qu'un programme de renforcement intermittent?

(= renforcement partiel): Seules quelques–unes des réactions correctes sont renforcées.

5

Quel renforecement est plus efficace?

Le renforcement intermittent est généralement plus efficace en terme de maintien du comportement appris, et les comportements maintenus sous renforcement intermittent sont en général plus résistants à l’extinction.

6

Quels sont les deux types de programmes?

• Programme à proportion: Les récompenses sont liées au nombre de réponses émises (p.ex. une réaction correcte sur trois).
• Programme à intervalle: Les récompenses n’apparaissent qu’après un laps de temps (p.ex. une réaction correcte après 5 min.)

7

En ce qui concerne le temps, comment faire en sorte que le conditionnement soit le plus efficace?

Le conditionnement est le plus efficace si beaucoup de réactions avec peu de latence entre-temps sont produites.
Réactions cumulatives

8

Quelles sont les 4 sortes de programmes de renforcement?

Programmes à proportion fixe
Programme à proportion variable
Programme à intervalle fixe
Programme à intervalle variable
• Dans les programmes fixes et variables le même taux de renforcements est présenté, mais d’après des règles différentes
• On peut combiner les programmes, p.ex. commencer avec un programme de proportion fixe pour une acquisition rapide et continuer avec un programme à intervalle variable pour maintenir le comportement

9

Qu'est ce qu'un programme de renforcement à proportion fixe?

Ex: FR-5 (« fixed-ratio »): Chaque 5ème réaction est renforcée
Des réactions rapides, mais pas durables.

10

Qu'est ce qu'un programme de renforcement à proportion variable?

Ex: VR-5 (« variable-ratio»): En moyenne, chaque 5ème réaction est renforcée
Des réactions rapides et plus durables.

11

Qu'est ce qu'un programme de renforcement à intervalle fixe?

Ex: FI-5 (« fixed-interval»): La première réaction qui est exécutée après un délai de 5 min. est renforcée
Seulement des réactions à la fin de l’intervalle; peu durable

12

Qu'est ce qu'un programme de renforcement à intervalle variable?

VI-5 (« variable-interval»): Renforcements après des intervalles de temps variables, mais en moyenne toutes les 5 min.
Très efficace pour créer une performance constante et durable.

13

Qu'est ce qu'une contingence?

Une relation entre un comportement (R) et une conséquence (SR) dans une certaine situation

14

Quelle est une des concéquences des contingences d'après Skinner?

Le comportement superstitieux, un renforçateur (nourriture) était donné à des intervalles de temps réguliers, sans rapport avec le comportement que les pigeons produisaient; résultat: chaque pigeon développait sa propre réponse idiosyncrasique

15

Qu'est ce que les renforçateurs secondaires?

Des stimuli qui ont obtenu la qualité d’un renforçateur par association avec un renforçateur primaire qui satisfait directement un besoin:
- Exemple pour des renforçateurs primaires: Nourriture, douleur.
- Exemple pour un renforçateur secondaire: Argent, critique.

16

Qu'est ce que le « PREMACK principle »?

Les comportements peuvent fonctionner comme renforçateurs et punitions.Une application dans l’éducation

17

Quelle est la procédure selon l'auteur du Premack principle?

• On observe le comportement d’un individu et détermine la probabilité des actions qui sont exécutées spontanément.
• Les actions qui sont exécutées fréquemment peuvent fonctionner comme renforçateur et les actions qui sont exécutées très rarement peuvent fonctionner comme punition.
• Exemple renforcement positif: « D’abord tu joues au piano et puis tu peux regarder la télé »
• Exemple punition négative: « Si tu arrives trop tard à la table, il n’y a pas de dessert pour toi »

18

Comment se fait l'apprentissage des comportements complexes?

Discriminer des stimuli qui signalent renforcement vs. non-renforcement – stimuli discriminatifs (SD) -> S.C.+, S.C.- suite au conditionnement classique (association S-S).

19

Que fait un stimulus disciminatif?

Il signale la présence de contingences particulières de renforcement et punition  « stimulus contrôle ».

20

Qu'est ce que le « shaping »?

C'est une modification progressive d’un comportement spécifique pour produire une nouvelle réponse.
Utilisée dans le dressage, ex du tigre on produit un comportement nouveau en renforçant des comportements approximatifs de plus en plus proches de la réponse désirée.

21

Qu'est ce que la chaine ("chaining")?

La chaîne est la mise en place d’une séquence de réponses (nouvelles ou existantes) dans un ordre temporel

22

Quelle est la différence entre le conditionnement d'échapement et le conditionnement d'évitement?

Dans le conditionnment d'échappement la réponse apprise arrête le stimulus aversif pas comme dans le conditionnement d'évitement ou la réponse apprise prévient le stimuls aversif.

23

Qu'est ce que l'apprentissage à deux processus de MOWRER (1939)?

C'est une explication pour l’apprentissage d’évitement qui est un phénomène de l’apprentissage discriminatif: L’organisme apprend à réagir à un signal pour éviter des conséquences aversives.
En conséquence d’un conditionnement classique, un stimulus conditionné positif (S.C. +) signale qu’il y a une conséquence aversive (le stimulus inconditionné S.I.), ou un stimulus conditionné négatif (S.C. -) signale qu’il n’y a pas de conséquence.

24

Quels sont les deux processus de la théorie de MOWRER?

Les deux processus:
1. Le conditionnement classique (« sign learning »): Association d’un S.C. (p.ex. un son) avec un S.I. (p.ex. un choc électrique).
2. Le conditionnement instrumental (« solution learning »): Apprendre qu’un comportement spécifique va terminer une stimulation aversive (-> renforcement négatif).

25

En quoi les vécus émotionnels peuvent être des renforçateurs selon MOWRER (1960) ?

Généralisation de la théorie: Les émotions sont les guides primaires du comportement. Les émotions motivent le comportement.
Les vécus émotionnels conditionnés fonctionnent comme renforçateurs et punitions.
Des exemples:
- Si un S.C.- signale qu’il n’y a pas de récompense, c’est la déception qui réduit la probabilité du comportement instrumental (punition négative).
- Si un S.C.+ signale qu’on obtient une punition, c’est la peur, qui augmente la probabilité d’évitement (punition positive).
- Si un S.C.- signale qu’il n’y a pas de punition, c’est le soulagement, qui renforce l’évitement (renforcement négative).