Cours 7 Flashcards

1
Q

Caractéristiques d’un programme de renforcement :

A
  • La demande de réponse à satisfaire pour obtenir un renforcement
  • Ce qui doit être fait pour s’assurer d’obtenir un renforçateur
  • Ensemble de règles à suivre pour obtenir un renforçateur
    ○ P.ex., Le rat doit appuyer combien de fois sur le levier pour obtenir de la nourriture
    ○ Combien de temps dois-je attendre au McDo avant d’obtenir ma commande
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q
  • Différents programmes (demandes) vont produire différents effets sur le comportement,
    ces effets sont nommées :
A

effets de programme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’un programme de renforcement continu :

A
  • Programme où chaque réponse est renforcée
    ○ P.ex., Chaque fois que le rat appuie sur le levier le choc cesse
    ○ Chaque fois que je vous pose une question, vous répondez
  • Très efficace
    ○ Facile à comprendre
    ○ Donc utile lorsque l’on veut faire apprendre quelque chose à quelqu’un ou amener quelqu’un à faire quelque chose
    □ P.ex., Ma mère s’empressait de souligner qu’elle appréciait que j’avais appeler pour dire que je ne rentrerais pas à chaque fois que je le faisais.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’un programme de renforcement intermittent :

A
  • Aussi appelé partiel
  • Programme où seules certaines réponses sont renforcées
    ○ P.ex., Le rat doit appuyer trois fois sur le levier afin d’obtenir de l’eau
    ○ Tu dois faire 20 push-ups pour avoir le droit d’aller prendre de l’eau
  • Le plus courant dans la vie
    ○ L’environnement renforce rarement tous nos comportements
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  • 4 types de programmes intermittents de base, c’est quoi ?
A
  1. Programme à proportion
  2. Programme à proportion variable
  3. Programme à intervalle fixe
  4. Programme à intervalle variable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qui suis-je ? Programme ou le renforcement est fonction d’un nombre de réponses PRÉVISIBLE et FIXE

A

Programme à proportion fixe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment est noté le programme à proportion fixe :

A
  • Notés PFXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
    ○ En lien avec les exemples plus haut on a: PF3, PF200, PF3
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Le programme à proportion fixe engendre habituellement quoi ?

A

○ Un débit de réponse rapide
○ Une courte pause après l’obtention de chaque renforçateur
□ Nommée pause après renforcement

○ Le retour rapide des réponses après la pause
□ p.ex., Singe avec un programme PF12 dans lequel il doit allumer un interrupteur 12 fois avant d’obtenir un fruit, fera rapidement les 12 actions, recevra le fruit puis va se mettre à se gratter, avant de recommencer la séquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dans un programme à proportion fixe, après une pause de renforcement, le retour des réponses (l’amorce) peut parfois être…

A

plus long

○ P.ex., Lorsque que vous peinturez votre appartement. On va prendre une petite bière après avoir fait 4 murs. 4 murs, une petite bière….une deuxième….on va défaire une boîte….une troisième….

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Une fois que l’on amorcé le programme à proportion fixe, les réponses/compt se font….

A

rapidement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dans nos comportements de tous les jours, bien qu’ils soient renforcés, on doit souvent trouver des trucs pour favoriser l’amorce, comme :

A

Commencer par quelque chose de facile
PAS COMMENCER par le découpage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dans un programme à proportion fixe, il y a habituellement une relation ___ entre la taille de la proportion et la ____ ?

A
  • Il y a habituellement une relation positive entre la taille de la proportion et la durée de la pause
    ○ Pause pour PF25 < pause pour PF100
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Programme à proportion fixe
* On considère un programme à bas ratio où le renforçateur est facile à obtenir comme _____
* On considère un programme à haut ratio où le renforçateur est difficile à obtenir comme ____

A

DENSE ou RICHE

FRUGAL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ratio =

A

nb de comportements/renforçateur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Problème d’un programme à proportion fixe ?

A
  • Problème: programme DENSE souvent très couteux alors on va souvent essayer de passer à des programmes plus frugaux
  • Le fait de passer d’un programme DENSE à un programme FRUGAL se nomme l’étirement de la proportion
    ○ P.ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter À chaque 3 fois
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

L’étirement de la proportion engendre parfois :

A

une dégradation dans le comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Tension du ratio:

A

perturbation de la réponse causée par une demande trop exigeante
○ .ex., Féliciter Charlie d’avoir rangé ses livres à chaque fois qu’il le fait vers le féliciter
□ À chaque 100 fois
□ Entrer au Doctorat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qu’est-ce qu’un programme à proportion variable ?

A
  • Programme où le renforcement est fonction d’un nombre de réponses IMPRÉVISIBLE et VARIÉ
    ○ P.ex., Un pigeon doit donner EN MOYENNE 3 coups de bec sur le disque rouge pour faire en sorte d’obtenir un morceau de fruit
    ○ Votre conjoint(e) doit dire EN MOYENNE 10 fois votre nom avant que vous ne réagissiez lorsque vous êtes en train de regarder une émission
    ○ La plupart des sports ou des jeu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment est noté un programme à proportion variable ?

A
  • Notés PVXX en fonction du nombre de réponses qui doivent être effectuées pour obtenir le renforçateur
    ○ En lien avec les exemples plus haut on a: PV3, PV10
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

programme à proportion variable engendre habituellement :

A

○ Un débit de réponse rapide et stable
○ Peu de pause après l’obtention de chaque renforçateur
○ Peut aller à aucune pause si le nombre minimum de réponses est très bas
□ p.ex.,PV10 avec renforçateur après 1 à 20 réponses avec moyenne de 10
□ Le sujet sait que même après une seule réponse il pourrait peut-être obtenir le renforçateur alors il est « tenté » de ne jamais arrêter de faire le comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Quel type de programme peut engendrer des comportements mal adaptés ?

A

Programme à proportion variable
○ P.ex., Jeu compulsif
○ LA crise de bacon qui marche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Programme où le renforcement est fonction de la première réponse produite après une période de temps PRÉVISIBLE et FIXE (qui suis-je ?)

A
  1. Programme à intervalle fixe

○ P.ex., Un singe doit attendre 30 secondes avant de tirer sur une corde pour libérer de la nourriture

  • Notés IFXX en fonction du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
    ○ En lien avec les exemples plus haut on a: IF30 sec, IF5 jours
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Le programme à intervalle fixe engendre habituellement un mode de réponse ____

A

○ un mode de réponse ondulatoire
Courbe orientée vers le haut

○ Pause après l’obtention du renforçateur
○ Après la pause, débit de réponse de plus en plus rapide à mesure que l’intervalle s’écoule
P.ex. Lors d’une date, regarder de plus en plus sa montre (ou son téléphone) avant l’heure prévue de la personne

24
Q

Caractéristique d’un programme à intervalle variable ?

A
  • Programme où le renforcement est fonction de la première réponse produite après une période de temps IMPRÉVISIBLE et VARIÉE
    ○ P.ex., Un singe doit attendre en MOYENNE 30 secondes avant de tirer sur une corde pour libérer de la nourriture
  • Notés IVXX du temps qui doit s’écouler avant que le comportement puisse donner accès au renforçateur
    ○ En lien avec les exemples : IV30 secondes
  • Le programme est fonction d’une moyenne donc on peut avoir un IV10
25
Q

Un programme à intervalle variable engendre habituellement :

A

○ un débit de réponse stable et modéré
○ Peu de pause après l’obtention de chaque renforçateur
○ Peut aller à aucune pause si l’intervalle minimum est très court

□ p.ex.,IV10 avec renforçateur après 1 à 20 secondes avec moyenne de 10
□ Le sujet sait que répondre même après un temps très court pourrait peut-être lui permettre d’obtenir le renforçateur alors il est « tenté » de ne jamais arrêter de faire le comportement
® Il y aura donc plus de chances d’avoir des pauses (et des pauses plus grandes) avec IV10 avec renforçateur après 8 à 12 secondes

26
Q

Résumé des programmes à proportion ?

A

○ Débit plus rapide car renforçateurs dépendent entièrement du nombre de réponses produites
□ Pour augmenter le nb de renforçateurs, on augment le nombre de nos réponses
□ P.ex., efficacité de donner des bonus à la performance ($ par vente

27
Q

Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement étalé tout au long D’UNE CERTAINE PÉRIODE DE TEMPS FIXE (qui suis-je ?)

A

Programmes à durée fixe

  • Notés DFXX en fonction du nombre de temps que doit être exécuté le comportement pour obtenir le renforçateur
28
Q

Programmes pour lesquels le renforcement est fonction de l’exécution d’un comportement en continu pendant une période de temps IMPRÉVISIBLE ET VARIÉE (qui suis-je ?)

A

Programmes à durée variable:

○ P.ex., Un rat doit courir dans une roue pendant en MOYENNE 10 secondes avant d’obtenir de la nourriture
○ On doit garder une position de yoga pendant en MOYENNE 2 minutes avant de passer à l’autre

  • Notés DVXX en fonction du nombre de temps moyen que doit être exécuter le comportement pour obtenir le renforçateur
29
Q

Programmes à durée fixe et variable:

  • Comparés aux autres programmes simples vus, ils sont habituellement plus _____ dans leur capacité à faire produire des ____
    ○ Plus de place à ___ de ce qui doit être fait
A

imprécis
comportements
l’interprétation

30
Q

Programmes à débit de réponse, c’est quoi ?

A
  • Programmes pour lesquels le renforcement est fonction du débit de réponse
    Importance de l’aspect différentiel:
    ○ Un seul type de réponse est renforcé alors qu’un autre type ne l’est pas
31
Q
  1. A) Programmes de renforcement différentiel du débit rapide (RDDR), c’est quoi ?
A
  • Programme pour lequel le renforcement est fonction de la production d’au MOINS un certain nombre de réponses en une certaine période de temps
    ○ Plus généralement, seulement si le débit est assez rapide (aspect différentiel car tout débit plus lent n’est PAS renforcé)
    ○ P.ex., Un pigeon qui doit appuyer au moins 10 fois en 1 minute afin de mettre fin à une stimulation douloureuse
32
Q

Programmes de renforcement différentiel du débit lent (RDDL), c’est quoi ?

A
  • Programme pour lequel le renforcement est fonction de la production d’au PLUS un certain nombre de réponses en une certaine période de temps
    ○ Plus généralement, seulement si le débit est assez lent (aspect différentiel car tout débit plus rapide n’est PAS renforcé)
    ○ P.ex., Un pigeon qui doit appuyer au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse. Ou attendre au moins 5 secondes entre chaque coup de bec
33
Q

Différence du RDDL avec le programme à intervalle fixe?

A

○ Dans IF, les comportements faits dans l’intervalle n’ont pas de conséquence

○ Dans le RDDL, tout comportement de trop fait dans l’intervalle élimine la chance d’obtenir le renforçateur (on doit recommencer l’intervalle)

34
Q

Programmes de renforcement différentiel de réponses rythmées (RDRR), c’est quoi ?

A
  • Programme pour lequel le renforcement est fonction d’une suite de réponses selon un débit préétabli
    ○ Plus généralement, seulement si le débit n’est NI TROP LENT, NI TROP RAPIDE (aspect différentiel car tout débit plus rapide ou plus lent n’est PAS renforcé)
    P.ex., Un pigeon qui doit appuyer au minimum 5 fois et au maximum 10 fois en 1 minute s’il veut mettre fin à une stimulation douloureuse
35
Q

Programmes pour lesquels le renforcement apparaît indépendamment de toute réponse, qui suis-je ?

A

Programmes non contingents

Aucune réponse n’est nécessaire pour obtenir le renforçateur
* Aussi nommés programmes indépendants de la réponse

36
Q

Programme à temps fixe, c’est quoi ?

A
  • Programme pour lequel le renforcement apparaît après une période de temps PRÉVISIBLE et FIXE, peu importe le comportement du sujet
    ○ P.ex., Un poisson va recevoir de la nourriture toutes les 60 secondes
    ○ Cadeaux reçus à chaque année à son anniversaire
  • Noté TFXX en fonction du nombre de temps entre les renforçateurs
37
Q

Programme pour lequel le renforcement apparaît après une période de temps IMPRÉVISIBLE et VARIÉE, peu importe le comportement du sujet, qui suis-je ?
Noté comment ?

A

Programme à temps variable:
○ P.ex., Un poisson va recevoir de la nourriture en MOYENNE toutes les 60 secondes
○ Les journées ensoleillées de novembre

  • Noté TVXX en fonction du nombre de temps moyen entre les renforçateurs
    ○ En lien avec les exemples plus haut on a: TV60 secondes, TVjamais
38
Q

Programmes non contigents ont un rôle dans quoi ?

A
  • Rôle dans l’apparition et le maintien de comportement superstitieux
    ○ P.ex., Pigeons (Skinner, 1948)
    ○ Étudiants qui peuvent obtenir des points (Ono, 1987)
    ○ Athlètes, parieurs
39
Q

Les comportements superstitieux apparaissent souvent chez les ____ dans des contextes ___
Ce sont des contextes _____
Tendance innée à être intolérant à____ et à essayer de prévoir ou de ____ l’incertitude

A

humains
TVXX
imprévisibles
l’incertitude
contrôler

40
Q

Si un programme non contingent est ajouté à un programme contingent, que ce passe-t’il ?

A

Le débit de réponse est habituellement ralenti

41
Q

Qu’est-ce qu’un programme complexe ?

A

Une combinaison d’au moins deux programmes simples

42
Q

Qu’est-ce qu’un programme conjonctif ?

A

Un programme complexe dans lequel les exigences à au moins deux programmes simples doivent être satisfaites avant de recevoir le renforçateur

P.ex., Un rat qui doit courir dans une roue pendant 2 minutes (DF2 minutes) et appuyer en moyenne 10 fois sur un levier (PV10) pour obtenir de la nourriture

43
Q

Qui suis-je ? Programme ou la demande de réponse change en fonction de la performance du sujet pendant qu’il répond au renforçateur précédent.

A
  • Programme ajustable

○ P.ex., Rat qui doit appuyer 10 fois sur un levier avant d’obtenir de la nourriture (PF10) puis qui doit appuyer 20 fois dans l’essai suivant (PF20)

  • Très utile pour façonner exactement le comportement que l’on veut
    ○ On ajuste les critères pour les rendre le plus semblables à ce que l’on désire
44
Q

Qu’est-ce qu’un programme en chaîne ? En quoi il diffère du programme conjonctif ?

A
  • Programme qui consiste en une SUITE d’au moins deux programmes simples où chacun a son propre SD et dont le dernier produit un renforçateur terminal
  • Diffère du programme conjonctif car les programmes doivent être complétés dans UN ORDRE PRÉCIS
45
Q
  • Dans ce type de programmes, les réponses aux premiers maillons ont tendance à être plus faibles que celles reliées au maillons plus près du renforçateur terminal.
    Quelles sont les causes ?
A

programme en chaîne

○ Renforcement immédiat plus efficace que renforcement différé
○ Plus il y a d’étapes entre les représentations des renforçateurs, moins le lien est fort
○ Principe général de l’effet du gradient
□ Hausse de la force ou de l’efficacité de la réponse à mesure que l’on s’approche de l’objectif

46
Q

Pour établir un programme en chaîne on peut utiliser l’enchaînement à rebours, c’est quoi ?

A

○ Établir un programme en chaîne en débutant par le maillon terminal et et finissant par le maillon initial

47
Q

Quelle est la théorie proposée par Clark Hull par rapport au renforcement ?

A
  • Un événement est renforçant dans la mesure où il se trouve associé à la réduction d’une pulsion physiologique
  • Cette pulsion pousse l’animal à agir afin de diminuer cette pulsion (motivation)
  • Si la pulsion diminue, les comportements qui ont précédé cette diminution seront automatiquement renforcés
48
Q
  • Selon la théorie de la réduction des pulsions, tous les ____ peuvent être reliés directement ou_____ au besoin de réduire une_____
A

renforçateurs
indirectement
pulsion physiologique

49
Q

V/F : certains comportements semblent n’être associés à aucun type de réduction des pulsions ?

A

VRAI
* Ou le lien entre le comportement et le besoin physiologique est très mince
○ P.ex., aller voir une pièce de théâtre-parce que ça me donne un sujet de conversation pour un rdv galant-ça me permet d’avoir une excuse pour manger chez Joe Beef-réduire ses pulsions de faim

50
Q

motivation incitatrice, c’est quoi ?

A

motivation issue d’une certaine propriété du renforçateur

51
Q
  • Nos comportements sont beaucoup mieux expliqués si on tient compte des _____ que si on n’utilise que la _____
A

motivations incitatrices
réduction des pulsions

52
Q
  • Un comportement très probable peut servir à renforcer un comportement ____
    Pour comprendre le principe de Premack on doit concevoir qu’un ____ peut être envisagé comme un ____ plutôt que comme un____
A

peu probable
renforçateur
comportement
stimulus

53
Q

Deux catégories de comportement (très probable ou peu)

A

○ Comportements très probables (CTP): dans l’état actuel, l’animal a une forte probabilité de produire ce comportement
□ P.ex., si j’ai faim, manger est un CTP
○ Comportements peu probables (CPP): dans l’état actuel, l’animal a une faible probabilité de produire ce comportement
□ P.ex., si j’arrive du buffet des continents, manger est un CPP

54
Q

Un comportement peut servir de renforçateur à deux conditions

A
  • L’accès à ce comportement est restreint
  • Sa fréquence se situe sous son niveau préférentiel
55
Q

Niveau préférentiel=

A

niveau de référence lorsque le sujet peut librement faire ce comportement

P.ex., Charlie écouterait Ninjago the movie 24h par jour. Si on lui permet seulement d’en écouter 1h = état de déprivation car en dessous de son niveau préférentiel

56
Q
  • Dans un état de déprivation, les comportements qui permettent de nous rapprocher de notre niveau préférentiel seront _____

Dans un état de déprivation, si on ne fait pas les comportements, notre niveau restera ____

A

renforcés
sous le niveau préférentiel

**Contrairement au principe de Premack, pas besoin de connaître les fréquences relatives des deux comportements (CTP ou CPP) seul compte le fait que le comportement que l’on veut utiliser comme renforçateur est sous son niveau préférentiel

57
Q

Un sujet ayant librement accès à de multiples activités va répartir son comportement de façon à maximiser le ____
La durée de chaque activité représente leur____ (le point de satiété comportemental)

A

renforcement global

renforcement optimal