Bloc 8 Flashcards

0
Q

Qu’est-ce que le renforcement partiel?

A
  • Chaque réponse appropriée n’est pas nécessairement suivi d’un renforcement.
  • Caractéristiques: 90% d’efficacité.
  • Effets: Ralentissement de la courbe d’apprentissage, résistance à l’extinction.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Qu’est ce que le renforcement continu?

A
  • Chaque réponse appropriée est suivi d’un renforcement.
  • Caractéristiques: 100% efficace, rapide à apprendre mais facile à oublier.
  • Il n’y a pas d’effet de frustration, donc l’émotion n’est pas présente dans ce renforcement.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pourquoi l’extinction se fait plus difficilement avec le renforcement partiel plutôt que le renforcement continu?

A

Par le fait que d’autres facteurs psychologiques font effets dans l’apprentissage. Ex: motivations et émotions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les conséquences des motivations et des émotions dans le renforcement?

A

Motivation: variable importante pour le choix et les besoins

Émotion: parfois elle aide, parfois elle n’aide pas. La frustration est une émotion qui complique l’apprentissage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Expliquer le plan à ratio dans les renforcement simple.

A
  • Basé sur le nombre de réponses.
  • Les réponses de l’animal contrôle la conséquence
  • Aspect important: le nombre de réponse faites (pas la force, ni la probabilité)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Expliqué le plan à ratio fixe et le plan à ratio variable.

A
  • Plan à ratio fixe: Le nombre de réponse ne change pas. Ex: le rat peses toujours le même nombre de fois pour avoir de la nourriture.
  • Plan à ratio variable: le nombre de réponses est variable. (Peut avoir un effet de frustration) ex: le nombre de pesée requise du rat varie à chaque réponse.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Expliquer le plan à intervalle dans le renforcement simple.

A
  • Basé sur le délai depuis le dernier renforcement.
  • Une fois qu’il a une récompense, un délai est parti. Ex: 30 seconde, et ensuite le levier se reactive après cette variable de temps, l’animal identifiera le temps et saura quand répondre.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Expliqué le plan à intervalle fixe et le plan à intervalle variable.

A

Plan à intervalle fixe: toujours le même délai de temps entre les réponses.
Plan à intervalle variable: le délai de temps est variable entre les réponses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Expliquer les plans à ration fixe.

A
  • Ratio: l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives.
  • Fixe: le nombre de réponses nécessaires ne changent pas.
  • Exemple: le travail payé à l’unité profuite
  • Comportement observé: réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio élevés.
  • Caractéristiques: produit des réponses intenses et rapides, peut amener à vouloir consommer la récompense, se donner des pauses aux réponses (vacances)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Expliquer les plans à ratio variable.

A
  • Ratio: l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives.
  • Variable: le nombre de réponses nécessaires varie d’un renforcement à l’autre.
  • Exemple: une machine à sous
  • Comportement observé: effort élevé et constant.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Expliquer les plans à intervalle fixe.

A
  • Intervalle: le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alord suffisante
  • Fixe: la durée de l’intervalle ne change pas d’un renforcement à un autre.
  • Exemple: vérifier si le courrier est passé
  • Comportement observé: des réponses isolées et espacées dand le temps.
  • Résumé: lorsqu’on à eu une récompense, pendant une période de temps X, cette récompense ne sera plus disponible peu importe ce qu’on fait. (Période réfractaire) cette période sera toujours de la même longueur. Ex: le salaire aux deux semaines.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Expliquer les plans à intervalle variable.

A
  • Intervalle: le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante.
  • Variable: la durée de l’intervalle varie d’un renforcement à un autre.
  • Exemple: recomposer un numéro de téléphone occupé.
  • Comportement observé: rythme de réponses lent, mais constant
  • Résumé: Faire la réponse après un certain temps qui est variable. L’essai de réponse varie aussi selon le temps que le sujet est prêt à estimer.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Expliquer l’expérience de Hammond sur la contiguïté vs la contingence.

A
  • Phase 1: le rat presse des leviers et, à un certain moment, il y a une réponse. (Ratio variable) Le rat travail intensément.
  • Phase 2: la machine est programmé pour distribuer la même quantité de nourriture, même sans la réponse du sujet.
  • Phase 3: reviens à la phase 1
  • Phase 4: reviens à la phase 2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les hypothèses de l’expérience d’Hammond?

A

Le rat ajuste son comportement par rapport à son entourage et, une fois que c’est mis en place, les réponses se font instinctivement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la notion de renforçateur pour chaque chercheur?

A
  • Pavlov: “Les renforçateurs sont des SI qui sont pairés avec des SC”
  • Thorndike: “Les renforçateurs fournissent de la satisfaction et ceci établit des connections entre les stimuli”
  • Skinner: “Un renforçateur est tout stimulus qui augmente la réponse qui le précède”
  • Toutes les théories à date: le stimulus inconditionnel est renforçateur du stimulus conditionné. Tout stimulus qui augmente la réponse est un renforçateur. S’il la diminue, c’est un punisseur.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles déductions sont faites du principe de Premack et ses observations faites sur les cochons?

A
  • Ce qui est renforçant, c’est les préférences dans le comportement.
  • Les cochons, tel que les humains, ont des personnalités distinctes entre eux. (Ils ne sont pas renforcés par les mêmes comportements)
  • Pour renforcer un comportement, il faut contrôler l’environnement. Donc , l’environnement contrôle les renforcements.