cours 4 CO Flashcards

(69 cards)

1
Q

comment peut on aussi appelé le Conditionnement opérant

A

apprentissage instrumental

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

que vise le conditionnement opérant

A

vise à
contrôler le comportement (la réponse à un stimulus ou à des
stimuli) par ses conséquences, c’est-à-dire par ce qui suit le
comportement (la réponse) dans le temps.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

quest ce que le conditionnement opérant

A

Le comportement est suivi d’une conséquence de façon à en modifier son niveau opérant, soit augmenter ou diminuer sa fréquence d’apparition.

Il est possible de modifier le comportement d’un organisme en
utilisant des conséquences plaisantes (appétitives) ou
déplaisantes (aversives)

 L’apprentissage instrumental est une modification de la probabilité
de réapparition d’une réponse, modification entraînée par
l’apparition ou le retrait d’un événement particulier, le
renforçateur, de façon contingente à la réponse

On dit de l’apprentissage qu’il est instrumental, parce que l’effet
est obtenu à partir du comportement, soit l’instrument

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

pourquoi dit on que les superstitions sont construit du CO

A

résultent d’un renforcement ou d’une punition qui peut découler d’une simple coïncidence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

nomme des exemples de CO

A

la cage de thorndike
la boite de skinner

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

quest ce que la cage de Thorndike

A
  • Enfermer un chat affamé dans
    une cage (boîte à problème)
  • Placer de la nourriture à proximité
  • Observer les comportements du chat et le temps qu’il utilise
    pour trouver la solution et sortir de la cage
  • Ces observations permettent de comprendre comment s’opère l’apprentissage
  1. Apprentissage par essais et erreurs
  2. La solution est trouvée par hasard
  3. D’un essai à l’autre, diminution progressive des réactions inutiles
  4. En fin d’apprentissage, le chat ouvre immédiatement le loquet

Le temps utilisé pour trouver la solution diminue d’un essai à l’autre
Il obtient le même résultat (la même courbe d’apprentissage) d’un animal à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

comment nomme t-on le concept décrit par ceci: Les comportements sont acquis en fonction de leur effet dans
l’environnement

A

la loi des effets de Thorndike

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

quest ce que la loi des effets

A

 Un comportement qui produit une conséquence agréable ou qui
élimine ou prévient une conséquence désagréable aura tendance à se répéter.
 Un comportement qui produit une conséquence désagréable ou qui prévient (élimine) une conséquence agréable aura tendance à disparaître.

Éléments de base:
S:R –> C
Les comportements sont acquis en fonction de leur effet dans l’environnement

Pour Thorndike, l’apprentissage est un processus associatif caractérisé par la formation de connexions entre deux éléments en contiguïté spatiale :
- Ces connexions sont fixées, renforcées par la répétition (ou affaiblies si les essais sont supprimés)
- Ces connexions sont renforcées ou affaiblies par l’effet des conséquences (positive ou négative)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

quest ce qu’un renforcateur

A

c’est la conséquence
c’est un événement consécutif à une action et qui a pour effet de modifier, à la hausse ou à la baisse, la probabilité de réapparition de cette action.
- Le renforçateur peut être de nature appétitive ou aversive.

  • La relation de nécessité entre la réponse et la conséquence est appelée contingence. Le renforcement est un type particulier de contingence.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

quest ce que la contingence

A

Renvoie à la relation séquentielle de dépendance entre deux événements.
Dans le cas du CO, la contingence spécifie les conditions sous
lesquelles un comportement entraîne une conséquence donnée.

Association en contingence d’un comportement et d’un stimulus qui entraîne une modification du comportement.

Un comportement est suivi d’un événement.

4 types déterminés par la nature du stimulus-conséquence
(appétitif ou aversif) et par l’effet du comportement sur le stimulus-conséquence (apparition ou disparition du stimulus-conséquence)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

quels sont les types de contigence

A

récompense (renforcement positif) > ajouter effet positif

échappement / évitement (renforcement négatif) > retirer effet négatif

punition (punition positive) > ajouter effet négatif

omission (punition négative) > retirer effet positif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

quest ce que la punition

A

Opération qui consiste à ajouter ou retrancher un stimulus
comme conséquence à un comportement, tout en visant à
diminuer la probabilité que ce comportement apparaisse à
nouveau en des circonstances similaires

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

quest ce que le renforcement

A

vise à augmenter ou à maintenir élevée la
probabilité qu’un comportement apparaisse de nouveau en des
circonstances similaires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quest ce que le renforcement positif

A

Augmentation de la
probabilité de
réapparition du
comportement
en ajoutant un élément

le comportement est suivi de
l’apparition (addition) d’un stimulus appétitif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quest ce que le renforcement négatif

A

Augmentation de la
probabilité de
réapparition du
comportement
en enlevant un élément

le comportement est suivi de la disparition (soustraction) d’un stimulus aversif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

qu’est ce que la punition positive

A

Diminution de la
probabilité de
réapparition du
comportement en ajoutant un élément

le comportement est suivi de l’apparition
d’un stimulus aversif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

qu’est ce que la punition négative

A

Diminution de la
probabilité de
réapparition du
comportement
en enlevant un élément

le comportement est suivi de la disparition (soustraction) d’un stimulus appétitif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

quels sont les différents points de vue pour l’analyse des types d’apprentissages

A

les types d’entrainement
la nature de la contingence
les effets comportementaux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

quels sont les types d’entrainement pour l’analyse de l’apprentissage

A

récompense
échappement / évitement
punition
omission

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

quels sont les différentes nature de la contingence

A

Renforcement positif
Renforcement négatif
Punition positive
Punition négative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

quels sont les différents effets sur les comportements

A

Augmentation
Augmentation
Diminution
Diminution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

diapo 33

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

conditionnement opérant VS classique

A

Classique : la relation s’établit entre un SN et un SI. Le comportement du sujet n’a aucun effet sur l’apparition des stimuli.

Opérant : la relation s’établit entre une réponse et sa
conséquence. Le comportement détermine une conséquence, c’est-à-dire l’apparition ou la disparition du renforçateur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

quels sont les différentes situations d’apprentissage instrumental

A

Situations à essais discrets :
- Labyrinthes, boîtes d’évitement, etc.
- Le début et la fin des essais sont faciles à identifier. On peut les compter. Ce qui se passe entre les essais n’a pas d’importance.

Situations à essais continus :
- Situations opérantes libres (boîte de Skinner)
- Le début et la fin des essais ne sont pas clairement identifiés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
quest ce que le faconnement diapo 36 à 40
Cette procédure consiste à renforcer des approximations successives du comportement. À la toute fin, seul le comportement désiré sera renforcé. (Ex.: Enfant : entraînement à la continence). Le façonnement est généralement utilisé lorsque des réponses complexes doivent être apprises ou lorsque les réponses ne font pas partie du répertoire comportemental de l’organisme
26
27
28
quest ce que le stimulus discriminatif (SD)
contexte Dans une situation d’apprentissage instrumental, il peut y avoir d’autres stimuli que le stimulus renforçateur. Le stimulus discriminatif signale à l’animal une occasion de répondre. La réponse est déclenchée en présence d’un stimulus particulier. Le sujet discrimine, ou fait la différence, entre un stimulus et un autre
29
exemple de SD
Lorsqu’une lumière est allumée, un pigeon sera renforcé par de la nourriture lorsqu’il picore sur un disque. En circulation, les panneaux indicateurs sont des stimuli discriminatifs.
30
nomme des types de renfocateur
renforcateur primaire renforcateur secondaire
31
quest ce que le renforcateur primaire
Ne nécessite aucun entraînement préalable : - Les renforçateurs biologiquement importants : nourriture, eau, sexe, attention, approbation, décharge électrique Les renforçateurs sensoriels ont une valeur renforçante uniquement à cause de la simple stimulation des organes sensoriels  L’autostimulation cérébrale
32
quest ce que les renforçateurs secondaires
Stimulus qui entraîne une satisfaction n’ayant pas de valeur biologique intrinsèque - Les renforçateurs secondaires acquièrent des propriétés renforçantes à la suite de pairages successifs avec un renforçateur primaire: argent, biens matériels, économie de jetons. - Caractéristiques de renforçateurs secondaires ou conditionnés  La prévisibilité
33
quest ce que le principe de Premack
Une réponse à forte probabilité naturelle d’apparition peut renforcer une réponse dont la probabilité d’apparition est plus faible.
34
exemple du principe de Premack
Faire ses devoirs pour aller jouer avec ses amis - Réponse cible « faire ses devoirs » = faible probabilité d’apparition naturelle - Le renforçateur « jouer avec ses amis » est par contre un comportement dont la probabilité naturelle est très élevée - En rendant ce second comportement contingent au premier, les parents visent à augmenter la probabilité de la première réponse
35
fini la phrase: la valeur du renforçateur (appétitif et aversif) et la force du conditionnement sont reliées à ...
la quantité et la qualité plus grande est la récompense, plus fort sera le renforcement
36
quest ce que l'effet de contraste
La valeur d’un renforçateur n’est pas absolue. L’effet renforçant devient plus prononcé lorsque le renforçateur peut être comparé avec une autre quantité du renforçateur. Le comportement peut être amplifié ou diminué à la suite d'une telle comparaison. diapo 47
37
quest ce que la relation réponse- conséquence
- La contiguïté temporelle : Le délai de renforcement/punition : Un délai court permet généralement un meilleur apprentissage parce qu'il diminue la probabilité qu'il y ait interférence entre d'autres réponses et le renforçateur - La contingence réponse-conséquence : La contingence est aussi importante qu’en conditionnement classique. Tout le conditionnement instrumental repose sur la corrélation entre la réponse et la conséquence. Si aucune relation n’existe, il n’y aura aucun apprentissage. *L'absence de relation de contingence entre le comportement et ses conséquences produit le phénomène de résignation acquise (impuissance acquise).
38
quest ce que l'acquisition
L’acquisition peut mener à une modification du comportement à la hausse ou à la baisse, mais il s’agit d’apprendre une nouvelle contingence qui n’était pas en fonction auparavant.
39
quest ce que l'extinction
L’extinction consiste à cesser de renforcer une réponse. Il faut donc qu’il y ait eu établissement d’une contingence auparavant pour qu’il puisse y avoir extinction. L’extinction est susceptible d’être suivie d’une récupération spontanée.
40
quest ce que la récupération spontanée
L’extinction est susceptible d’être suivie d’une récupération spontanée. Récupération spontanée : réapparition d’une réponse éteinte, à la suite d’une période de repos consécutive à l’extinction.
41
quest ce que l'impuissance acquise
???????????????????
42
quest ce qui a donné naissance à l'impuissance acquise et explique le moi
Expérience avec les chiens et les rats - Décharges électriques occasionnelles sur le plancher de la cage - Apprentissage de l’animal : presser un levier pour empêcher les chocs ou changer de compartiment pour circuler librement - L’animal demeure donc fonctionnel
43
quest ce que le renforcement continu
Chaque fois que le comportement est adopté. Chaque réponse est renforcée ou punie. Plus rapide.
44
quest ce que le renforcement partiel ou intermmittent
Le comportement n’est pas renforcé chaque fois qu’il apparaît. Seulement un certain nombre de réponses sont renforcées ou punies. Plus « efficace » et plus résistant à l’extinction.
45
quels sont les façons de renforcer partiellement le comportement
programmes à intervalles fixes progr. à intervalles variables progr. à rapport fixe progr. à rapport variable
46
quest ce que le programme à intervalle fixe
Le renforcement survient après la première réponse émise après un intervalle de temps fixe.
47
quest ce que le programme à intervalle variable
le renforcement survient après la première réponse émise après un intervalle de temps moyen ex: contravention
48
quest ce que le programme à rapport fixe
Le renforcement survient après un nombre fixe de réponses carte fidélité
49
quest ce que le programme à rapport variable
Le renforcement survient après un nombre variable de réponses ex: casino
50
quels sont les programmes de renforcement simples
programme à durée (fixe et variable) programme de débit de réponse : - renforcement différentiel du débit rapide (RDDR) - renforcement différentiel du débit lent (RDDL) - renforcement différentiel de réponses rythmée (RDRR) programmes non contingents - programme à temps fixes - programme à temps variable
51
quest ce que le programme à durée fixe
renforcement si comportement exécuté en continu durant une période « X » prévisible et fixe  Ex. : pouvoir écouter la TV 1 h si 2 h d’études (DF2)
52
quest ce que le programme à durée variable
renforcement si comportement exécuté en continu durant une période imprévisible et variable  Ex. : donner un biscuit à des moments variés (pour une moyenne d’un biscuit aux 30 minutes) (DV30) à un jeune qui doit étudier
53
quest ce que le renforcement différentiel du débit rapide
fait partie du programme de débit de réponse renforcement est fonction d’un certain nombre de réponses durant un certain délai de temps.  Ex. : participant récompensé si 20 hot-dogs / 1 minute
54
quest ce que le renforcement différentiel du débit lent
fait parti du programme de débit de réponse durée de temps minimal nécessaire (débit lent)  Ex. : se brosser lentement les dents
55
quest ce que le renforcement différentiel de réponse rythmé
fait parti du programme de débit de réponse débit préétabli (ni trop vite ni trop lent)  Ex. : course à pied : renforcer un rythme moyen.
56
comment caractérisons les programmes non contingents
présence du renforçateur même si aucune réponse
57
quest ce que le programme à temps fixe
cest un programe non contingent renforçateur après une période « X » prévisible et fixe  Ex. : cadeau à Noël pour tous, peu importe si gentil (TF1)
58
quest ce que le programme à temps variable
programme non contingent renforçateur après une période « X » imprévisible et variable, peu importe le comportement du sujet  Ex. : rencontrer par hasard un ami d’enfance aux 3 mois
59
quels sont les programmes de renforcement complexes
programmes conjonctifs programmes ajustables programmes en chaine
60
comment caractérisons les programmes de renforcement complexes
 Combinaison d’au moins deux programmes simples
61
comment caractérisons le programme conjonctif
exigences d’au moins deux programmes simples avant la présentation d’un renforçateur.  Ex. : reçoit un salaire si nb h/sem. travail + réalisation tâches
62
quest ce que le programmeajustable
la réponse change en fonction de la performance du sujet.  Ex. : exigences plus grandes pour bon élève (avant renforcement si 80 %, maintenant renforcement si 85 %)
63
quest ce que le programme en chaine
2 programmes simples ayant un ordre de présentation. Chacun a son Sd et le dernier produit un renforçateur terminal.  Ex. : Prérequis > 49 % pour un 2e cours pour obtenir diplôme
64
pour etre efficace une punition doit être comment
une punition doit être intense, immédiate (contiguë) et contingente (survenir à chaque réponse). Une punition intense sensibilise les individus aux punitions subséquentes.
65
comment la punition peut devenir plus efficace encore
si utilisée conjointement avec le renforcement positif des autres comportements désirés.
66
que produit une punition intense
sensibilise les individus aux punitions subséquentes.
67
que produit des avertissement et des punitions peu sévères
habituent les organismes aux punitions subséquentes.
68
69