Plans de renforcement Flashcards
cours 7 (44 cards)
Qu’est ce que le renforcement continu?
Lorsque chaque réponse est suivie d’une conséquence/renforcement
Qu’est ce que le renforcement partiel?
Lorsque la réponse n’est toujours renforcé
Quel renforcement fournit un meilleur apprentissage et pourquoi?
C’est le renforcement continu, à cause de la loi de l’effet (comportement est controlé par ses conséquences)
Quels sont les effets du renforcement partiel?
Ralentissement de la courbe d’apprentissage et la résistance à l’extinction (plus lent mais plus résistant)
Pour quel renforcement l’extinction est plus rapide?
Pour le renforcement continu
Pourquoi la résistance est présence
À cause de la frustration et la discrimination
Qu’est ce qu’un plan à ratio fixe (FR)?
Donner un exemple
C’est comme un renforcement continu, la réponse dépend du nombre de réponses répétitives
ex. travail payé à l’unité
Quel comportement est observé pour un FR?
Les réponses sont à haute fréquence mais elle sont suivie d’une pause “post-renforcement”, qui dépend du ratio
Qu’est ce qu’un plan à ratio variable (VR)?
Donner un exemple
Le nombre de réponse nécessaire varie pour chaque récompense
ex. travail à commission
Quel comportement est observé pour un VR?
Il y a un effort constant et élevé, les pauses sont courtes et moins fréquente
Qu’est ce qu’un plan à intervalle fixe (FI)?
Donner un exemple
L’individu doit effectuer une réponse après qu’un intervalle de temps spécifique se soit écoulé pour recevoir une récompense
ex. ouvrir le four pour regarder le gâteau qu’on cuit, en espérant que la cuisson soit terminer
Quel comportement est observé pour un FI?
Les réponses sont isolées et espacées dans le temps
Qu’est ce qu’un plan à intervalle variable (VI)?
Donner un exemple
L’individu doit effectuer une réponse après qu’un intervalle de temps (qui varie) se soit écoulé pour recevoir une récompense
ex. un photographe qui essaye de photographier des animaux dans la nature
Quel comportement est observé pour un VI?
Il y a un rythme de réponses lents mais assez constant
Qu’est ce qu’on apprend de l’expérience d’Hammond?
L’expérience illustre la façon dont les individus ajustent leurs comportements en fonction du lien perçu entre une action et une récompense. Si ce lien est faible ou absent, le comportement diminue
Qu’est ce qu’un renforçateur selon Pavlov?
Un renforçateur est un SI associées avec un SC
Qu’est ce qu’un renforçateur selon Thorndike?
Les renforçateurs fournissent de la satisfaction et ceux-ci établissent des connexions entre les stimuli
Qu’est ce qu’un renforçateur selon Skinner?
Un renforçateur est tout stimuli qui augmente la réponse qui le précède
Qu’est-ce que l’extinction?
Lorsqu’un comportement renforcer ne reçoit plus de renforcement (ça augmente la variabilité du comportement et la fréquence du comportement émotionnel comme l’agressivité)
Qu’est-ce que l’extinction burst?
C’est lorsque après l’extinction, le sujet a une augmentation brute du comportement
ex. parent qui ignore son enfant qui veut des bonbons –> enfant se met a crier
Qu’est-ce que la resurgence?
Lorsqu’un comportement appris dans le passé refait surface lorsque le comportement actuellement renforcé arrête d’être renforcé
Qu’est-ce que le spontaneous recovery?
Lorsque le comportement revient sans renforcement (la fréquence du comportement baisse mais il peut réapparaître à l’improviste)
Qu’est ce qu’un plan à durée fixe (FD)?
Donnez un exemple
Le comportement doit être effectué de façon continue sur une période de temps et le renforcement est donné à la fin de la durée
ex. enfant qui pratique le piano pendant 30mins et à la fin, sa mère lui donne un cookie pour le féliciter
Qu’est ce qu’un plan à durée variable (VD)?
Donnez un exemple
Le comportement doit être effectué de façon continue sur une période de temps qui varie et le renforcement est donné à n’importe qui moment
ex. enfant qui pratique le piano pendant 30/40/45min et à la fin, sa mère lui donne un cookie n’importe quand