Final Flashcards

(92 cards)

1
Q

Quelle loi est à l’origine du conditionnement opérant , expliquez.

A

La loi de l’effet. La 1e à postuler que le comportement se renforce ou s’affaiblit suivant ses conséquences

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un essai discret

A

Une condition expérimentale qui a un début et une fin identifiable. Plus efficace, mais requiert une plus grande implication du chercheur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une situation opérante libre

A

il n’y a pas d’essaie particulier, la réponse est disponible en tout temps mais pour une période déterminée d’avance, plus réaliste que l’essai discret. Le comportement cible ne met pas fin à l’essaie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les contributions de skinner

A

La boîte de skinner
la standardisation des méthodes
L’efficacité (plancher grillage)
Ordinateur pour automatisation

Le vocabulaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Expliquer la terminologie du paradigme instrumentale

Sd -> R -> Sr

A

Sd = Stimuli discriminatif
R= réponse
Sr= Stimuli de renforcement

Situation de stimulation , une réponse est suivi d’un stimulus renforçant. (conséquence)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Est-ce que le paradigme S-S peut être appliqué au conditionnement instrumental

A

Non, car la réponse est apprise dans le conditionnement instrumentale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Est-ce que la curiosité existe dans le modèle instrumentale

A

Non, la pathologie non plus. La réponse sert à obtenir la récompense elle est instrumentale. Mais elle est volontaire, ce n’est pas un réflexe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les similitudes du l’apprentissage instrumentale avec le conditionnement classique

A

Loi de la pratique
Loi de l’intensité des stimuli
Blocage et masquage
Extinction + récupération spontanée
Contiguïté
Contingence
Généralisation et discrimination

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce qui différencie le conditionnement classique du conditionnement opérant

A

La RC est automatique et prépare pour la RI.

Dans le conditionnement instrumentale la réponse est apprise et émise, elle nous amène à Sr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce qu’un renforcement

A

Toute situation Sd - R - C dans laquelle l’effet de C sur R est d’augmenter la probabilité de R

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qu’une punition

A

Situation Sd - R - C dans laquelle C sur R diminue la probabilité de R,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

3 caractéristique d’une expérience pour qu’elle soit considérée comme un renforcement

A
  1. le comportement doit avoir une conséquence
  2. Le comportement doit augmenter en force (plus de répétition)
  3. L’augmentation de la force doit venir de la conséquence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qu’une punition positif

A

Situation Sd- R - C pour laquelle la conséquence est l’apparition d’un stimuli aversif qui diminuera la probabilité de fréquence d’un comportement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Est-ce que le renforcement positif aide la motivation intrinsèque

A

Non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que le apprentissage par récompense

A

Le renforcement positif.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Est-ce que le renforcement négatif a un impact sur la motivation intrinsèque

A

Non

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que l’apprentissage de l’évitement

A

Un renforcement négatif (on enlève un sentiment désagréable telle l’anxiété en évitant une situation)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les effets nocifs de la punition positive

A

Agressivité passive (bouderie, procrastination)

Intensification de l’agressivité chez le punisseur (le punisseur est renforcé d’avoir punit et le punit est renforcer d’avoir arrêter les comportements)

Apprentissage de l’agressivité par le puni

Comportement d’évitement de la punition

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Les effets de renforcement

A

Augmentation force (probabilité ou fréquence)

Tendance d’un comportement à persister malgré disparition du renforcement

Tendance à se produire malgré un conséquence aversive

Tendance à persister malgré un effort supplémentaire requis

Tendance à persister malgré la disponibilité de renforçateur pour d’autre comportements

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est-ce que l’inertie comportementale

A

La tendance d’un individu à maintenir un comportement actuel, même en présence d’Autres renforçateur pour d’autre comportements. Le comportement renforcé plusieurs fois est plus propice à persister malgré les obstacles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce que le façonnement

A

Le renforcement d’approximation d’un comportement pour mener plus rapidement au comportement souhaité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comment faire du façonnement

A

Débuter avec un critère large , renforcer successivement, augmenter graduellement le critère.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quest-ce qu’un renforcement primaire

A

Ne dépend d’expériences d’apprentissage, ils sont innés phylogénétiques. Nourriture, eau, sommeil, sexe, stimulation électrique du cerveau, chaud, froid, contact social.

Certains renforçateurs primaires peuvent perdre de leur efficacité, le pouvoir de renforcement se perd graduellement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Qu’est-ce qu’un renforçateur secondaire

A

Pas innés, résultent de l’apprentissage. Acquiert leur force par le biais d’association avec d’autres stimuli. Ses propriétés renforçatrice viennent de avec quoi il est paré.
Raconnaissance , applaudissement,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Est-ce que les renforcements secondaires sont plus facile à arriver à satiation
Non, ils arrivent à satiation moins rapidement que les renforçateurs primaires, mais leur efficacité dépends de la force d'association avec le primaire
26
Est-ce que les renforcements secondaires sont plus flexible
Oui, car les renforçateur primaire dépendent du besoin. Si le rat n'a pas faim ne pourra pas faire un comportement tandis que si associé avec un clicker ou une lumière, fera le comportement
27
Qu'est-ce qu'un renforcement généralisé
Un renforcement secondaire qui a été associé à plusieurs renforcement spécifique, qui va renforcer un large éventail de comportements (Argent)
28
Qu'est-ce qu'un renforcement naturel
Suit naturellement un comportement, pédaler sur un vélo, brosse ses dents (bonne haleine)
29
Qu'est-ce qu'un renforcement artificiel
Quelque le donne dans le but de modifier un comportement
29
Des quoi dépendent les effets de renforcements
La contingence (degré de corrélation entre le comportement et sa conséquence) La contiguité (délais entre comportement et réponse) Le renforcement différé signalé marche mieux que le renforcement différé seul Caractéristiques des renforcements (la magnitude, différence qualitative) Caractéristiques des comportements (affecte la facilité avec lequel peut être renforcé)
29
Comment on fait l'apprentissage d'une chaîne de comportements
Commencer par la dernière étape et à chaque étape l'étape précédente renforcée doit être visible. En ordre inverse. Peu de validité écologique
30
Quels sont les deux type d'opération de motivation
Opération motivantes établissantes (augmente l'efficacité de la conséquence, la valeur d'un renforçateur : privation de nourriture) Opération motivation abolissantes. diminue l'efficacité de la conséquence : drogues réduisent efficacité de la nourriture.
31
Qu'est-ce que des contingence concurrentes
Plusieurs contingences (relations entre conséquences et comportements) en même temps. ces contingences peuvent être en concurrence les unes avec les autres )
32
Toute punition est une agression
Vrai
33
Qu'est-ce que le renforcement continu
Chaque réponse est suivit d'une renforcement. Augmentation rapide du débit de réponse. Très rare dans l'environnement naturel
34
Qu'est-ce que le Renforcement partiel
Chaque réponse n'est pas nécessairement suivi d'un renforcement
35
Quels sont les effets du renforcement partiel
Ralentissement de la courbe d'apprentissage Résistance à l'extinction (changement moins facilement détectable) Apprend la persistance car la 1. discrimination est difficile : contraste moins clairs ambiguïté de contingence Incertitude quant à l'obtention peut mener à + de persistance. 2. La frustration : primitivisassion des comportements, réponse instinctive, névrose expérimentale quand la tache est trop complexe. Dans un plan de renforcement partiel l'animal est habitué à la frustration qui est éventuellement renforcé. La frustration est un indication qu'un renforcement viendra
36
Qu'est-ce qu'un plan à ratio fixe
Un nbr déterminé de réponse = renforcement FR 3:1 FR 2:1 FR 1:1 = renforcement continu
37
Qu'est-ce qu'une pause post-renforcement et dans quel type de plan de renforcement
Une pause suivant l'obtention des renforcements ( fatigue ou consommation) La longueur de la pause dépend du ratio, peut faire d'autres comportements renforçants pendant la pause (se laver, aller au toilettes) Plan à ratio fixe et plan à ratio variable.
38
Qu'est-ce qu'un plan à ratio variable
Le nombre de réponse varie d'un renforcement à l'autre, peut arriver entre tant et tant de réponse mais varie autour d'une moyenne Effort élevé et constant, pause post-renforcement moins fréquente + courte. Dépendance (machine à sous)
39
Qu'est-ce qu'un plan à intervalle fixe
L'intervalle est une période réfractaire dans laquelle le renforcement n'est pas disponible déclenchée par la 1e réponse. Une seule réponse est nécessaire après l'intervalle. La durée de l'intervalle ne change pas. Effort élevé à la fin de l'intervalle, réponse isolées et espacées dans le temps (scalloped graph)
40
PLan à intervalle variable
La longueur de l'intervalle varie autour d'une moyenne mais change d'un renforcement à l'autre. Rythme de réponse lent mais constant,, quand la récompense n'est pas un besoin urgent les réponses sont plus lentes. Le niveau de désir régule le rythme de la réponse
41
Dans quel type de plan de renforcement voit on une réponse à haute fréquence et suivi d'une pause post-renforcement?
Plan à ratio fixe
42
Dans quel type de plan voit ont un effort élevé constant et peu de pause post-renforcement
PLan à ratio variable
43
Dans quel type de plan voit-on un effort élevé à la fin d'une période et des réponses isolées et espacées dans le temps
Plan à intervalle fixe
44
Dans quel type de plan voit on un rythme de réponse lent et constant, linéaire et stable.
Plan à intervalle variable
45
Dans quel type de plan le niveau de désir régule le rythme de la réponse
PLan à intervalles variables
46
Qu'est-ce que le façonnement permet de faire
Rendre un comportement peu probable, probable en quelques minutes
47
Est-ce que Thorndike connaissait le façonnement
Non , boite de thorndike = essaie erreur (essaie discret)
48
Est-ce que le façonnement peut se produire dans l'environnement naturel ?
Oui, éducation des enfants. Certains comportement sont plus adaptés à l'environnement et ce dernier les sélectionnera et d'autres s'éteindront. C'Est le moyen par lequel de vieux comportement en forment des nouveaux
49
Comment bien façonner un comportement
Renforcer le plus petits pas et donner des renforcements immédiats. Renforcer la meilleure approximation disponible. Être prêt à descendre le standard des fois (step back)
50
Quels sont les deux formes de chaînes d'apprentissage
Forward and backward
51
Est-ce que les chaînes d'apprentissage sont dans l'environnement naturel
Oui, forme la plupart des routines établies
52
Qu'est-ce que l'augmentation de la fréquence de la réponse immédiatement après l'arrêt du renforcement
Un pic d'extinction
53
Qu'est-ce qu'un plan à ratio fixe qui nécessite un nombre infini de réponse ?
Extinction en situation opérante libre
54
Que pourra-t-on observer si on cesse les renforcements suite à une réponse au préalable renforcées. Nommez des comportements
L'extinction. - Augmentation de la variabilité du comportement -Augmentation de L'agressivité - Résurgence d'autres comportements auparavant renforcés - Récupération spontanée (plus il y a de temps entre deux sessions d'extinction)
55
De quoi dépend l'extinction
Combien de fois le comportement a été renforcé Effort que prend le comportement Le type et la taille du renforcement Le plan de renforcement
56
Est-ce que le renforcement est plus puissant que l'extinction
oui, plus de réponse non-renforcées que de réponses renforcées nécessaire. Pas 1:1.
57
Est-ce que l'apprentissage est plus rapide que l'extinction
Oui
58
Qu'est-ce qu'un plan progressif
À chaque réponse le requirent augmente d'un façon prédéterminée. Arithmétique = ajouter des nombre géométrique = multiplier
59
Qu'est qu'un plan de renforcement complexe
Plusieurs plans simples mis ensemble. Multiple, mixte, en chaîne, tandem, coopératif, simultané
60
Qu'est-ce que la tension de ratio
La tendance à performer va diminuer si le ratio est étiré trop brusquement. Les plans de ratio progressif en produisent inévitablement et atteignent un point de cassure
61
Qu'est-ce que stretching the ratio
Un plan continu (FR 1:1) puis on étire progressivement le ratio FR3 , FR5. Entraînement à travailler beaucoup pour peu (rajout progressif de reponsabilité) C'est le façonnement de la persistance. Peut fonctionner avec plans intervalles, durées temps. Stretching de la contingence
62
Qu'est-ce que la loi de la concordance
La proportion de réponses d'un individu à une option particulière correspond à la proportion de renforcements qu'il reçoit de cette option par rapport à l'ensemble des renforcements disponibles. Si le rat a le choix entre deux plans de renforcement il va alterner entre les deux. Tous les comportements sont une fonction de leurs conséquences.
63
Quel est l'expérience et l'hypothèss de Tinklepaugh
Les organismes apprennent à attendre des renforçateurs particuliers. Les singes qui s'attendent à des bananes sont déçus d'Avoir de la salade. Explique les attentes, les stimuli (Sd) décide des attente que nous avons envers la conséquence
64
Expliquer l'expérience d'Hammond et ses phases
Design ABAB Tous les rats apprennent à utiliser la boîte et niveau de base. 1. On récompense 5% des réponse (taux de réponse élevé) 3000 pression/ heure 2.Récompense 5% des réponses et 5% des non-réponses Taux de réponse diminue graduellement presque 0. 3-4 : répétition 1 et 2 Les rats changent de réponse en fonction de la situation, ne passe pas par l'extinction . On peut apprendre de deux façon pas besoin d'éteindre le comportement, car une seule contingence est dispo comme disait Rescorla
65
Qu'est-ce qu'un renforçateur pour pavlov
Un SI sont associés avec des SC. L'effet de prédiction, un attente ( Contingence et contiguïté) = apprentissage
66
Qu'est-ce qu'un renforçateur pour Thorndike
les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli La loi de l'effet est ce qui permet l'apprentissage. Dépend de ses conséquences
67
QU'est-ce qu'un renforçateur pour Skinner
“un renforçateur est tout stimulus qui augmente la réponse qui le précède”. Il pense que la conséquence fait par elle-même apprendre, la prédiction n'existe pas. On pourrait apprendre sans contingence selon lui.
68
Qui est Clark Hull et quel est son apport
Vient de la psychométrie et l'hypnose. Béhavioriste modéré Il assume existence des comportements non-observable. propose S- x- R- C La variable intermédiaire.
69
Quelles sont les exigences de la variables intermédiaire de Hull
Hypothétique (non-observable) Directement liée à. S et R S doit permettre de faire des prédiction concrète sur le comportement. Elle ne doit pas nécessite l'ajout d'autre variables. Stabilité même dans la manipulation
70
Qu'est-ce que la Tendance (drive)
Un déséquilibre de l'homéostasie crée un besoin, ce besoin a un corollaire psychologique (la tendance). Certains renforçateur primaires réduisent la tendance
71
Quelle est la formule complète de Hull
E = ( H x D x K) - (nlc + Ic) E= force du comportement o h= Habit D= Tendance k= Incentive ( par le renforçateur lui-même) nlc = inhibition non-conditionnée (fatigue) Ic = inhibition conditionné (peur)
72
Qu'est-ce que le passage du temps augmente selon Hull
La drive
73
Est-ce que K (inventive) selon Hull peut être inhibiteur
Non ,aura simplement une faible valeur mais pas 0
74
Qu'est-ce la trace interne du stimulus provoque selon Hull et sa théorie de la boîte noire
Une Récupération d'une habitude positive auquel on multiplie par la motivation (D) ainsi qu'un récupération d'une inhibition conditionnée auquel on ajout Ic (fatigue) On calcule ensuite la différence
75
Quelle est le principe de Premarck (relative value théorie)
Béhavioriste progressif puis cognitiviste. Théorie strictement empirique pas hypothétique Les comportements eux même peuvent être des renforçateurs et certains comportements ont des valeurs relatives entre elles à un moment donné. Expérience sur les cochons et leur préférence. 1. En situation de libre choix les préférence contrôle 2. Les exigence contrôle en situation contrôlée
76
Quelle est la théorie de Timberlake et Allison
ce qui constitue un renforçateur change avec le contexte. Si on ne peut pas faire un comportement qu'on aime habituellement pas pendant un certain temps, on sera en deçà du niveau optimal et on pourra se servir de l'écart pour renforcer un autre comportement
77
Expliquer l'expérience de Crespi
Tolman (père de la psycho cognitive) L'expérience prouve que la loi de la pratique est la seule loi de l'apprentissage. Phase 1 ; les rats sont séparés par trois groupes différents de la taille de la récompense Phase 2: On met tous les rats à une récompense moyenne. les rats n'aillant pas eu de renforcement ont quand même appris. = Apprentissage latent. (on ne le voyait pas avant, presque pas d'amélioration et puis BOOM gros pic lors du renforcement) Cause un vide théorique car on n'apprend pas par la loi de l'effet (conséquence, contingence)
78
Expliqué le Modèle de Mackintosh
V = a ( lambda - V) Apprentissage est égale a l'attention multipliée par le maximum d'apprentissage possible moins l'apprentissage déjà. fait. L'attention n'est pas une constante, diminue et augmente. Explique inhibition latente = attention diminue si stimuli présenté seul avant le pairage.
79
De quel conditionnement fait objet l'expérience de Pearse & Hall 1
Conditionnement classique (lumière, choc)
80
Expliquez le modèle de Pearce and Hall
Les stimuli non-compris attirent l'attention. AU contraire de Mackintosh qui propose que l'attention est attiré par les stimuli utiles. DV = a ( I - V) a = attention et dépend du degré de surprise. ci-bas. I- V = la quantité de surprise.
81
Expliqué L'expérience 1 de Pearce and Hall
Un groupe contrôle choc aléatoire et un groupe expérimentale lumière et choc, conditionnement retardé. 20 x pairage. Deuxième phase 20 pairage tous lumière et choc. Les rats contrôle ont plus appris et sursaute plus que les rats qui avait déjà appris = attention baisse, stimuli compris.
82
Qu'est-ce que le modelage
Apprentissage vicariant, par observation
83
Qui est Max Wertheimer
Fondateur de la Gestalt, le tout est plus grand que la somme des parties
84
Qui est Noam Chomsky
Il a contribué à l'émergence de la psychologie cognitive, car elle est indissociable du langage. Le langage est universel, la grammaire est universelle. Le langage s'appuie sur des règles de représentation mentales *processus cognitif.
85
Qu'est-ce que la cognition?
L'acquisition, le maintien, la transformation et l'utilisation de l'information
86
Les mesures de la mémoire
Rappel libre Rappel indice Le réapprentissage (revenir au niveau) Reconnaissance Appariement différé au modèle Extinction Gradient de dégradation (aplatissement de la généralisation)
87
Les sources de l'oubli
Le degré de l'apprentissage (overlearning se dégrade moins vite) (Fluency - bonne réponse/minute) Apprentissage précédent (peut avantager selon l'importance des apprentissages déjà fait ou désavantager selon interférence proactive) Subsequent learning (Remplacer le vieux par le nouveau = interférence rétroactive) Changement dans le contexte
88
Vrai ou faux ; Plus longue est la période entre l'apprentissage et le ré-apprentissage le plus d'oubli ?
Vrai
89
Expliquer le modèle Atkinson et Shiffrin
Registre sensoriel communique avec mémoire à court terme (processus de contrôle, autorépétition, encodage, décision) et le comportement émane de la MCT La MCT va vers la MLT à double sensé. La MLT a des réseaux sémantiques, expériences et images
90