Cours 6 : LE COMPORTEMENT, SES CONSÉQUENCES ET APPRENTISSAGE Flashcards

Question

Décrire les avantages d'utiliser une situation opérante libre

Answer 1

* + naturel * La réponse souhaitée arrive plusieurs fois (ne met pas fin à l’expérience) L’expérience dure le temps déterminé à l’avance.

Answer 2

Souvent l’intérêt est de calculer combien de fois la réponse se produit par minute (fréquence)

Answer 3

Aussi nommé paradigme s-r S --> R --> S^R

Answer 4

S = Situation de stimulation (stimulus)

Answer 5

R = Réponse (qui a une conséquence)

Answer 6

S^R = stimulus renforçant, conséquence, effet de la réponse

Answer 7

1- Conditionnement classique = apprendre des signaux pour prédire un stimulus "agréable", alors que conditionnement instrumental = apprendre de nouveaux comportements qui vont causer le stimulus agréable 2-nature du comportement (classique=réponse automatique, instrumental = réponse volontaire émise) 3-Classsique: RC prépare pour la RI ("avantage") Instrumental: R nous amène à SR a conséquence NE PEUT SE PRODUIRE sans la réponse. 4-

Answer 8

Il faut un pairage. La contingence n’est pas différente. C classique: Stimulus annonce quelque chose C instrumental: Réponse annonce (cause) quelque chose. Donc, les 2 conditionnements sont des prédictions. Une environnementale et une de conséquence. Dans les 2 cas, l’animal apprend une façon de prévoir quelque chose qui l'intéresse (un stimulus inconditionnel ou un autre stimulus inconditionnel dont il peut artificiellement lui-même causer l’apparition)

Answer 9

Lois de Thorndike  Loi de la pratique (plus le rat presse le levier, meilleur il est, presse plus vite) - Loi de l’effet aussi 😃  Loi de l'intensité des stimuli (plus grosse récompense, meilleur apprentissage, plus gros bouton, meilleur apprentissage)  Extinction et récupération spontanée (si presser le levier ne donne plus de nourriture, on arrête, inhibition interne, mais avec un break il y a récupération spontanée)  Importance de la contiguïté (nécessaire)  Importance de la contingence (responsable, lien statistique)  Blocage et masquage - bloquage: même raisonnement, si le rat apprend à presser levier pour avoir nourriture et qu’on fait apparaitre un bouton qui distribue nourriture, le rat ne va pas appuyer sur le bouton mais continuer d’activer le levier. - mais: ça va se complexifier, pas tjrs vrai.  Généralisation et discrimination - on met le rat dans une autre boite qui ressemble à une boite de Skinner, il va presser le levier par généralisation. Mais si le levier de la 2e boite donne des chocs électriques, il va apprendre la discrimination.

Answer 10

- Skinner reprend la loi de l'effet en s’éloignant de certaines formulations de celle-ci pour avoir une formulation plus objective, plus rationnelle - Il n’aime pas les mots « agréable » et « désagréable » ne devraient pas être utilisés en psycho, car ça change d’une personne à l’autre, c’est trop subjectif et ça fait trop référence à des processus internes - La conscience (opinions) n’est pas important. Ce qui compte dans la loi de l’effet = L’EFFET (augmente ou diminue la réponse? c’est ce qu’on essaie d’expliquer.)

Answer 11

centrale, permet l’apprentissage

Answer 12

toute situation S-R-C dans laquelle l’effet de C sur R est d’augmenter la probabilité de la réponse R. - Si on voit que la réponse augmente, la conséquence C est un renforcement.

Answer 13

toute situation S-R-C dans laquelle l’effet de C sur R est de diminuer la probabilité de la réponse R. - Fait réduire le comportement

Answer 14

toute situation S-R-C pour laquelle la conséquence C de R est l’apparition d’un stimulus qui n'était pas présent auparavant. - Apparition de quelque chose (ex: nourriture) Encore ici, pas de lien avec ce qui est agréable/désagréable.

Answer 15

Est dite « négative » – toute situation S-R-C pour laquelle la conséquence C de R est la disparition d’un stimulus présent auparavant. - Disparition de quelque chose

Answer 16

Skinner dit de regarder l'EFFET (augmentation ou diminution de la réponse) pour savoir si renforcement ou punition. ET NON si c'est agréable ou désagréable. (Skinner comprend bien qu’on ne peut pas présumer à l’avance si quelque chose st un renforcement ou non. Il faut le vérifier.)

Answer 17

- Le type d'effet sur la réponse (renforcement vs punition) | - La nature de la conséquence (positive ou négative)

Answer 18

- Le renforcement positif consiste à donner au sujet un stimulus agréable, c'est un événement qui augmente la fréquence d'apparition d'un comportement grâce à un stimulus « agréable ». - Augmentation de la réponse - La conséquence apparait - Par exemple, une gâterie pour un chien qui fait le beau. (sous entend que la récompense est agréable mais pas besoin de parler de processus mentaux car on voit l'effet.)

Answer 19

- TRÈS EFFICACE! (ex: l'argent, on veut en gagner plus) - Si ça marche pas, on augmente l'intensité de la récompense (ex: plus d'argent --> ça va vraiment en prendre bcp avant que ça marche pu et que ça motive pu)

Answer 20

Non, on peut trop récompenser. PROBLÈME: plus on récompense quelqu'un de l'extérieur plus on a tendance à réduire chez eux cette motivation interne. Surtout si on commence jeune. Les enfants ne naissent pas avec une motivation interne. Ça se développe. Mais si dès la naissance, on commence à les bombarder de récompenses pour tout ce qu'ils font, on va étrangler cette motivation interne, ce qui va possiblement les nuire. ex: Dudley dans Harry Potter qui se fâche parce qu'il a moins de cadeaux que l'année passée. Il a trop de récompenses externes, pas bon. Empêche d'être heureux avec moins car le bonheur peut venir de l'intérieur. Dépendance à des renforçateurs superficiels: la littérature dit que ce n'est pas le meilleur pour nous.

Answer 21

PROBLÈME no2: Il faut donner les récompenses, viennent de quelque part. (donner un cadeau à son enfant pour chaque bonne note: ça coûte cher) Problème, car réduire une récompense peut être une punition et est confrontée par le sujet. ex: Dudley dans Harry Potter qui se fâche parce qu'il a moins de cadeaux que l'année passée.

Answer 22

Ce qui nous renforce peut venir de l'extérieur (ce que l'environnement nous donne, renforcement externe) ou de l'intérieur (vient de nous-même, ex: sentiment de satisfaction personnelle, beaucoup plus relié à notre santé mentale et notre bien être psychologique)

Answer 23

Parce que l'évitement de la chose dont on a peur est renforcé négativement (le fait d'avoir une réponse d'évitement permet de retirer quelque chose de désagréable, comme sentiment de panique, palpitations, symptômes d'anxiété) L'évitement "fonctionne"

Answer 24

- Le renforcement négatif consiste à supprimer un stimulus désagréable ou douloureux, c'est un événement qui augmente la fréquence d'apparition d'un comportement grâce à un retrait ou à l'arrêt d'un stimulus « désagréable » . - Par exemple, prendre une aspirine qui fait disparaître un mal de tête. - Aussi, rat qui pèse sur un levier pour faire disparaitre des bruits désagréables dans sa cage. - Augmentation de la réponse - La conséquence (désagréable) disparait

Answer 25

On réagit très fort au renforcement négatif, parfois même aussi fort que pour le renforcement positif. Efficace si on trouve le bon truc désagréable à enlever, dans des conditions optimales = presque impossible a faire. (Renforcement: Dur de récompenser quelqu'un qui n'a pas besoin de rien/qui n'est pas dans des conditions désagréables.)

Answer 26

- Réponse simple: payer mieux les employés? Mais l'entreprise a pas envie de faire ça. - Puisqu'on ne peut pas faire de renforcement positif ($$), il faut faire du renforcement négatif. - Va observer l'environnement des employés pour essayer de trouver des stimulus désagréables (à enlever). - idées: installer ventilateurs qui évacuent mauvaises odeurs. paravents pour le son. Coût unique. - Quand le tapis accélère, les ventilateurs partent. (employés qui travaillent plus fort, moins d'odeurs)

Answer 27

Ça fonctionne (si marche pas, doubler la punition, loi de l'intensité des stimuli). Moyen très efficace et très pratique de provoquer un changement dans les réponses (au même titre que le renforcement) MAIS problèmes éthiques. (fort débat dans la littérature) - est-ce que le changement est permanent? - est-ce que la punition a des conséquences supplémentaires?

Answer 28

- Procédure par laquelle la probabilité de fréquence d'apparition d'un comportement tend à diminuer suite à l’ajout d'un stimulus « aversif » ou conséquence désagréable contingente au comportement cible. - Par exemple, l’ajout d’une obligation, d'une douleur... - Diminution de la réponse - La conséquence apparait (l'environnement inflige de la douleur)

Answer 29

La punition positive a des effets secondaires indésirables (décourage l'utilisation de la punition positive, en particulier avec des enfants)

Answer 30

- Agressivité passive chez les gens punis – Intensification de l’agressivité chez celui qui administre la punition. – L'apprentissage de l'agressivité par le sujet puni. – Comportement d’évitement de la punition (et non d'apprentissage de la réponse adéquate) ***la punition négative a aussi ces problèmes-là (à un degré moins élevé par contre, moins fréquent ou moins intense)

Answer 31

Forme subtile d’agressivité caractérisée par la bouderie, la procrastination, l’entêtement et l’inefficacité intentionnelle. Les gens punis développement une tendance à exprimer leur frustration de façon indirecte.

Answer 32

Oublier des choses, être absent d'esprit dans un couple: forme de contre-agression, de réaction à la punition de (par exemple) s'être fait crier dessus. Peut être fait consciemment ou inconsciemment. Quand il y a un déséquilibre de pouvoir: - Dominant: Se plaint. - Soumis: agressivité passive. (oublis, retards, manquements qui frustrent l'autre)

Answer 33

- Cercle vicieux : le « punisseur » est renforcé d’avoir puni (renforcement négatif: ça fonctionne et on cesse d'être dérangé, en plus, il faut augmenter la punition si ça marche plus.) - Donc, la punition apprend au punisseur à punir plus.

Answer 34

- Deviennent des punisseurs à leur tour car il ont la preuve que la punition fonctionne (ils en sont eux-mêmes la preuve) - Littérature: les personnes abusées deviennent abuseurs. Il y a une corrélation.

Answer 35

- Quand on punit excessivement les gens, ils développent le risque d'apprendre le moyen d'éviter la punition plutôt que ce qu'on veut leur enseigner. Induit le développement d'une réponse d'adaptation. - Une punition trop souvent utilisée: On me punira seulement si jme fait prendre. (ex: le feu rouge a 3h du mat dans une rue vide)

Answer 36

- Empêcher un ado de sortir pendant 6 mois: il apprend qu'on est puni seulement si on se fait prendre. - 2 types de criminels (voleurs de banque): - Pas d'antécédents, peu de risques de récidive, punition courte (la personne comprend qu'on la punit pour ne pas qu'elle le fasse à nouveau.) - 12e crime, va seulement changer ce qu'il fait pour pas se faire prendre la prochaine fois. - Autre exemple: Fumer la cigarette. --> Taxes sur la cigarette pour décourager les fumeurs. - MAIS: ça a développé de la contrebande de cigarettes.

Answer 37

Non, la punition met en péril le contrat social (les gens se rendent compte que tt est permis si on se fait pas prendre)

Answer 38

En théorie: la prison est une punition négative (perte d'un privilège -> de faire ce qu'on veut). Mais, si la prison est un endroit désagréable (ex: ça pue, les gens sont pas fins...) c'est aussi une punition positive.

Answer 39

 Procédure par laquelle la probabilité de fréquence d'apparition d’un comportement tend à diminuer suite au retrait contingent d'un stimulus agréable, dit « appétitif ».  Par exemple: Retrait d’un privilège, d'un droit... - Diminution de la réponse - La conséquence disparaît

Answer 40

SOLUTION: façonnement (shaping) --> permet de faire apprendre à un animal en 5 min ce qui prend des heures si on ne s'en tient qu'au hasard. Permet de faire des choses, simples ou compliquées, qui N'ARRIVERAIENT JAMAIS PAR HASARD.

Answer 41

Appliquer le principe de renforcement (positif, pour s'assurer que ce soit efficace) Des approximations successives sont renforcées, débuter avec un critère large pour le renforcement. - Levier à gauche du rat - Récompenser le rat qui se tourne vers la gauche (augmente la possibilité du comportement) Ensuite, augmenter graduellement le critère (exiger de plus en plus de réponses: le sujet va très facilement le faire si étape par étape.) - On arrête de récompenser le rat qui se tourne a gauche et attendre que le rat se rapproche du levier (maintenant plus probable) pour lui donner une récompense - Ensuite, on donne la récompense si le rat actionne le levier. - Ainsi, le façonnement est une façon artificielle d'augmenter graduellement la probabilité que le comportement désiré se produise. (on renforce les ÉTAPES de la réponse. le critère augmente graduellement)

Answer 42

Faire apprendre graduellement en donnant des récompenses massivement - Faire l’apprentissage des réponses indépendamment, en commencant par le dernier comportement dans la chaine - Ajouter des liens à la chaine en ordre inverse (vers le premier comportement) - Pour établir la chaine, chaque comportement est renforcé par la possibilité de faire la réponse suivante. (relire notes de cours pour exemple et explications plus détaillés)

Cours 6 : LE COMPORTEMENT, SES CONSÉQUENCES ET APPRENTISSAGE Flashcards

(66 cards)