VL 3 _ Lernen 3 Flashcards
Was ist operante Konditionierung?
Die operante Konditionierung (auch: instrumentelles Lernen) ist neben der
klassischen Konditionierung eine weitere Form des assoziativen Lernens
▪ „Operante Konditionierung“ & „instrumentelles Lernen“ werden häufig synonym verwendet
▪ Recap: Assoziatives Lernen bezieht sich allgemein darauf, dass ein neuer Bezug (eine
Assoziation) zwischen zwei oder mehr Elementen hergestellt wird, der vorher nicht bestand
Warum heißt es „operante Konditionierung“?
Verhalten wirkt auf die Umwelt ein („behavior operates
on the environment“), im Unterschied zum „respondenten“ Verhalten bei der klassischen Kond.
Warum heißt es „instrumentelles Lernen“?
Der Organismus lernt, dass Ereignisse in der Umwelt
(Belohnungen & Bestrafungen) von der Ausführung seines eigenen Verhaltens abhängig sind;
Verhalten dient sozusagen als „Instrument“
Verstärkung operante Konditionierung
Operantes Konditionieren verändert die Auftretenswahrscheinlichkeit des
operanten Verhaltens als Funktion seiner Konsequenzen
Verstärker (engl. reinforcer): Reiz oder Umstand, der die Auftretenswahrscheinlichkeit eines
Verhaltens erhöhen kann
▪ Positive Verstärkung: angenehmer Reiz (z.B. Futter, Wasser, Lob) wird dargeboten
▪ Negative Verstärkung: unangehmer Reiz (z.B. Lärm, Schmerz, Schimpfen) wird entfernt
Bestrafung operante Konditionierung
▪ Typ-1-Bestrafung: unangenehmer Reiz (z.B. Lärm, Schmerz, Schimpfen) wird dargeboten
▪ Typ-2-Bestrafung: angenehmer Reiz (z.B. Futter, Wasser, Lob) wird entfernt
Verstärkung und Bestrafung operante Konditionierung
Paradigmen Beispiele
Grundsätzlich kommen alle Verhaltensweisen von Organismen für operante
Konditionierung in Frage
▪ Beispiel: Tierstudien zum Erwerb & Verlernen von Verhalten-Konsequenz-Assoziationen
▪ Paradigma: Hebeldrücken von Ratten in sog. Skinner-Box (Verstärkung, Bestrafung, Darbietung
von audiovisuellen Reizen als diskriminative Reize oder als sekundäre Verstärker)
Beispiel: Tier- & Humanstudien zum Erlernen von Reizdiskriminationen (z.B. Farbe, Form)
▪ Paradigmen: Scheibenpicken (Vögel) bzw. Reizauswahl per Touchscreen und am PC
Beispiel: Tierstudien zum räumlichen Lernen & Gedächtnis, i.d.R. mit Ratten & Mäusen
▪ Paradigmen: Gang-/Labyrinthlernen sowie das Morris Water Maze (Finden einer Plattform)
Primätre und sekundäre Verstärker
Man unterscheidet zwischen primären & sekundären Verstärkern
▪ Primäre Verstärker: von Natur aus bzw. angeborenermaßen wirksam (z.B. Essen, Trinken,
sozialer Kontakt, Schmerz)
▪ Sekundäre (konditionierte) Verstärker: gelernte Verstärker; sie erhalten ihre Wirkung durch
Assoziation mit primären Verstärkern (z.B. Lob ist assoziiert mit körperlicher Zuwendung)
▪ Neutrale Reize, die mit Verstärkern gepaart auftreten, werden zu sekundären Verstärkern
▪ Beispiel: Ratte drückt Hebel; Futter + grünes Licht erscheint; grünes Licht => sek. Verstärker
▪ Menschliches Verhalten wird durch Vielzahl sekundärer Verstärker beeinflusst (z.B. Geld, Lob)
Was ist Token Economy? (operante Konditionierung)
Sekundäre Verstärker sind häufig wirksamer als primäre Verstärker (i.d.R
findet keine Übersättigung statt)
▪ Generalisierte konditionierte Verstärker: sekundäre Verstärker, die sich zur Kontrolle mehrerer
verschiedener Verhaltensweisen verwenden lassen
▪ Gutschein-Verstärkersysteme (engl. token economies) als Mittel zur Verhaltensmodifikation
beruhen auf dem Prinzip der generalisierten konditionierten Verstärker
▪ Token-Systeme sind auch bei manchen Tieren (z.B. anderen Primaten) erfolgreich anwendbar
▪ Psychotherapie/Psychiatrie: Erwünschte Verhaltensweisen (z.B. Medikamenteneinnahme,
Körperpflege) können mit Hilfe von einlösbaren Gutscheinen (engl. tokens) verstärkt werden
Effektivität der Verstärkung, Aspekte, Prinzip der Kontingenz
Grundsätzlich gilt: Ein Verhalten wird nur dann effektiv verstärkt, wenn der
Verstärker kontingent mit dem gewünschten Verhalten dargeboten wird
▪ Prinzip der Kontingenz: „Verstärker folgt unmittelbar & zuverlässig auf das gezeigte Verhalten“
(d.h. zufällige Verstärkungen reduzieren den Erfolg)
▪ Aber: Wie häufig und wie genau sollte man ein gewünschtes Verhalten belohnen?
▪ Ein sog. Verstärkerplan legt fest, nach welchen Kriterien eine Verstärkung erfolgt
▪ #1 Qualität: nur ein bestimmtes Verhalten wird verstärkt (z.B. vollständig ausgeführter Trick)
▪ #2 Quantität: Häufigkeit des Verhaltens beeinflusst Verstärkung (z.B. Trick 3x hintereinander)
▪ #3 Zeit: Zeitintervall, das mindestens vergehen muss, bis weiteres Verhalten verstärkt wird
Verstärkerpläne 4 Arten
Verstärkerpläne bezeichnen ein Muster der Gabe von Verstärkern bei der
operanten Konditionierung (2x2=4 Verstärkerpläne haben charakteristischen Einfluss auf Verhaltensaufbau & -abbau)
▪ Einfachster Verstärkerplan: kontinuierliche Verstärkung
- Jedes gewünschte Verhalten wird verstärkt, wenn es auftritt (z.B. Ratte drückt Hebel)
- Lernanstieg erfolgt schnell; beim Ausbleiben der Verstärkung setzt sofort Extinktion ein
▪ Partielle/intermittierende Verstärkung: nicht jedes Verhalten wird verstärkt
- Langsamerer Lernanstieg
- Höhere Löschungsresistenz (bezeichnet man als partiellen Verstärkungseffekt)
▪ Quotenpläne (engl. ratio schedule)
- #1 feste Quote (fixed ratio): jedes n-te Verhalten
wird verstärkt (z.B. FQ-10)
- #2 variable Quote (variable ratio): im Durchschnitt
wird jedes n-te Verhalten verstärkt (z.B. VQ-5)
▪ Intervallpläne (engl. interval schedule)
- #3 festes Intervall (fixed interval): erste Reaktion
nach Ablauf des Intervall wird verstärkt (z.B. FI-30)
- #4 variables Intervall (variable interval):
durchschnittliche Dauer eines Intervalls (z.B. VI-20)
Intervallpläne Alltag Beispiele
Fester Intervallplan (FI): Bushaltestelle
▪ Verhalten: Ausschau halten nach dem Bus
▪ Verstärker: Bus biegt um die Ecke! Glücksgefühl!
▪ Beobachtung: Wenn ich den Bus gerade verpasst habe, schaue ich erst mal für ca. 10 Minuten auf
das Handy, dann erst schaue ich wieder nach dem Bus (sog. Start-Stopp-Charakteristik)
▪ Variabler Intervallplan (VI): Email-Postfach
▪ Verhalten: Nachschauen, ob man neue Emails hat (wenn man kein Tool zur Benachrichtigung nutzt)
▪ Verstärker: Neue Emails sind da! Glücksgefühl!
▪ Beobachtung: Im Durchschnitt erhalte ich ca. alle 5 Minuten neue Emails; als Ergebnis schaue ich
eigentlich ständig nach neuen Emails (d.h. konstante Reaktionshäufigkeit)
Diskriminative Reize
Nach B.F. Skinner steht das Verhalten unter sog. „Stimuluskontrolle“
▪ Diskriminative Reize (SD) zeigen an, wann es sich lohnt, ein Verhalten (R) zu zeigen
▪ Beispiel: grünes Licht leuchtet in den Durchgängen, in denen die Ratte in der Skinner-Box für
einen Hebeldruck belohnt wird; grünes Licht wird zum diskriminativen Stimulus (SD)
▪ Generalisation: Verhalten wird auch bei Anwesenheit von Stimuli gezeigt, die dem diskriminativen
Stimulus ähnlich sind (z.B. Ratte drückt den Hebel auch bei rotem Licht)
▪ Operantes Konditionieren beinhaltet drei Elemente: diskriminativer Stimulus (SD), Verhalten bzw.
Reaktion des Organismus (R), verstärkender Stimulus (SR)
Skinner‘sche Verhaltensformel:
Nach der klassischen Skinner‘schen Verhaltensformel (SD -> R -> SR) wird
Verhalten durch S-R-Assoziationen erklärt (Behaviorismus)
▪ Alternative Schreibweise der Skinner‘schen Verhaltensformel: S-R-C (C für Konsequenz)
▪ Kognitiv-emotionale Erweiterung der Verhaltensformel (Kanfer & Saslow, 1969): S-O-R-K-C
(O: Organismuskomponente; K: Kontingenzkomponente)
Arten der Verstärkung (operante Konditionierung)