Sitzung 4 Lernen 3 Flashcards
(38 cards)
Methoden des komplexen Verhaltensaufbaus
- Shaping
2. Chaining
- Shaping
Verhaltensformung durch stufenweise Annäherung
Eine Verhaltensformung, in der eine komplexe Verhaltensweise gelernt wird. Anfangs werden alle leicht ähnliche Verhaltensweisen belohnt; später werden nur noch ähnliche Verhaltensweisen und
zuletzt nur noch das Zielverhalten belohnt.
- Chaining
Aneinanderkettung von neuen Verhaltensfolgen.Einen Lernvorgang, in dem eine komplexe Verhaltensweise
aufgebaut wird. Es wird mit einer Verhaltensweise begonnen und diese mit weiteren verknüpft bis schrittweise eine komplexe Verhaltenskette erreicht wird.
- Forword- Chaining:
Man baut die komplexe Verhaltensweise von Anfang an auf (sprich in der “richtigen” Reihenfolge) - Backword-Chaining: Man baut die Verhaltensweise vom Ende her auf. Es wird mit einem Zielverhalten begonnen und davon ausgehend schrittweise eine Verhaltenskette aufgebaut
- > oft bei Dressur eingesetzt
Verhaltensaufbau durch negative Verstärkung
- > Anstelle von Belohnung wird Verhalten durch Flucht und Vermeidung verstärkt
1. Fluchttraining: z.B.: Feueralarm
2. Vermeidungslernen: Lernen einen aversiven Reiz zu meiden, bevor er auftritt
Methoden der Verhaltensreduktion
- Löschung
- Differentielle Verstärkung alternativer Verhaltensweisen
- Sättigung
- Bestrafung
- Methode der Auszeit (Time-out)
Methoden der Verhaltensreduktion: 1. Löschung
- Schritt: Indentifizierung von Verstärkern des unerwünschten Verhaltens
- Schritt: Beseitigen der kontingenz (= der Wahrscheinlichkeit, dass ein Verhalten zu einer Bestimmten Konsequenz führt)
Methoden der Verhaltensreduktion: 2. Differenzielle Verstärkung alternativer Verhaltensweisen
Verstärkung von alternativen Verhaltensweisen
-> ist möglich, wenn beide Verhaltensweisen (alternative und unerwünschte) nicht gleichzeitig ausgeführt werden können
Methoden der Verhaltensreduktion: 3. Sättigung
Herabsetzen des Wertes des Verstärkers durch die Schaffung der Möglichkeit die positive Konsequenz des unerwünschten Verhaltens so oft zu bekommen wie man möchte
Folge: Reduktion des Bedürfnisses nach dem Verstärker
!Achtung: Nicht immer eine gute Idee !
Methoden der Verhaltensreduktion: 4. Bestrafung Wirksamkeit & Probleme
Ultimo Ratio
Wirksamkeit: vorübergehende Unterdrückung solange bestraft wird
Probleme: 1. heimliches Verhalten statt Verhaltensreduktion
2. Furcht
3. Ethische Probleme: Fließende Grenze zu Gewalt und Missbrauch
Methoden der Verhaltensreduktion: 5. Methode der Auszeit (Time-out)
Kombination von Löschung durch Verstärkerentzug und Bestrafung
Wann ist Bestrafung effektiv?
-> Ähnliche Gesetzmäßigkeiten wie bei Verstärkung
- mit hoher Intensität: Studie von Azrin & Holz (1966)
» Tauben lernten auf Scheibe zu picken
» 80 Volt: sofort aufgehört
» Langsame Steigerung: erst bei 130 Volt aufgehört - mit Unmittelbarkeit
- mit Kontinuierlichkeit: Die Bestrafung jedes Verhaltens ist schneller als intermittierende Bestrafung
- mit niedriger Motivation für das unerwünschte Verhalten
- mit Angebot für Alternativverhalten
Indikatoren für die Rolle von Kognition beim instrumentellen Lernen
- Latentes Lernen
2. Verstärkererwartung
- Latentes Lernen
= verborgenes Lernen
Es wurde gelernt, das gelernte Verhalten wird jedoch nicht gezeigt
Lernen braucht also keine Verstärkung aber die Performanz schon
- Verstärkererwartung
Im Laufe der Zeit baut sich eine Erwartung über die Güte der Belohnung auf. Wird diese enttäuscht, nimmt die Leistung ab, wird diese übertroffen nimmt die Leistung zu
Rescorla-Wagner-Modell: Erklärung
beschreibt die Veränderung der Assozitionsstärke zwischen CS & US über die Lerndurchgänge in Abhängigkeit der Qualität des CS und des US, Lernen ist nach diesem Modell die Zunahme an Assoziationsstärke zw. CS & US
mathematisches Modell, dass Assozialtionsbildung bei der klassischen & operanten Konditionierung beschreibt
versucht Lernvorgänge mathematisch abzubilden & quantitative systematische Vorhersagen zu treffen
Möglichkeiten/Vorteile von RW-Modell
- Erweiterung auf mehrere CS möglich
- US wird durch die Summe der CS-US Assoziationsstärker vorhergesagt
- CS konkurrieren miteinander
- Erklärt Blocking Phänomen: Durch erste Trials ist CS1-US Assoziationsstärke schon ziemlich
hoch ➡ reduziert Lernzuwachs
➡ CS1 und CS2 konkurrieren
➡ CS2-US Assoziation wird nicht mehr gelernt - vermag den idealtypischen Akquisitionsverlauf bei der klassischen Konditionierung abzubilden:
Erstens nimmt die Assoziationsstärke mit jedem Trainingsdurchgang zu und nähert sich dabei der maximalen Assoziationsstärke an. Zweitens ist
der Zuwachs anfangs groß und wird mit jedem neuen Trainingsdurchgang ein wenig kleiner: Die Lernkurve ist negativ beschleunigt. Beide Vorhersagen des Modells stimmen mit den experimentellen Daten überein.
-> sehr erfolgreiches Modell, aber neuere Forschung zeigt, dass Grenzen da sind und Erweiterung notwendig ist
Grenzen des RW-Modells
- Kontextlernen (Verknüpfung von CS & US findet nur in einem bestimmten Kontext statt) kann es nicht erklären
- Unterschiedliche Differenzierungen im Lernen auch nicht (z.B.: Ton a = Futter, Ton b = Futter, Ton a +b = kein Futter; das kann gelernt werden, das Modell kann diese Lernkurve aber nicht erklären)
Vermeidungslernen
Definition
Das Vermeidungslernen baut auf das Furchtlernen auf, nachdem mal gelernt hat etwas zu fürchten, lernt man oft etwas zu vermeiden
Vermeidungslernen
Erklärung
Vermeidung und Flucht kann durch negative Verstärkung erklärt werden, das Individuum vermeidet oder beendet eine unangenehme Situation
Eigenschaft von Vermeidungslernen
ist sehr löschresistent
-> Grund: Vermeidungsparadox
Vermeidungsparadox
Flucht und Vermeidung treten vor dem Ereignis ein, sodass das Nichteintreten des Ereignisses als negative Verstärkung wirkt, so wird das Vermeidungshalten verstärkt wird und gleichzeitig wird verhindert zu erkennen, dass der US inzwischen gar nicht mehr vorliegt
Zweifaktor-/ Zweiprozesstheorie des Vermeidungslernens
- Klassische Konditionierung: Übertragung von Furcht vor negativem Reiz auf Hinweisreiz
- Vermeidung: Reduktion von Furcht durch Vermeidung des Hinweisreizes (negative Verstärkung)
- > Erklärt Vermeidungsverhalten jedoch nur teilweise, da vermeidungsverhalten auch dann gezeigt wird, wenn keine Furchtereignis vorlag
Stabilität des Vermeidungsverhaltens
Ist sehr Stabil, da die Vermeidung nicht nur verhindert, dass die Erfahrung des negativen Reizes während der Akquisition gemacht wird, sondern auch die Feststellung, dass der US inzwischen nicht mehr da ist
Auf andere Kontexte Übertragen: Wenn man die Situation vermeidet kann man auch keine positiven Erfahrungen machen
Kognitive Erklärung für Löschungsresistenz von Vermeidungsverhalten
-> Füllt die Erklärungslücke der Zweifaktortheorie
Seligman & Johnston (1973)
Es werden schon Verhaltensweisen, bei denen eine aversive Reaktion erwartet wird, vermieden
Diese Vermeidung erlaubt es diese Erwartung aufrechtzuerhalten. Die Erwartung kann also nicht gelöscht werden, da man gar nicht die Erfahrung macht, dass die Erwartung falsch ist