Introduccion del condicionamiento instrumental Flashcards
(27 cards)
idea central del condicionamiento instrumental
A diferencia de otros tipos de aprendizaje como la habituación, la sensibilización o el condicionamiento clásico, donde el organismo aprende sobre estímulos que no controla..
en el condicionamiento instrumental, el organismo aprende que ciertas consecuencias dependen de su conducta.
ley del efecto- Thorndike
: si una conducta es seguida por una consecuencia satisfactoria, se fortalece la conducta y viceversa.
medicion de latencia
diseñó un aparato experimental llamado caja problema. animal hambriento dentro. comida visible afuera. debía descubrir como salir para obtenerla.
A medida que repetía el experimento, el animal aprendía a salir cada vez más rápido. Ese aprendizaje era gradual y errático
metodo operante libre - skinner
Mejorar el método → sistema automatizado
Caja de Skinner: El animal está libre dentro de la caja. Puede emitir respuestas (presionar una palanca) para recibir el reforzamiento (comida).
Desarrollo de programas de reforzamiento.
tipos de reforzadores (estimulos) de CI
Primarios: necesidades biologicas (comida, agua, sexo)
Secundarios: asociados a primarios (dinero)
Sensoriales: estímulos agradables o estimulantes sensoriales (perfume)
Sociales: aprobación, elogios. (somos muy sensibles a ellos)
principio de premack - probabilidad
Una conducta que la persona hace con más frecuencia o disfruta más puede ser usada para reforzar otra conducta que hace menos.
ej: “Si estudiás 30 minutos, podés mirar Instagram” → Mirar Instagram (conducta más probable) refuerza estudiar (conducta menos probable).
Hipotesis de la privacion de la respuesta
: Si una conducta placentera se restringe, su valor como reforzador aumenta.
ej: Si te prohibís entrar a ig mientras estudiás (conducta instrumental), cuando finalmente entras (reforzador condicionado por privación), se vuelve más valioso.
Tipos de procedimientos de CI: reforzamiento positivo + ejemplo
para AUMENTAR conducta AGREGO estimulo AGRADABLE :
Un niño hace su tarea → le dan una galletita.
Tipos de procedimientos de CI: reforzamiento NEGATIVO + ejemplo
para AUMENTAR conducta, QUITO algo DESAGRADABLE:
Un estudiante estudia para un examen → así evita que sus padres lo reten.
Tipos de procedimientos de CI: castigo positivo + ejemplo
para DISMINUIR conducta, AGREGO algo DESAGRADABLE
Un niño grita en casa → le dan un reto fuerte o un sermón.
Tipos de procedimientos de CI: castigo negativo + ejemplo
para DISMINUIR conducta QUITO algo AGRADABLE
Un adolescente llega tarde → sus padres le quitan el celular por 3 días.
determinantes de la efectividad del reforzamiento; demora en la entrega del reforzador + ejemplo
Mientras más demora entre conducta y refuerzo → menos efectivo
ej: Fumadores eligen fumar ya antes que recibir dinero después.
determinantes de la efectividad del reforzamiento; CONTINGENCIA (Correlacion conducta-reforzador) positiva, cero, negativa
¿cuánto depende el reforzador de que yo haga algo? → Aprendizaje sólo ocurre si la conducta predice el reforzador
Contingencia positiva: Si hago la conducta → hay reforzador
Hay aprendizaje → + respuesta.
Contingencia cero: El reforzador aparece haga o no la conducta
No hay aprendizaje → la conducta se extingue
Contingencia negativa: + prob de reforzador si no hago la conducta
Aprendo a no responder → - respuesta (inhibición).
determinantes de la efectividad del reforzamiento; cantidad, calidad y valor relativo de incentivo
más incentivo = mejor desempeño.
Aspectos objetivos de los reforzadores: cantidad y calidad
Aspecto subjetivo: expectativas propias (experiencias pasadas y presentes). Nos llevan a valorar lo que recibimos de forma relativa
determinantes de la efectividad del reforzamiento; APRENDIZAJE MOTIVACION Y DESEMPEÑO
: sujeto motivado + rta y aprende + rápido
Motivación depende de
:
Impulso o nivel de necesidad: hambre, sed
Valor relativo del incentivo: valor percibido del incentivo disponible.
Aprendizaje: si la persona ha tenido experiencias anteriores exitosas al obtener recompensas similares, está motivada para intentarlo nuevamente.
ej: Alguien que ya resolvió crucigramas disfruta hacerlo de nuevo.
PERTINENCIA del reforzador para la conducta que se pretende reforzar
No cualquier conducta se refuerza igual con cualquier conducta.
Tiene que haber pertinencia entre lo que se quiere reforzar y el reforzador.
Las conductas alineadas con las necesidades del animal son más fáciles de reforzar
ej: Un mapache al que se le da una moneda como reforzador puede no soltarla, porque su instinto lo lleva a manipular objetos como si fueran comida.
deriva instintiva
: Conductas instintivas, ligadas a objetivos biológicos (alimentarse, defenderse, reproducirse), pueden reemplazar o interferir en conductas aprendidas.
Sistemas de Respuesta innatas: son sistemas que activan conductas automáticas asociadas a metas evolutivas (morder, esconder, acicalar, huir, etc.). A veces, estas respuestas limitan el tipo de aprendizaje que puede ocurrir.
ej: le enseñan a un cerdo a dejar una moneda en una caja. Con el tiempo, el cerdo deja de hacerlo y empieza a revolcarla en el suelo o masticarla. Su sistema de respuesta alimenticio se activa (instinto de buscar y manipular comida).
Programas de reforzamiento: que son?
Esquema que determina cuándo y con qué frecuencia una conducta será reforzada. Afecta directamente la velocidad de adquisición, la tasa de respuesta y la resistencia a la extinción.
reforzamiento continuo
reforzador inmediato cada vez que ocurre la conducta
ej: cada vez que el perro se sienta, recibe comida
efectivo al principio (aprendizaje rapido), pero si se interrumpe, se extingue rapido
reforzamiento parcial (variable o fijo)
No todas las rtas son reforzadas.
Aprendizaje lento pero resistente a la extinción, mayor persistencia por incertidumbre
ej: juegos de azar, elogiar a un niño a veces cuando se porta bien.
Se divide en 4 subtipos:
- RAZON FIJA: recompensa cada 3 rtas
- RAZON VARIABLE: recompensa cada un promedio de rtas
- INTERVALO FIJO: recompensa luego de 3 mins
4.INTERVALO VARIABLE: recompensa tras tiempo variable
si quiero aprendizaje rapido, que programa elijo?
continui
si quiero aprendizaje con mayor resistencia a la extincion, que programa elijo?
Parcial, especialmente Razón Variable
si quiero programa con alta tasa de respuesta sostenida, que programa elijo?
Razón Variable (RV)
si quiero programa con control de conducta dirigida a meta, que programa elijo?
programa de razon