Extinción y refuerzo intermitente

El refuerzo intermitente es un procedimiento interesante. En muchos sentidos, es difícil distinguir entre “pruebas sin alimentos en un programa de refuerzo intermitente” y “extinción”. En ambos casos, no se entrega ningún alimento después de la respuesta prevista. Más importante aún, la remoción o prevención de un refuerzo que depende de una respuesta en particular (costo de la respuesta o castigo negativo) agrega otro giro a la pregunta. Así es como yo respondería a la pregunta:

  1. En la extinción, el comportamiento no deseado (objetivo) es analizado primero para determinar qué reforzador lo mantiene. Entonces ESE reforzador está funcionalmente desconectado del comportamiento. En resumen, el comportamiento ya no es efectivo para producir el refuerzo. Cuando se hace correctamente, la frecuencia, tasa, magnitud o probabilidad del comportamiento disminuye.
  2. En el costo de respuesta (también conocido como castigo negativo), el comportamiento no deseado (comportamiento objetivo) es seguido inmediatamente por la eliminación de un refuerzo, o la oportunidad de ganar refuerzos. Para ser verdaderamente efectivos, los costos de respuesta deben ser entregados en un cronograma continuo: un precio/costo por CADA instancia de la respuesta objetivo. Así que en vez de simplemente fallar en reforzar el comportamiento (como en la extinción), el sujeto pierde algo de valor – ¡cada vez!

    Cuando los costos de respuesta y las contingencias de extinción se vuelven intermitentes, se convierten funcionalmente en programas de refuerzo intermitentes que pueden fortalecer el comportamiento en lugar de debilitarlo. (Nota: si sólo te castigan una vez de cada 10 veces que te involucras en la respuesta – funcionalmente obtienes 9 refuerzos, ¿cierto?) Así que tienes que ser increíblemente consistente cuando usas la extinción o CUALQUIER forma de castigo (costos de respuesta o castigo verdadero), si quieres ser efectivo.

  3. El refuerzo intermitente involucra pruebas ocasionales cuando no se entregan los refuerzos. Me gusta pensar en estos ensayos como oportunidades para que el sujeto aprenda sobre la persistencia. De alguna manera, los programas de refuerzo intermitente entrenan dos comportamientos: el comportamiento objetivo de interés y el comportamiento de persistencia. Por ejemplo, después de 3 pruebas sin alimentos, el bicho gana un RFT por el comportamiento y por ser persistente.
    >
    Nota : Creo que los Baileys se referirían a esto como un horario de configuración, una parte necesaria de elevar los criterios mientras desarrollan un nuevo comportamiento. KP]
  4. ¿Pueden confundirse los horarios intermitentes con los costos de extinción o de respuesta? Claro, si el capacitador pasa a un programa de refuerzo muy delgado demasiado rápido, el sujeto puede dejar de responder. Esto es muy similar a la deformación de la relación que ocurre cuando el criterio de respuesta se eleva demasiado rápido. Es importante recordar que hay que reforzar el comportamiento de persistencia, si se quiere que el sujeto siga intentándolo. Sorprendentemente, si usted se mueve gradualmente a un horario intermitente, los animales (y las personas) pueden aprender a emitir cantidades extraordinarias de comportamiento para cantidades muy pequeñas de refuerzos. En mi disertación, logré entrenar a varias palomas para que respondieran en programas de proporciones variables concurrentes que requerían hasta 600 teclados antes de moverlas a un programa de comida VI!
  5. Es cierto que no es necesario inferir un pensamiento consciente por parte de su sujeto. Probablemente nunca sabremos realmente lo que el “bicho sabe”. Todo lo que tenemos que hacer es seguir con el comportamiento abierto. Sooooo, si el comportamiento de su sujeto comienza a caer en picado, es posible que el animal esté respondiendo como si estuviera en un costo de respuesta o en un calendario de extinción. Eso me diría que estoy subiendo el listón demasiado rápido. En palabras de Karen Pryor, yo “volvería a la guardería”. Vuelva a un criterio más bajo para el comportamiento, restablezca y luego avance más lentamente (en el caso de pasar de la rFT continua a la intermitente, es posible que sólo desee aumentar a un requisito de 2 respuestas para varias pruebas o incluso sesiones, y luego a 3………………………………………………………………………………………………………………………………… 5…………………………….) Al final, el mensaje para llevar a casa es usar el comportamiento del sujeto como una guía sobre la rapidez con la que se puede pasar a un horario RFT muy delgado. No sabemos lo que el animal “infiere”, pero podemos usar el comportamiento del sujeto para ayudarnos a guiarnos a través de la transición de la RFT continua a la intermitente. El comportamiento de su sujeto le dirá si se está moviendo demasiado rápido o no.

Wendy Williams

También te puede interesar

Enjoyed this post? Share it!

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.