¿El clic pone fin al comportamiento?

Hemos notado que los recién llegados a la formación de clicker a menudo hacen las mejores preguntas sobre la formación y cómo se produce el aprendizaje. A veces las respuestas a estas preguntas son más interesantes y sutiles de lo que los capacitadores más experimentados pueden suponer. Basándonos en las perspectivas ofrecidas por la facultad de ClickerExpo, Karen Pryor y otros capacitadores, trataremos de arrojar un poco de luz sobre las preguntas no tan simples.

¿El clic finaliza el comportamiento?

Parece sencillo: hacemos clic para marcar un comportamiento deseado y luego lo reforzamos. El acto de reforzar el comportamiento requiere un cambio en la acción: el caballo se come la golosina, el perro juega con su juguete favorito, y el animal en proceso de ser reforzado ya no realiza el comportamiento por el cual fue golpeado. El clic, por lo tanto, termina el comportamiento. La frase se ha convertido en un principio ampliamente repetido de la formación de clickers.

Si el clic debe mantenerse como un marcador de eventos, en lugar de como una señal de “mantener en marcha”, y no queremos hacer clic hasta que termine el comportamiento, ¿cómo creamos comportamientos duraderos?

Sin embargo, ¿es cierto? Cuanto más explora un entrenador el uso del control remoto, más puede empezar a cuestionar este principio. Después de todo, si sólo haces clic al final de un comportamiento, ¿también estás reforzando “dejar de trabajar”? ¿Cómo usamos un marcador de eventos si queremos que el animal continúe hasta que se le indique que deje de trabajar?

A menudo cuando nos encontramos en estas áreas grises, descubrimos que la pregunta que estamos haciendo es la pregunta equivocada. En lugar de preguntar “¿El clic pone fin al comportamiento?”, debemos preguntar “¿Está el clic seguido de un refuerzo?”

Karen Pryor explica: A menudo usamos el clic para decir que lo que quiero es ˜That, y te voy a pagar por ello”. Es cierto que el animal deja de hacer lo que está haciendo para recoger su regalo. Luego, sin embargo, repite el comportamiento con el fin de obtener otro tratamiento. Así que, sí, el clic termina el comportamiento. Pero también promueve la repetición del comportamiento. Una vez que el comportamiento se ha repetido hasta el punto de ser aprendido, y está en el momento oportuno y se realiza con confianza, realmente no necesitamos marcarlo más. Podemos usar palabras o gestos para indicar más comportamiento o para indicar un alto, dependiendo de lo que queramos.

¿Puede el clic tener dos significados: 1) sí, ese es el comportamiento que quiero, y 2) por favor continúe haciendo el comportamiento. ¿Puede ser a la vez un marcador de eventos y una señal de mantenimiento? Karen responde: “Si cambias el clic de ser una señal de marcador a ser una especie de estímulo o una señal de’seguir adelante’, vas a tener problemas. Cuando se dan clics aleatorios durante un comportamiento continuo (mientras se entrena una “estancia” por ejemplo), no emparejados con ningún otro evento, se separa el clic del refuerzo”. Estudios realizados en la University of North Texas han demostrado que para mantener la fuerza de la asociación del clic con el refuerzo, es necesario mantener esos dos elementos emparejados y asociados en tiempo real tanto como sea posible, o la potencia del clic se reducirá hasta que no tenga sentido para el animal.

A veces, las personas hacen clic y también tratan repetidamente durante un comportamiento de larga duración, pero no dejan que el comportamiento se detenga. En este caso, el clic continúa apareado con el refuerzo, pero en realidad el clic no contiene ninguna información, ya que no marca un comportamiento claramente identificable. Has eliminado su propósito principal, como señal de marca.

Por lo tanto, si el clic debe mantenerse como un marcador de eventos, en lugar de una señal de “mantener en marcha”, y no queremos hacer clic hasta que termine el comportamiento, ¿cómo creamos comportamientos duraderos?

Para la entrenadora de caballos Alexandra Kurland, el clic siempre termina el comportamiento: pero sólo temporalmente. Ella escribe: “Suponga que su caballo explota hacia adelante en su habitual trote rápido, pero luego tiene un momento en el que el trote se estabiliza y se ralentiza. Tú haces clic y él se detiene. Se detiene PORQUE el clic marca el final de una unidad de comportamiento. Si va a recoger su ‘paycheckâ€, tiene que hacerlo. Así que, ahora coge el trote de nuevo. El caballo sale corriendo, pero es un animal con control remoto. Sabe que fue reforzado por algo. Sólo que no sabe qué. Su trote se estabiliza de nuevo, sólo por un instante, pero eso es todo lo que necesitas para hacer clic y decir “COPY0â€, eso es lo que yo quería. El caballo se detiene, cobra su cheque de pago y luego comienza de nuevo. Comer es relajante, así que la próxima vez que trote, estará más tranquilo. ¡Click! Lo marcas de inmediato y le das el premio gordo de una golosina especial. Está empezando a darse cuenta de que trotar lentamente te convierte en una máquina expendedora. Una vez que él entre en el trote con calma, puedes empezar a retener el clic y pedir un poco más y luego un poco más”. En otras palabras, se construye la duración de la manera en que lo harías con cualquier otro comportamiento: en pequeños incrementos.

Joan Orr también está familiarizado con este tema. “La gente sigue preguntándome si el clic pone fin al comportamiento. Por supuesto que sí. ¿De qué otra manera puede ser? En mi caso, confío mucho en este concepto, ya que estoy entrenando con muletas. Tengo que parar físicamente para dar el tratamiento ya que no puedo caminar y tratar al mismo tiempo. Porque el perro entiende que el clic significa ‘That estaba en lo cierto y ahora se acabó,’ no tengo un perro que se escore dando unos pasos y parando. Tengo una perra de talón suave aunque la he detenido después de 2 y 4 pasos y 1 y 5 pasos, etc. No entiendo por qué la gente piensa de otra manera o cómo aplican esto eficazmente en su formación. Alguien más me dijo que enseñan “COPY17′ haciendo clic y tratando varias veces de forma intermitente durante la estancia y luego soltando con una señal verbal. Reajustan el perro si se levanta después de uno de estos clics de media estancia. ¿Qué puede hacer un pobre perro? En este caso, el clic no significa absolutamente nada”.

¿Qué hacer si necesita reforzar un momento particularmente bueno dentro de una larga cadena de comportamientos? Una respuesta está en nuestra elección de refuerzo. Después de todo, la comida no es el único refuerzo. Otro indicio conocido de un comportamiento favorito también puede ser un refuerzo. En el campo de la agilidad, por ejemplo, un entrenador puede usar el clic dentro de una cadena de comportamiento en curso para identificar una acción correcta, como golpear la zona de contacto. Karen explica: “No quieres que el animal se detenga, y no quieres que el clic se quede sin reforzar, pero por supuesto tienes un refuerzo de larga distancia a mano, es decir, el taco para la siguiente acción. Así que si sigues el clic o lo emparejas instantáneamente con otra pista conocida, has identificado un movimiento deseado con el clic”. Puede reforzar un comportamiento deseado con otro taco, manteniendo así la asociación condicionada del clic con un refuerzo, en este caso otro taco.

Esta recompensa es muy poderosa para Josie, la perra de Joan Orr. “A ella le gusta más el taco de ˜away que la comida o los juguetes”, dice Joan. “Es un refuerzo condicionado muy fuerte y puedo usarlo para reforzar otros comportamientos y mantenerla moviéndose rápido y sin mirarme.”

Marcar un comportamiento correcto sin detener la acción también se puede emparejar con señales físicas que le dicen al animal que siga adelante. De vuelta al campo de la agilidad: si un entrenador está tras la forma correcta en el salto de longitud, puede hacer clic en un buen despegue. Entonces el perro está en el aire, y el salto tiene que estar terminado de todos modos. Al entrenar los postes de tejido, los postes mismos pueden convertirse en señales para decirle al perro que siga adelante; los objetos físicos se convierten rápidamente en señales visuales aprendidas. (Demasiado rápido, de hecho, como a menudo debemos enseñar que las señales verbales superan a las visuales: “¡No saltes todo delante de ti, escúchame a mí en su lugar!)

La mayoría de las personas caen en la trampa de pensar que tienen que hacer clic “durante” un comportamiento, una o muchas veces, porque no entienden que la manera de construir un comportamiento de larga duración es aumentar gradualmente el tiempo que usted está pidiendo; y hacer clic sólo al final de ese tiempo. La duración, en otras palabras, es un comportamiento separado del que estás entrenando, y debe ser moldeado como cualquier otro comportamiento. Para instrucciones muy claras, paso a paso, sobre el entrenamiento de clicker para comportamientos de larga duración, ver Morgan Spector’s Clicker Training for Obedience (Entrenamiento de clicker para obediencia).

Sobre el autor

Gale Pryor es escritora y editora de Pen and Press, una empresa de servicios editoriales y consultoría. Sus créditos de escritura incluyen Parenting Magazine , Mothering Magazine , Teaching Dogs , National Public Radio y dos libros de mayor venta.

También te puede interesar

Enjoyed this post? Share it!

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.