Psicología

Aprendizaje. Thorndike. Ley del efecto. Condicionamiento operante. Skinner. Reforzamiento. Reforzador positivo. Negativo. Extinción. Pavlov. Estímulos. Respuestas. Castigos

  • Enviado por: Dr Online
  • Idioma: castellano
  • País: México México
  • 8 páginas

publicidad
cursos destacados
Cómo montar un Ordenador
Cómo montar un Ordenador
En este curso te guiamos de una forma muy práctica y gráfica, para que puedas realizar el montaje de tu...
Ver más información

Curso de reparación de teléfonos móviles / celulares
Curso de reparación de teléfonos móviles / celulares
El curso de Reparación de Telefonía Celular o Móvil está orientado a todas aquellas...
Ver más información


ÍNDICE

Introducción

Condicionamiento operante, procedimientos básicos

Reforzamiento

Extinción.

Comparación entre procedimientos pavlovianos y operantes

Castigo

Procedimientos aversivos y de castigo

Comentarios personales

INTODUCCION

Thorndike descubrió que cuando una respuesta es seguida de una situación satisfactoria, tiende a repetirse; cuando a una respuesta le sigue una situación incómoda, tiende a desaparecer. En otras palabras, la posibilidad de una respuesta depende de sus efectos en el ambiente, un principio que Thorndike denomino la ley del efecto.

A este procedimiento, en el cual la conducta se fortalece o debilita, se le denominó condicionamiento operante, pues se creía que la conducta opera sobre el ambiente. A tal aprendizaje se le llama también condicionamiento instrumental, porque las respuestas dadas al estímulo condicionado sirven de instrumento para la obtención de una recompensa, evitar un castigo o modificar de alguna otra manera el ambiente en que se mueve el que esta aprendiendo.

En el condicionamiento operante, la conducta del sujeto que esta aprendiendo trae consigo el reforzamiento. De todas las respuestas posibles que podría dar en la situación, solo la “correcta”, la que se quería perfeccionar, conducía a una recompensa. El condicionamiento operante participa en la mayoría de las situaciones de aprendizaje sencillo, especialmente las que tienen un grado elevado de naturalidad.

Skinner (1938, 1953) identificó cuatro procedimientos operantes, dos de los cuales fortalecían la conducta (incrementaban su tasa de respuesta) y los otros dos debilitaban el comportamiento (decrementaban su tasa). A los procedimientos que fortalecían la conducta los denominó reforzadores, y a los que la debilitaban, castigo.

Si bien se tratarán estos dos temas citados, a lo largo del trabajo, se le concederá primordial importancia al de castigo, a razón de ser en motivo de esta revisión teórica.

Existen dos tipos de procedimientos de reforzamiento. En el reforzamiento positivo, a una respuesta le sigue la aparición o el incremento en la intensidad de un estimulo. Comúnmente buscado por el organismo, se le llama reforzador positivo. Sin embargo, Skinner (1953) observó que “la única característica definitoria de un estímulo reforzador es que refuerza”. En otras palabras, un reforzador se define por sus efectos sobre la conducta. Para distinguir entre reforzamiento negativo y castigo, se debe recordar que los procesos de reforzamiento, incluyendo el reforzamiento negativo, hacen más probable que la conducta ocurra, mientras que ambos tipos de castigo hacen menos probable que la conducta suceda.

Esta confusión de términos y algunas otras imprecisiones conforman el objetivo principal de esta revisión teórica, que pretende formar parte relevante dentro del material bibliográfico de consulta.

CONDICIONAMIENTO OPERANTE

La ley del efecto de Thorndike engloba todo lo que puede ser llamado condicionamiento operante e incluso como se menciono anteriormente, al tema principal de este trabajo, el castigo.

La posibilidad de una respuesta depende de sus efectos en el ambiente.

La definición técnica del condicionamiento operante responde fielmente a lo citado, la conducta está en función de los eventos ambientales (ya sean antecedentes o consecuentes), y de esta forma la determinan.

A esta relación se le llama contingencia , y la comprenden los tres siguientes componentes:

  • Eventos antecedentes

  • Conducta

  • Eventos consecuentes

Donde los eventos antecedentes se refieren a los estímulos anteriores a la conducta, como instrucciones, gestos, etc. Las conductas de refieren a los actos en si mismos (esto es, alguna respuesta que realiza el individuo), las consecuencias se refieren a los eventos que precede la conducta (Kazdin, 1996).

Por lo tanto, para que una consecuencia determinada altere una conducta particular, debe ser contingente a la ocurrencia de la conducta. Esto es, la ocurrencia y ejecución de cierta conducta está en función directamente de determinada consecuencia, y se puede ejemplificar de la siguiente manera:

Supóngase que un niño sediento bebe agua del grifo, y esto le provoca malestar estomacal, la posibilidad de que el nuño vuelva a beber agua del grifo es mínima. En el ejemplo, el antecedente es la sensación de ser, la conducta es beber agua del grifo, y las consecuencias el malestar estomacal, la posible conducta posterior sería no volver a beber agua del grifo.

Toda esta cadena de eventos se puede descomponer en un eslabón básico, es la formula del condicionamiento operante:

Lo cual quiere decir, que una respuesta dada por el que esta aprendiendo conduce a alguna forma de estimulo reforzante.

Volviendo al ejemplo del niño sediento, si el beber agua del grifo no le hubiera provocado malestar estomacal, en ocasiones posteriores , cuando de nuevo sintiera sed, volvería a beber agua del grifo; o dicho en los términos que estamos tratando, la conducta de beber del grifo ha sido reforzada.

Skinner (1938,1953), identifico cuatro procedimientos operantes, dos de ellos para acrecentar la ocurrencia (tasa de respuestas) de una conducta , y dos para decrementarla. A los que fortalecían la conducta los denomino reforzadores, y a los que la debilitaban, castigo. Estos son dos de los tres procedimientos básicos del condicionamiento operante, reforzamiento, castigo y extinción; distintos por definición, pero estrechamente relacionados.

Principio

Característica

Efectos sobre la Conducta

Reforzamiento

Presentación o retirada de un acontecimiento después de una respuesta.

Aumenta la frecuencia de la respuesta.

Castigo

Presentación o retirada de un acontecimiento después de una respuesta.

Disminuye la frecuencia de la respuesta.

Extinción

Cese de la presentación de un acontecimiento reforzante después de una respuesta.

Disminuye la frecuencia de la respuesta anteriormente reforzada.

 REFORZAMIENTO

El principio del reforzamiento se refiere a un incremento en la frecuencia de una respuesta cuando a esta respuesta le siguen ciertas consecuencias. La consecuencia que procede a la conducta debe ser contingente a la misma. Un evento contingente que incrementa la frecuencia de una conducta se conoce como reforzador (Kazdin, 1996).

Los reforzadores se dividen en dos categorías según su procedimiento:

  • Reforzador positivo. Presentación de un estímulo reforzador después de la ocurrencia de una respuesta determinada.

  • Reforzador negativo. Remoción (retiro) de un estímulo aversivo después de la realización de una respuesta determinada.

Hay que recordar que independientemente del procedimiento, los dos tipos de reforzadores, aumentan la tasa de respuestas, los reforzadores negativos y positivos constituyen los dos tipos de eventos que pueden utilizarse para incrementar la frecuencia de una respuesta (Skinner, 1953). Así pues, los reforzadores positivos son eventos que se presentan después de una respuesta desempeñada y que incrementa la frecuencia de la conducta a la que le siguen. Por lo tanto un reforzador positivo se define por su efecto sobre la conducta.

Igualmente, un reforzador negativo también se define por su efecto sobre la conducta, aunque difiere conceptualmente por lo siguiente: el reforzamiento negativo se refiere al incremento en la frecuencia de una respuesta al retirar un evento aversivo inmediatamente después de que se ha realizado la conducta deseada; si bien, hay que aclarar que cualquier tipo de evento displacentero o desagradable no es necesariamente un reforzador negativo, un evento es un reforzador negativo solo si su retiro después de una respuesta incrementa la ejecución de la misma (Skinner, citado en Chance, 1995).

Si bien, siguiendo una línea lógica, es congruente citar el tema de castigo antes que la extinción, pero recordando que el tema primordial de este trabajo, es precisamente el de castigo, se pospondrá hasta más adelante, donde se tratara más profundamente.

EXTINCIÓN.

La extinción, en su simplicidad teórico-conceptual sería así: cese de reforzamiento de una respuesta, y por consiguiente, y siendo congruentes con los temas anteriormente citados, esto provocaría una reducción drástica o completa eliminación de una respuesta determinada. En la extinción, ninguna consecuencia sigue la respuesta; un evento no ser retira ni se presenta. En el castigo (como se detallara posteriormente), un evento aversivo sigue a una respuesta o algún evento positivo se retira. En la vida diaria , la extinción generalmente consiste en ignorar una conducta que anteriormente se había reforzado con atención (Kazdin, 1996).

La extinción, puede emplearse como una técnica para reducir o eliminar la conducta, sin embargo, deben identificarse los elementos que la refuerzan, de manera que pueda prevenirse que se presenten después de la respuesta.

COMPARACIÓN ENTRE PROCEDIMIENTOS PAVLOVIANOS Y OPERANTES

La diferencia primordial entre el condicionamiento operante y el condicionamiento Pavloviano reside en que el apareamiento de estímulos (el EC y el EI), es realizado en el aprendizaje Pavloviano, mientras que en el aprendizaje operante se aparean respuestas y estímulos. En el condicionamiento Pavloviano, un estímulo (EI) sigue a otro (EC); en el operante, un estímulo (evento reforzante o castigante), sigue a la respuesta. Debido a esta diferencia en el procedimiento, a los condicionamientos Pavloviano y operante se les llama con frecuencia condicionamientos E-E y R-E, respectivamente.

Otras diferencias serían:

  • En el condicionamiento Pavloviano, un estímulo antecedente (EC) evoca una respuesta. En el condicionamiento operante los estímulos antecedentes únicamente establecen la oportunidad para responder.

  • El Pavloviano abarca una conducta involuntaria o refleja. El operante comprende una conducta voluntaria (no refleja).

  • El Pavloviano abarca una conducta mediada por el sistema nervioso autónomo (involuntario), los músculos lisos y las glándulas, mientras que el operante implica una conducta mediada por el sistema nervioso voluntario y los músculos esqueléticos.

CASTIGO

Como ya se menciono, Skinner identifico cuatro procedimientos operantes, dos que incrementaban la taza de respuestas (fortalecían la conducta) y dos que decrementaban la tasa de respuestas (debilitaban la conducta). Este apartado se concederá a los procedimientos que decrementan la tasa de respuestas, es decir, el castigo.

Cotidianamente, el termino castigo alude una penalización impuesta por la realización de un acto particular, generalmente opuesto al que se desea, sin embargo, el concepto técnico de castigo dentro del contexto psicológico, responde a otra lógica.

El castigo es la presentación de un evento aversivo o el retiro de un evento positivo que procede a una respuesta, provocando un decremento en su frecuencia (Kazdin, 1996).

Esto último es de suma importancia, porque distingue al término y a sus procedimientos de un tema fundamental dentro de condicionamiento operante, el reforzamiento.

Es un hecho que para los que se inician en el condicionamiento operante les resulte confuso e incluso traten indistintamente estos dos conceptos o incluyan uno dentro del otro, lo que los define y diferencia es su efecto sobre la conducta. Mientras que uno aumenta la frecuencia de está (reforzamiento), el otro la decrementa (castigo); resulta verdaderamente pertinente el esclarecimiento de esta confusión.

El castigo no necesariamente ocasiona dolor o coerción física, tampoco representa una forma de retribución o pago por una mala conducta, ya que a veces se emplea en la vida diaria independientemente de sus efectos sobre la conducta subsecuente. Un ejemplo claro de esto último lo proporciona Kazdin, a los niños que se portan mal se les “enseña una lección”, haciéndolos pasar por un sacrificio de alguna naturaleza. De manera semejante, los criminales pueden recibir penalizaciones que no siempre decrementan la frecuencia de sus actos delictivos, el castigo en el sentido técnico, al igual que el reforzamiento, se define por su efecto sobre la conducta, aunque en un sentido totalmente opuesto al del reforzamiento. El castigo resulta operativo solo si se reduce la frecuencia de una respuesta. De igual manera, un evento castigante se define por su efecto supresor sobre la conducta.

Existen dos tipos de procedimientos de castigo. En el castigo tipo 1, a una respuesta le sigue la aparición de un estímulo aversivo. La presentación de un estímulo aversivo dependiente y contingente a la ocurrencia de una operante (castigo), puede ser administrado de las siguientes maneras:

  • Una operante que nunca ha sido reforzada.

  • Una operante que está siendo mantenida por reforzamiento.

  • Una operante que está siendo extinguida.

En el castigo tipo 2, la conducta es seguida por la remoción de un reforzador positivo, es decir, se le retira un reforzador positivo después de de una determinada respuesta, en vista de que la respuesta “tiene un precio”, a menudo se le llama costo de la respuesta.

Como el castigo produce una disminución de las respuestas, sólo se puede estudiar superponiéndolo a un nivel adecuado de respuestas (Catania, 1982). Sin embargo, aunque parezca contradictorio, cuando el castigo se utiliza como estímulo discriminativo no produce una deducción en la tasa de respuestas. Supóngase que sólo se castiga la respuesta en aquellas ocasiones en que también se le refuerza, y que no se le castiga cuando no se le refuerza. Dentro de ésta situación, el castigo se convertirá en un estímulo discriminativo. Como consecuencia, la tasa de respuestas será alta en presencia del castigo.

Como ya se mencionó, son diferentes los efectos del reforzamiento y del castigo, pero poseen cierta propiedad paralela, ambos fenómenos se definen conforme a la probabilidad subsecuente de respuestas que son seguidas por estímulos particulares. En cualquier caso, tanto el castigo como el reforzamiento, son más efectivos cuando son inmediatos que cuando son demorados. El castigo intenso puede producir supresión muy duradera, pero las respuestas aumentan de modo característico en la recuperación, cuando se suspende el castigo, de la misma manera que las respuestas decrecen en la extinción, cuando se suspende el reforzamiento.

Holz y Azrin, en 1963, fueron de los primeros en estudiar el castigo como un proceso conductual fundamental, más que como un procedimiento derivado de otros procesos, en uno de sus experimentos, reforzaba la respuesta de picoteo de pichones después de transcurrido un tiempo mínimo a partir de la última respuesta. Para decrementar la tasa de respuestas, se emplearon separadamente castigo, saciedad, extinción y cambio de estímulo, buscando comparar el efecto de éstos diferentes procedimientos reductores sobre la respuesta, manteniendo un programa que refuerza diferencialmente las tasas bajas de respuestas (RDB). Al comparar los efectos encontraron que el castigo produjo una reducción de respuesta más inmediata, completa y duradera que los otros procedimientos.

El castigo parece capaz de reducir respuestas a tal grado y con tal velocidad e irreversibilidad, que no es igualado por ninguno de los procedimientos de cambio del estímulo, saciedad o extinción.

En otro experimento realizado por Nathan Azrin en 1956, en donde se analizan los efectos de dos programas intermitentes de castigo inmediato y no inmediato. Explican que el condicionamiento instrumental, al administrar el choque está relacionado de alguna manera con la respuesta dada por el sujeto (evitaciòn, escape, castigo). En éste experimento, se utilizaron cinco pichones a los cuales se les programó los choques y se les administraron de acuerdo a cuatro procedimientos diferentes durante la presentación de una tecla anaranjada.

  • un programa de choque de intervalo fijo, pero sin correlación entre la respuesta y el choque.

  • un programa de intervalo fijo de choque con correlación entre choque y respuesta.

  • un programa de choque de intervalo variable sin correlación entre respuesta y choque, aunque difiere con el primero en que los choques se administraron después de intervalos variables en lugar de intervalos fijos.

  • un programa de choque de intervalo variable con correlación entre la respuesta y el choque. Aquí, los choques se programaron para ser administrados a intervalos variables durante la presentación del color anaranjado.

  • Ésta investigación se dirigió parcialmente solo al problema de si el castigo inmediato es más o menos efectivo que el castigo no inmediato. Los resultados obtenidos confirmaron que el castigo inmediato es más eficaz que el no inmediato para reducir el numero de respuestas dadas durante el periodo del estímulo de aviso, sin importar que los choques fueron programados a intervalos fijos o intervalos variables.

    En el campo de investigaciones en humanos utilizando castigo tenemos:

    R--E