Psicología de la educación

Conducta provocada. Habituación y sensibilización. Fundamentos del condicionamiento clásico e instrumental. Mecanismos. Programas de reforzamiento y conducta de elección

  • Enviado por: Akane
  • Idioma: castellano
  • País: España España
  • 15 páginas

publicidad
cursos destacados
Iníciate en LOGIC PRO 9
Iníciate en LOGIC PRO 9
Vamos a ver de manera muy sencilla y en un breve paseo de poco más de una hora como funciona uno de los...
Ver más información

Graba audio con Apple Logic Pro 9
Graba audio con Apple Logic Pro 9
En este curso aprenderemos a realizar grabaciones de audio de calidad utilizando Apple Logic Pro 9. Exploraremos todo...
Ver más información


TEMA 2: CONDUCTA PROVOCADA. HABITUACIÓN Y SENSIBILIZACIÓN

Naturaleza de la conducta provocada

Todos los animales o seres humanos complejos reaccionan a los acontecimientos de su medio, buena parte de la conducta tiene lugar en respuesta a estímulos, por lo tanto, és provocada.

Concepto de reflejo

El reflejo implica dos sucesos estrechamente relacionados: un estimulo provocador y su respuesta correspondiente. El estimulo y la respuesta están vinculados ( la respuesta siempre se sigue tras la presentación del estimulo) y casi nunca tiene lugar uno en ausencia del otro.

La especificidad de la relación entre el estimulo y su respuesta refleja asociada és consecuencia de la organización del sistema nervioso.

El estimulo ambiental para un reflejo activa una neurona sensorial (neurona aferente) que comunica el mensaje sensorial a la médula estinal, de ahí, los impulsos nerviosos se transmiten a la neurona motora ( neurona eferente) que activa los musculos asociados a la respuesta. Las neuronas sensoriales y motoras sueles transmitirse a traves de interneuronas, una respuesta refleja particular és provocada solo por una limitada serie de estimulos.

La neurona aferente, le nuerona eferente y la interneurona forman el Arco Reflejo.

Patrones de accion modal (PAM)

Las secuencias de respuesta caracteristicas de una especie en particular son denominadas patrones de accion modal. Una caracteristica importante de los PAM és que el umbral para provocar tales actividades varía mucho en función de las circunstancias. El mismo estimulo puede tener efectos muy distintos, dependiendo del estado fisiologico del anhimal y de sus acciones recientes.

Estimulos provocadores para PAM

El estimulo provocador és muy facil de identificar en casos de reflejos simples. En cambio, el estimulo responsable de un PAM resulta mucho más dificil de reconocer, en especial, si la respuesta transcurre durante un proceso de interaccion social..

Basta con un estimulo signo o desencadenador para provocar un PAM. NO obstante, a un patron de accion determinado pueden controlarlo varias caracteristicas estimulo de manera aditiva. Asimismo, el estimulo más eficaz para generar un PAM puede no ser el que ocurre en condiciones naturales. Format un estimulo más efectivo que el natural en la provocacion del patron de accion se denomina estimulo supranormal.

Funcion de retroalimentación de respuesta en la conducta provocada.

Las respuestas por lo general tienen determinadas consecuencias estimulo, el estimulo resultante de una respuesta en particular se denomina estimulo de retroalimentación para tal respuesta.

Los estimulos de retroalimentación pueden surgir de fuentes internas o externas al organismo. Las claves de retroalimentación interna las proporcionan neuronas sensoriales que permiten que el animal sienta el musculo y los movimientos articulatorios asociados a la realizacion de tal respuesta, estas claves de retroalimentacion internas se llaman estimulos propioceptivos.

Conducta provocada independiente de los ee de retroalimentación ...

Presencia o ausencia del ee provocador como retroalimentación: una respuesta provocada puede mantener al animal en contacto o alejarlo del ee provocador. Cualquiera de estos sucesos de retroalimentación que tenga lugar determina considerablemente la futura incidencia de la respuesta. La retroalimentación que implica la presencia o ausencia del estimulo provocador és muy importante en el control de los movimientos de locomoción reflejos. En una clase de locomoción refleja, el estimulo provocador produce un cambio en la velocidad de movimiento (o de giro) independientemente de la dirección, tal locomocion se denomina cinesis.

La cinesis produce movimientos en direccion o contradireccion de un estimulo como resultado indirecto de cambios en la tasa de movimiento aleatorio desencadenado por ese estimulo. En otro tipo de proceso de locomocion refleja, el estimulo crea directamente movimientos hacia o en contra de este, este tipo de locomoción se llama taxis, yu se identifica por la naturaleza del estimulo provocador y por el hecho de si el movimiento és a favor o en contra de este.

Estos movimientos en apariencia dirigidos a una meta son resultado de respuestas reflejas regidas por claves de retroalimentación que involucran la presencia o ausencia del estimulo provocador. El movimiento de locomocion y orientación persiste siempre que la retroalimentación de respuesta implique contacto continuo con el estimulo provocador, el movimiento cesa cuando la respuesta aleja al organismo de dicho estimulo.

Respuestas provocadas y dirigidas por ee distintos: ....

Conceptos de habitación y sensibilizacion

Se hace referencia a las disminuciones en la responsividad generadas por estimulacion repetida como efectos de habituación. Los aumentos se denominan efectos de sensibilización.

Habituación o adaptación sensorial y fatiga de respuesta

La caracteristica clave de los efectos de la habituación és una disminucion en la respuesta que inicialmente ha sido provocada por un estimulo. Sin embargo, no todos los casos en los que cada una de las repeticiones tiene por resultado una disminucion de la respuesta respresentan habituación.

Un reflejo consiste en tres componentes:

  • un estimulo que activa uno de los organos sensoriales, lo que genera impulsos nerviosos sensoriales que se transmitesn al sistema nervioso central

  • transmision de los mensajessensoriales a traves de interneuronas a los nervios motores

  • impulsos nerviosos de los nervios motores que activan los musculos que crean la respuesta observada.

  • Impedimentos para la habituación:

  • adaptacion sensorial - disminucion de la sensibilidad

  • fatiga

  • En la habituación, el organismo deja de responder a un estimulo aun cuando siga siendo completamente capaz de sentirlo y hacer los movimientos musculares necesarios para responder. En los estudios sobre habituación, se descarta la adaptacion sensorial por medio de preubas de que la habituación és especifica de la respuesta. Se descarta la fatiga de respuesta como causa de la habituación por medio de pruebas de que la habituación és especifica del estimulo. Una respuesta habituada se recuperará rapidamente si introducimos un nuevo estimulo.

    Tª del doble proceso de habituación y sensibilización

    Esta tª supone que distintos tipos de procesos nerviosos subyacentes son responsables de aumentos y disminuciones en la receptividad a a la estimulación. Un proceso nervioso produce disminución en la responsividad, se denomina proceso de habituación , hay otro proceso que genera aumentos en la responsividad, el proceso de sensibilizacion. Ambos procesos no son excluyentes y en cambio, pueden activarse a la vez. El resultado conductual dependera de cual sea mas fuerte.

    La diferencia entre efectos y procesos en la habituación y sensibilizacion és analoga a la diferencia entre ejecución y aprendizaje, los efectos hacen referencia a la conducta observable mientras los procesos se refieren a mecanismos subyacentes.

    Groves y Thomson sugirieron que estos procesos tienen lugar en distintas partes del sistema nervioso, se supone que los procesos de habituación tienen lugar en el denominado sistema E-R, compuesto por la corta vía nerviosa que conecta los organos sensoriales activados por el estimulo y los musculos asociados con la emision de respuesta. Los procesos de sensibilizacion tendrian lugar en el sistema de estado, constituiodo por otras partes del sistema nervioso que determinan el nivel gral del organismo de responsividad o disposición a responder.

    El sistema de estado determinara la disposicion para responder, mientras el de E_R permite que el sujeto de la respuesta especifica provocada por el estimulo de interés.

    Caracteristicas de la habituacion y sensibilizacion

    Curso temporal

    La mayor parte de las formas de cambio de la conducta se conserva por largos periodos, este és uno de los rasgos definitorios de los fenomenos de aprendizaje. Hay casos de habituación y sensibilizavion que no siempre tienen esta caracteristica.

    Transcurso temporal de la sensibilizacion: en todos los sistemas de respuesta, la duracion de sus efectos la determina la intensidad dsel estimulo sensibilizador.

    Transcurso temporal de la habituación: hay dos tipos cualitativamente distintos de efectos de habituación:

  • habituación a corto plazo

  • habituación a largo plazo.

  • Especificidad del estimulo

    En la habituación. Una respuesta habituada a un estimulo puede suscitarse con toda su fuerza por medio de un nuevo estimulo provocador. Luego de una habituación completa de la respuesta de orientación a un estimulo, este tendra lugar con su fuerza habitual si se presenta un estimulo novedoso

    En la sensibilizacion, no és muy especifica al estimulo,

    Efectos de los estimulos externos fuertes

    Modificar la naturaleza del estimulo provocador genera la recuperacion de la respuesta habituada, esta tambien puede recuperarse si se sensibiliza al organismo por exposicion a un estimulo externo, fenomeno que se llama deshabituación , que hace referencia a la recuperacion de la respuesta al estimulo habituado previamente.

    Cambios en las respuestas emocionales complejas

    Patron estandar de la dinamica afectiva

    Este patron describe lo que sucede cuando se presenta y retira un estimulo que suscita emociones. La aparicion del estimulo que suscita emocion, provoca una fuerte respuesta emocional que en breve alcanza el punto máximo. Esta reaccion pico és seguida por una fase de adaptacion durante la cual la respuesta emocional logra un estado estable, el estimulo continua provocando la emocion pero a un nivel inferior al pico. Cuando cesa el estimulo el estado emocional cambia rapidamente a sentimientos contrarios a los de la reaccion pico. Esta inversion del estado emocional llamada post-reaccion afectiva decrece gradualmente y el organismo vuelve a su estado de linea de base.

    TEMA 3: FUNDAMENTOS DEL CONDICIONAMIENTO CLÁSICO

    Aprender a anticipar acontecimientos en el medio y qué estimulos suelen ocurrir juntos son formas importantes para una mejor coordinación de la conducta en el medio.

    El mecanismo por medio del cual aprenden los organismos las relaciones entre estimulos y llegan a modificar su comportamiento és lo que se conoce como condicionamiento clásico, el cual permite que aprovechen la secuencia ordenada de acontecimientos en el medio y aprendan que estimulos suelen acompañar a determinados hechos.

    Los primeros años del condicionamiento clásico

    Los estudios sistematicos del condicionamiento clásico comenzaron con la obra del psicologo ruso Ivan Pavlov, sus estudios sobre este tipo de condicionamiento fueron una extensión de sus investigaciones acerca del proceso de digestión, ya que consideraba la intervención de los mecanismos psíquicos en la fisiología de la persona.

    Descubrimientos de Wolfshon y Snarsky

    Wolfshon estudió las respuestas salivales a diversas sustancias colocadas en el hocico de los perros, Snarsky amplió estas observaciones a las sustancias artificiales.

    Las sustancias probadas por ambos investigadores tenian caracteristicas estimulantes tanto visuales como orosensoriales.

    Paradigma del condicionamiento clásico

    El procedimiento de Pavlov implicaba dos estimulos, uno de los cuales era un tono o una luz, el otro estimulo era una solución acida colocado en el hocico del animal. Pavlov se refería al tono o a la luz como estimulo condicional porque la eficacia de éste en la provocación de la salivación dependia de parearlo varias veces con la presentación del alimento. El alimento era llamado estimulo incondicional .

    La salivación generada por el EC era llamada respuesta concional, y lo que se provocaba siempre por medio del alimento se llamaba respuesta incondicional.

    Así, los estimulos y respuestas cuyas propiedades y ocurrencia no dependian de entrenamiento previo eran denominados “incondicionales”.

    Situaciones experimentales

    Seguimiento de señales

    És posible solo cuando se localiza el estimulo condicionado y, por consiguiente, el sujeto puede aproximarse y “seguirlo”. És una tecnica util para investigar como se aprenden las asociaciones entre un estimulo y otro. El aprendizaje avanza más rapido cuando se presenta el EC justo antes del EI.

    Condicionamiento de temor.

    El temor condicionado se determina en forma indirecta al medir como afecta el EC a la actividad que el animal lleva a cabo. Una tecnica popular de medicion indirecta de temor condicionado és la denominada respuesta emocional condicionada (REC) o supresión condicionada, que se mide de manera cuantitativa por medio de una razón:

    Razon de supresión= respuestas durante el EC/ (respuestas durante el EC+respuestas previas al EC)

    La razón de supresión tiene un valor de 0 si el sujeto deja de producir respuestas durante el EC. Si el sujeto no altera su tasa de respuestas tienen un valor de 0`5.

    Condicionamiento palpebral

    Aprendizaje de aversion al sabor

    Condicionamiento pavloviano excitatorio

    Durante el condicionamiento excitatorio, los organismos aprenden a establecer una asociación entre EC y EI, la presentación del EC activa procesos relacionados con el EI, estos procesos son responsables de las RC que se observan.

    Procedimientos comunes del condicionamiento pavloviano

    Uno de los factores que determina el curso del condicionamiento clásico és la relación temporal relativa del EC y el EI. Cada configuración del EC y el EI representa un ensayo de condicionamiento único.

    En un experimento de condicionamiento característico, se repiten los episodios del EC y el EI en una o más sesiones de entrenamiento. El tiempo que transcurre desde el final de un ensayo de condicionamiento al comienzo del siguiente se llama intervalo entre ensayos. El tiempodesde el inicio del EC hasta el comienzo del EI durante un ensayo se denomina intervalo EC-EI

    1. demora breve: implica retrasar el comienzo del EI ligeramente luego del inicio

    del EC en cada ensayo. La caracteristica fundamental és que el EC empieza cada ensayo, y el EI se presenta después de una breve demora. El EC puede continuar durante el EI o no.

    2. de huella: el Ei sucede luego del EC, no se presenta el EI sino poco tiempo después de que terminó

    el EC. Esto deja entre el EC y el EI un lapso denominado intervalo de huella.

    3. demora larga: el Ei se retarda mucho más, no hay intervalo de huella, el EC permanece poco después

    de que sucede el EI.

    4. simultáneo: presentación de ambos estimulos a un tiempo.

    5. retroactivo: el EI se da antes que el EC.

    Medición de respuestas condicionadas

    Se suele hacer mediante la aplicación de un ensayo de prueba, que consiste en presentar el EC solo, pudiendo observar asi las respuestas generadas por este sin la influencia del EI. El comportamiento durante la presentación del EC puede cuantificarse de varias maneras:

  • magnitud de la RC

  • energia de respuesta (qué tan a menudo provoca el EC una RC)

  • probabilidad de respuesta

  • latencia de RC (cantidad de tiempo entre el comienzo de EC y la incidencia de RC)

  • procedimientos de control del condicionamiento clasico

    Para estar seguros de que un procedimiento de condicionamiento és responsable de ciertos cambios en el comportamiento, tales modificaciones deben compararse con los efectos de un procedimiento de control. La comparación o preocedimiento de control consistia en que no hubiese exposición previa al estimulo. Una asociación entre EC y Ei implica que los dos hechos se han relacionado de alguna manera. Luego de establecer una asociación, el EC puede activar procesos relacionados con el EI.

    Los casos en que la exposicion al EI solo genera respuestas como la RC se denominan pseudocondicionamiento

    Presentar EC y EI en un orden aleatorio uno respecto del otro se llama procedimiento de control aleatorio.

    Un procedimiento de control exitoso implica la presentación de los EC y EI en ensayos por separado, tal tecnica se denomina control explicitamente no pareado , en esta el EC y el EI se presentan con bastante tiempo de por medio para evitar asociación.

    Eficacia de los procedimientos de condicionamiento comunes

    • demora breve: és el más efectivo. Un aumento en el intervalo EC-EI facilita la RC hasta cierto punto, los incrementos adicionales en el intervalo producen una disminución en la RC.

    • De huella: el EC también comienza poco antes del EI, son evidentes menos respuestas si aumenta el intervalo entre estimulos. En ciertas circunstancias este procedimiento da por resultado una inhibición más que una excitación de la RC. Se facilita el condicionamiento de huella cuando el lapso entre estimulos se rellena con otro estimulo, pues vuelve el EC más memorable.

    • Demora larga: por lo general, no és efectivo. Pavlov descubrió un efecto desacostumbrado que denominó inhibición de demora , que hace referencia al retardo de la RC al final del intervalo EC-EI.

    • Simultáneo: no és tan efectivo en la generación de RC como el de demora breve. Las RC reflejan una anticipación del organismo al EI. Como ambos estimulos se presentan a la vez, no tiene lugar la conducta condicionada anticipatoria.

    • Retroactivo: los factores que determinan el resultado de este proceso siguen sin entenderse bien. Los efectos parecen haber sido influidos por el numero de ensayos que se realizan, la naturaleza de las presentaciones del EI, el intervalo entre ensayos y el procedimiento de valoración del aprendizaje utilizado.

    Condicionamiento pavloviano inhibitorio.

    La inhibición condicionada no és el opuesto a la excitación condicionada, pero sirve para contrarestarla. Esta supresión és evidente en niveles disminuidos de respuesta excitatoria condicionada. La inhibición por lo comúnse determina de manera indirecta midiendo la supresion de la respuesta excitatoria.

    Procedimientos para el condicionamiento inhibitorio

    El condicionamiento excitatorio és resultado de procedimientos en los que el EC se parea con el EI o se presenta justo antes de este, en los procedimientos de condicionamiento inhibitorio, el EC se presenta en ausencia del EI o indica que este no tendrá lugar. Para que la ausencia del EI sea un suceso significativo, el EI tiene que darse de manera periodica en la situación.

    El condicionamiento inhibitorio de la conducta tiene lugar solo si hay un contexto excitatorio para el EI en cuestion.

    • procedimiento estándar para la inhibición condicionada: implica dos estimulos condicionados y dos clases de ensayos de condicionamiento, una para el excitatorio y otro para el inhibitorio. El EI se presenta en ensayos de condicionamiento excitatorio y cuando tiene lugar el eI, lo anuncia el EC+. Por sus pareamientos con EI, EC+ se vuelve una señal para EI. Durante los ensayos de condicionamiento inhibitorio, el EC+ se presenta junto a EC-, y el EI no ocurre, Así, el EC- se convierte en un inhibidor condicionado.

    • Inhibición diferencial: el EI se presenta en algunos ensayos, y su incidencia siempre és anunciada por EC+. En otros ensayos, EI no tiene lugar, y el organismo solo recibe EC-

    • Contingencia o correlación negativa EC-EI: significa que és menos probable que el EI suceda luego de EC que en otro momento. El EC indica una reduccion de la probabilidad de que tenga lugar el EI.

    Medicion de la inhibicion concdicionada

    • Sistemas de respuesta bidireccionales: la identificación de tendencias de respuesta opuestas es sencilla con sistemas de respuesta que puedan cambiar en direcciones contrarias a partir del desempeño de la línea base.

    • Prueba del estimulo compuesto o de sumación: presentación de un estimulo excitatorio condicionado que provoque la respuesta condicionada. La inhibición condicionada se mide entonces en términos de la reducción o inhibición de tal respuesta. La prueba implica los efectos de un EC inhibitorio en combinación con un EC+ excitatorio.

    • Prueba de retardo de la adquisición: si un estimulo inhibe de manera activa una respuesta, será especialmente difícil condicionarlo para provocar la conducta. La tasa de adquisición de una RC excitatoria podría retrasarse si el EC es un inhibidor condicionado.

    Extinción

    El EC se presenta de manera repetida, sin que medie el EI. La pérdida de la RC que tiene lugar como consecuencia de la extinción no és la misma que ocurre a causa del olvido. La extinción és producida por presentaciones repetidas del EC mismo.

    Extinción y habituación

    Ambas comprenden presentaciones repetidas de un estimulo. La diferencia fundamental entre ambas és que, en la extinción, el estimulo involucrado se ha condicionado de antemano. En la habituación el estimulo recupera su efectividad en la provocación de la respuesta con el tiempo, a este fenomeno se le denomina recuperación espontánea de la habituación.

    En la extinción, si después de una serie de ensayos se presenta un estimulo nuevo puede suceder una recuperación de la respuesta al EC extinto, esta recuperación producida por la novedad se denomina deshinibición.

    Aprendizaje implicado en la extinción

    La extincion implica un cambio en la conducta (perdida de responsividad a un estimulo) como resultado de la experiencia (presentaciones repetidas del EC).

    Pavlov postuló que durante la extinción, los sujetos aprenden de algun modo a inhibir su emision de la RC al EC. Según esta idea, la extinción no implica el desaprendizaje de la asociación original sino la adquisición de un nuevo proceso inhibitorio que previene la aparición de la RC.

    TEMA 4: MECANISMOS DEL CONDICIONAMIENTO CLÁSICO

    Que hace eficaces a los estimulos condicionado e incondicionado?

    Respuesta inicial a los estimulos

    El EC no provoca inicialmente la RC, pero llega a hacerlo como resultado de que se le asocie con el EI. Este ultimo és eficaz en la provocación de la respuesta objetivo sin ningún entrenamiento especial. La identificación de los potenciales estimulos condicionados e incondicionados exige que se compare las respuestas provocadas por cada estimulo antes del condicionamiento. Tal comparación hace que la identificación de dichos estimulos sea relativa

    Novedad de los estimulos condicionado e incondicionado

    El impacto conductual de un estimulo depende de su novedad. Si el EC o el Ei és muy familiar, el aprendizaje avanza de manera más lenta que si ambos fuesen nuevos. Las investigaciones de la función de la novedad en el condicionamiento clásico se generan en dos fases, en la fase inicial el que será el EC se presenta solo. Tras la familiarización con el estimulo, el EC se parea con un EI mediantetecnicas convencionales de condicionamiento. La familiarización inicial retrasa el condicionamiento subsecuente, fenomeno que se denomina efecto de inhibición latente.

    La función del efecto de preexposición al Eces parecida a la de la habituación, ambos sirven para limitar el procesamiento y atención a estimulos que han probado ser intrascendentes. La habituación sirve para sesgar la conducta provocada a favor de los estimulos nuevos, y la inhibición latente para influir en el aprendizaje en beneficio de los nuevos estimulos.

    Los experimentos que abordan el tema de la novedad del EI, se dan de forma similar: en la primera fase se presenta el EI solo, pareandolo después con el EC y se observa el aprendizaje. Los sujetos familiarizados con el EI son mas lentos en desarrollar respuestas condicionadas al EC.

    Intensidad del EC y el EI

    La asociación de un EC con un EI se da de manera más rápida, y el nivel final de las respuestas es mayor cuando se aplican estimulos más intensos. El hecho de que el condicionamiento se facilite mediante el aumento de la intensidad puede relacionarse con la novedad de los estimulos. Los organismos pocas veces se emncuentran con estimulos de elevada intensidad, por lo tanto, los EC y EI con esta caracteristica pueden ser considerados novedosos.

    Concepto de fuerza biológica

    Pavlov propuso que para que un estimulo se condicionara, tenia que ser de menor fuerza biológica que el EI con que se pareaba. Por “menor fuerza biológica” entendía que el EC inicialmente provocaba respuestas menos numerosas y mas debiles que el EI.

    Condicionamiento de orden superior: un estimulo puede servir como EI luego de que ha sido fuertemente condicionado. El condicionamiento de orden superior opera a diferentes niveles.

    EJ:

  • condicionamiento de 1er orden: tono con alimento

  • condicionamiento de 2º orden: luz ccon el tono...

  • El procedimiento para el condicionamiento de 2º orden sería el pareamiento de un EC con un EI, y un segundo EC con el primer tono. Con unos cuantos ensayos de condicionamiento, tiene lugar el condicionamiento de 2º orden excitatorio, con un amplio entrenamiento, se desarrolla la inhibición condicionada.

    La existencia de un condicionamiento de 2º orden aumenta el margen de situaciones en las que puede tener lugar el condicionamiento clásico. Con condicionamiento de orden superior, el condicionamiento clásico puede darse sin un EI primario, la unica exigencia es que esté disponible un EC de manera previa.

    Contracondicionamiento: dos estimulos pueden asociarse uno con otro, aunque ambos provoquen inicialmente fuertes respuestas. En el contracondicionamiento, la respuesta que da un sujeto a un estimulo se invierte por medio de la asociación de este estimulo con el EI que fomenta el tipo opuesto de reacción.

    Precondicionamiento sensorial: las asociaciones entre dos estimulos tambien pueden aprenderse cuando cada una genera solo una leve respuesta de orientación antes del condicionamiento.

    Fuerza biológica diferencial como variable de ejecución más que como variable de aprendizaje: la fuerza biologica diferencial es importante en casos de aprendizaje por asociación porque permite la observación de efectos de aprendizaje de manera más sencilla. En el precondicionamiento sensorial, los organismos aprenden a asociar dos estimulos inocuos, EC1 y EC2. La asociacion entre ambos se vuelve evidente cuando se hace que uno de los estimulos provoque una fuerte respuesta.

    Que determina la naturaleza de la RC?

    Modelo de sustitucion del estimulo

    Pavlov veía el cerebro como la composición de centros nerviosos diferenciados, propuso que el tanto el EC como el EI dependian de centros cerebrales propios y que un centro diferente es responsable de procesar la respuesta

    En el condicionamiento normal de 1er orden, un estimulo inocuo (EC) se asocia con un acontecimiento biológicamente fuerte (EI). un estimulo más efectivo que el natural en la provocacion deomo no tiene que aprenderse, esta ruta es innata. Pavlov sugirió que el condicionamiento tiene por consecuencia el establecimiento de nuevas y funcionales vias nerviosas. El modelo pavloviano adelanta que la forma general de la RC será similar a la forma de la RI. Por la nueva ruta funcional establecida entre el centro de EC y EI, el estimulo condicionado llega a tener efectos en el sistema nervioso parecidos a los de EI. Es por ello que el modelo se denomina de sustitución del estimulo.

    El EI como factor determinante para la RC: si el condicionamientoconvierte un EC en un EI sucedáneo, el modelo pronostica que los EC con diferentes EI provocarán distintas clases de RC, lo que Dresde luego es cierto.

    Enfoques modernos de la sustitución del estimulo: los investigadores contemporáneos no piensan que el EC se vuelva un sustituto del EI, pero mantienen la idea de que la RC es provocada a guisa de “centro” del EI de alguna manera, porque el EI es claramente un factor determinante en la naturaleza de la RC. El nuevo paradigma establece que los sujetos aprtenden dos cosas de pareamientos repetidos de un EC con un EI:

  • asociación EC-EI

  • se forman una imagen del EI

  • El EC provoca la RC por su asociación con el EI, si la asociación EC-EI o la representación de EI es débil, la RC también será débil.

    Aprendizaje de E-E o de E-R: que el EC provoque o no la RC depende fundamentalmente del estado de la re4presentación de EI. Si el condicionamiento habia establecido una nueva conexión refleja entre el EC y la RC, esta ultima tendrá que presentarse siempre que ocurra EC. El condicionamiento da por resultado una asociacion entre EC y una representación de EI. La presentación de EC activa la representación de EI, y RC es una manifestación de la representación de EI. Este tipo de aprendizaje se llama de Estimulo a Estimulo (E-E). en este tipo de aprendizaje, los organismos aprenden una relación entre 2 estimulos y la RC es una manifestacion indirecta de esta asociación.

    Modelo de respuesta compensatoria

    Se trata de un paradigma homeostásico en cuanto a que ofrece un mecanismo para reducir los efectos perturbadores de los estimulos, el mecanismo fundamental implica la activacion de una respuesta compensatoria u oponente. En la teoría del proceso oponente de la motivación, la respuesta oponente es un efecto tardío del EI. Así en cirto sentido se trata de una RI demorada. En comparación, en el modelo de respuesta compensatoria, la oponente es una reaccion a un EC que se ha asociado con el EI, la respuesta es una RC anticipatoria.

    Cómo se asocian EC y EI?

    El efecto de bloqueo

    Implica establecer una asociación entre un estimulo condicionado (estimulo A) y el EI. Una vez que ECA se ha condicionado, se suma un segundo estimulo (B) al estimulo A durante los ensayos de condicionamiento. La conclusion es que el condicionamiento previo al estimulo A interfiere o bloquea la adquisición de respuestas condicionadas al estimulo B agregado.

    El modelo de Rescorla y Wagner

    La idea de que lo sorpresivo de un EI determina su eficacia en la generación de nuevo aprendizaje fue transformada por estos dos autores en un modelo matematico formal, las implicaciones del concepto de EI sorpresivo se ampliaron a una amplia variedad de fenómenos de condicionamiento.

    De acuerdo con este nodelo, un gran EI inesperadoes la base para el condicionamiento excitatorio o los aumentos del valor asociativo, y un pequeño Ei inesperado lo es para el condicionamiento inhibitorio o para las disminuciones del valor asociativo.

    Rescorla y Wagner supusieron que lo sorpresivo de un EI depende de qué tan diferente sea de lo que espera el individuo. Respuestas condicionadas fuertes indican gran expectación de que ocurra el EI. Estas ideas pueden expresarse de forma matematica utilizando ð para representar la magnitud del EI, y V para representar el valor asociativo de los estimulos que preceden al EI. Lo sorpresivo de Ei será entonces ððV. La idea de que el aprendizaje depende de lo sorpresivo del Ei puede expresarse asi:

    ðV= k ( ð ð V)

    Inhibición condicionada: la aplicación del modelo al procedimiento de condicionamiento inhibitorio estándar exige considerar ensayos reforzados y no reforzados de manera separada. Para anticipar con exactitud EI en ensayos reforzados, EC+ tiene que ganar propiedades excitatorias. El condicionamiento excitatorio implica la adquisición de valor asociativo positivo, y cesa una vez que el organismo adelanta el EI perfectamente en cada ensayo resforzado. En los ensayos reforzados tienen lugar tanto EC+ como EC-, aunque el EI no sucede lo que indica que este es un caso de sobreexpectativa. A fin de predecir la ausencia de Ei en los ensayos no reforzados, el valor asociativo de EC+ y EC- deben sumar cero. Para conseguirlo debemos dar por supuesto que el EC- adquiere valor asociativo negativo.

    Extinción de la excitación e inhibición: la tecnica estandar para la extincion implica la omision del EI en cada ensayo. Si un EC ha adquirido propiedades excitatorias habra una sobreexpectativa del EI al comienzo de la extinción. La expectativa provocada por el EC gradualmente se hará coincidir con la ausencia de EI durante la extincion por medio de la reduccion del valor asociativo de EC+ a cero.

    Para dar expectativas acordes con la ausencia de EI, el valor asociativo negativo del EC- se pierde gradualmente, y el EC- termina con una fuerza asociativa de cero.

    Evaluación del modelo: el modelo pronostica que las presentaciones repetidas de un inhibidor condicionado (EC-) por sí llevaran a una pérdida de la inhibición condicionada, algunos investigadores han descubierto que el no reforzamiento repetido de un EC- puede realzar sus propiedades inhibitorias condicionadas. Un procedimiento efectivo para reducir las propiedades inhibitorias condicionadas de un EC- no implica en absoluto la presentacion del EC-, sino la extincion de las propiedades excitatorias del EC+ con las que se presento el EC- durante el entrenamiento inhibitorio.

    Otro problema es que el modelo de Rescorla y Wagner considera la extinción como reverso de la adquisición, un cerciente cuerpo de pruebas señala que no deberia verse a la extincion simplemente como lo opuesto a la adquisición sino que parece implicar el aprendizaje de una nueva relacion entre el EC y el EI

    TEMA 5: FUNDAMENTOS DEL CONDICIONAMIENTO INSTRUMENTAL

    Al comportamiento que se da por haber sido previamente instrumental en la generacion de ciertas consecuencias se le llama conducta instrumental. Los factores responsables de tal forma de comportamiento son dificiles de aislar sin manipulación experimental.

    Primeras investigaciones del condicionamiento instrumental

    Los analisis de laboratorio y teoricos sobre el condicionamiento instrumental comenzaron con la obra de Thorndike, cuya intencion original era estudiar la inteligencia animal, creo una serie de cajas problema para sus experimentos. Las diferentes cajas problema exigian diferentes respuestas para salir. Para el investigador los resultados de estos estudios reflejaban el aprendizaje por una asociación. La consecuencia de la respuesta exitosa fortalecía la asociacion entre los estimulos de la caja y la respuesta.

    Sobre la base de esta investigación, formuló la ley de efecto que establece que si una respuesta en presencia de un estimulo es seguida por un acontecimiento satisfactorio, se fortalece la asociación E-R, si la respuesta es seguida por un acontecimiento molesto, la asociación se debilita. La consecuencia de staisfaccion o molestia sirve para fortalecer o debilitar la asociación entre la respuesta y la situación estimulo.

    Planteamientos modernos para el estudio del condicionamiento instrumental

    Procedimientos de ensayo discreto

    La respuesta instrumental se ejecuta solo una vez en cada intento. Las investigaciones del ensayo discreto de la conducta instrumental a veces se llevan a cabo en cierto tipo de laberintos, su utilización la intridujo el psicologo estadounidense Small

    La conducta en un laberinto puede cuantificarse midiendo la velocidad con que el animal llega a la meta, lo que se denomina velocidad de carrera, la cual, por lo general aumenta con ensayos de entrenamiento repetidos. Otra medida común de conducta en corredores es la latencia, que es el tiempo que le lleva al animal dejar la caja de inicio y empezar a desplazarse por el corredor.

    Procedimientos de operante libre

    Estos procedimientos permiten que el animal repita la respuesta instrumental “libremente” una y otra vez. El metodo de operante libre fue concebido por Skinner para estudiar la conducta de una manera más continua. Propuso el concepto de operante libre como una forma de dividir la conducta en unidades mensurables significativas.

    Entrenamiento de comedero y moldeamiento: los animales tienen que aprender a reconocer cuando está disponible el alimento en el plato, lo que implica condicionamiento clásico: el sonido del dispositivo de suministro de comida. Tal secuencia de entrenamiento se llama moldeamiento, e implica dos tacticas complementarias:

  • reforzaraproximaciones sucesivas a la respuesta requerida

  • no reforzar las formas anteriores de respuesta

  • El moldeamiento de una nueva operante exige el entrenamiento de componentes o respuestas que se aproximen a la conducta final.

    Moldeamiento de la forma de la respuesta: los procedimientos de moldeamiento dpueden emplearse para enseñar caracteristicas o parámetros nuevos de una respuesta instrumental. El moldeamiento aprovecha la variabilidad inherente de la conducta, sin la cual los procedimientos de moldeamiento no tendrían éxito. Los aspectos de los resultados demuestran que el moldeamiento puede generar nuevas formas de respuesta nunca antes ejecutadas por el organismo.

    Tasa de respuestas como medida de la conducta operante: la ventaja principal de los metodos de operante libre sobre las tecnicas de ensayo discreto para el estudio de la conducta instrumental es que los primeros permiten una observación continua del comportamiento por largos periodos.

    Las medidas de latencia y velocidad de respuesta que comunmente se utilizan en los procedimientos de ensayo discreto no caracterizan la probabilidad de repeticiones de una respuesta. Skinner propuso que la tasa de ocurrencia de la conducta de respuesta se empleara como una medida de probabilidad de respuesta.

    Procedimientos de condicionamiento instrumental

    Reforzamiento positivo alude a los procesos en los que la respuesta instrumental activa produce un estimulo apetitivo, el procedimiento genera un aumento en la tasa de respuestas

    Castigo procedimientos en los que la respuesta instrumental produce o activa un estimulo desagradable, tales procedimientos disminuyen la rpobabilidad futura de la respuesta instrumental.

    Reforzamiento negativo procedimientos en los que la respuesta instrumental termina o previene la entrega de un estimulo aversivo. Hay dos tipos de procedimientos :

  • escape: el estimulo aversivo se presenta pero puede terminarlo la respuesta instrumental

  • evitación: implica un estimulo aversivo programado para que se presente en algun momento futuro. La respuesta instrumental previene la entrega del estimulo aversivo.

  • Entrenamiento por omisión: implica una contingencia negativa entre la respuesta instrumental y un suceso ambiental. La respuesta instrumental impide la entrega de un estimulo agradable o apetitivo. Si el organismo da la respuesta insrumental, se omite el estimulo. A este tipo de procedimientos se les llama tb reforzamiento diferencial de otras conductas (RDO)

    Elementos fundamentales del condicionamiento instrumental

    a)La respuesta instrumental

    Reforzamiento de una respuesta existente: los participantes no tienen que aprender la respuesta comprendida en la tarea, sino la manera en que esta debe darse.

    Creacion de nuevas unidades de respuesta creacion de una nueva unidad de respuesta fromada por componentes de respuesta familiares.

    Variabilidad conductual o estereotipia Thorndike describió la conducta instrumental como algo que comprende la impresión de una asociación E-R. Skinner decía que la conducta se refuierza o fortalece. Ambos pusieron el acento en que el reforzamiento aumenta la probabilidad de que la respuesta instrumental se repita en el futuro. Este enfasis motivó la idea de que el condicionamiento instrumental genera uniformidad o estereotipia en el comportamiento.

    La variabilidad en las respuestas se puede mantener y aumentar mediante reforzamiento, en ausencia de reforzamiento, explicito de la variabilidad de respuesta, las respuestas se vuelven más estereotipadas con condicionamiento instrumental continuo.

    Relevancia o pertinencia en el condicionamiento instrumental Thorndike propuso el concepto de pertinencia para explicar que cierts respuestas naturalmente pertenecen al reforzador por la historia evolutiva de los animales. El termino arrastre instintivo sugiere que las respuestas adicionales que se desarrollan en situaciones de reforzamiento alimentario son actividades que los animales realizan por instinto cuando reciben comida. Estas respuestas alimentarias son muy fuertes y compiten con lo exigido por el experimentador.

    Sistemas de conducta y limitaciones de acuerdo con la teoria de los sistemas de conducta, cuando a un animal se le priva de comida y se encuentra en una situación en que es posible hallar alimento, se activa su sistema alimentario. Se superpone un procedimiento de condicionamiento instrumental en este sistema de conducta. La naturaleza de otras respuestas que surgen durante el transcurso del entrenamiento dependerá de los componentes conductuales del sistema alimentario que se activen por medio del procedimiento de condicionamiento instrumental.

    De acuerdo con el enfoque, podrían predecirse las respuestas que aumentarían con reforzamiento alimentario si se estudia lo que hacen los animales cuando se activa su sistema alimentario en ausencia de condicionamiento instrumental.

    Otra forma de determinar si una respuesta es parte de un sistema de conducta es llevar a cabo un experimento de condicionamiento clásico. Si el arrastre instintivo refleja respuestas del sistema de conducta, las respuestas relacionadas con el arrastre serian patentes en un experimento de condicionamiento clásico.

    b) el reforzador istrumental

    Cantidad y calidad del reforzador Hutt trató de aislar los efectos de la cantidad y la calidad de un alimento liquido variando ambas caracteristicas a la vez. Los aumentos en la calidad y la cantidad del reforzador produjeron las tasas más elevadas de respuesta. En las situaciones de operante libre, sin embargo, los efectos de la magnitud del reforzador son más complejos y dependen del programa de reforzamiento utilizado lo mismo que de otros factores.

    Modificaciones en la calidad o la cantidad los efectos de una cantidad y un tipo particulares de reforzador dependen de la cantidad y calidad de los reforzadores que el individuo ha experimentado con anterioridad. El contraste conductual positivo alude a un aumento en las respuestas por una recompensa favorable como consecuencia de una experiencia previa con resultados menos atractivos. El contraste conductual negativo se refiere a una disminución en las respuestas por una recompensa desfavorable debido a una experiencia previa con mejor resultado-

    c) La relación de respuesta y reforzador

    la conducta instrumental eficaz exige sensibilidad a la relación entre respuesta y reforzador, esta relación consiste en realidad en dos factores independientes:

  • la medicion del tiempo entre la respuesta y el reforzador

  • causalidad, medida en que la respuesta instrumental es necesaria y suficiente para la presentación del reforzador.

  • Efectos de la contigüidad temporal el aprendizaje instrumental es trastocado por el retraso de la presentacion del reforzador luego de la ocurrencia de la respuesta instrumental. Cuando el reforzamiento se demora luego de la ejecución de una respuesta especificada (R1) el organismo no deja de hacer cosas. Si la R1 libera el reforzador pero éste no se entrega sino hasta después de cierto tiempo, el reforzador puede ocurrir después de alguna otra respuesta. Para asociar la R1 con el reforzador, el organismo debe tener alguna forma de distinguir la R1 de las otras respuestas que ejecuta durante el intervalo de demora. Existen dos formas de facilitar el aprendizaje con reforzamiento demorado:

  • proporcionar un reforzador secundario o condicionado inmediatamente después de la respuesta instrumental

  • marcar la respuesta instrumental objetivo de alguna manera para hacerla distinguible de las otras actividades.

  • La contingencia entre respuesta y reforzador hace referencia a la medida en que la entrega del reforzador depende de la ocurrencia previa de la respuesta instrumental. Una relacion causal perfecta entre la respuesta y el reforzador no basta para producir respuestas instrumentales fuertes.

    Experimento de superstición de Skinner marcó un hito en la controversia acerca de la funcion de la contigüidad en comparación con la contingencia en el aprendizaje instrumental. La explicación de Skinner de la conducta supersticiosa descansa en la idea del reforzamiento accidental o adevnticio , que alude al pareamiento accidental de una respuesta con la entrega del refrozador. Un pareamiento accidental aumentala oportunidad de que la misma respuesta ocurra justo auntes del siguiente suministro de alimento. Skinner propuso que no es necesaria una contingencia de respuesta y reforzador positiva para el condicionamiento instrumental.

  • reinterpretación del experimento de superstición: Staddon y Simmelhag hicieron observaciones mucho más amplias y sistemáticas que Skinner. Registraron la frecuencia de cada respuesta de acuerdo con el momento en que ocurrían durante el intervalo entre entregas sucesivas gratuitas de alimento. Algunas de las respuestas tuvieron lugar hacia el final del intervalo entre reforzadores sucesivos, a las cuales llamaron respuestas terminales

  • explicación de la periodicidad de las respuestas interinas y terminales: ambos autores propusieron que las respuestas terminales son respuestas especificas de las especies que reflejan la anticipacion de alimento conforme se acerca el momento de la siguiente presentación de alimento. En cambio, veian las respuestas interinas como reflejo de otras fuentes de motivación que se destacaban al inicio del intervalo, cuando la presentación de alimento es poco probable. La mas desarrollada de estas formulaciones es la teoria de los sistemas de conducta, de acuerdo con la cual, el sistema alimentario se activa en los animales privados de alimentos a los que se da pequeñas porciones de comida de manera periódica.

  • Efectos de la controlabilidad de los reforzadores una fuerte contingencia entre una respuesta instrumental y un reforzador significa que esencialmente la respuesta controla el reforzador. La investigacion contemporánea sobre los efectos de la controlabilidad de la estimulación aversiva se originó con los estudios pioneros de Seligman, Overmier y Maier quienes investigaron los efectos de la exposición a descargas incontrolables en el aprendizaje de escape y evitación posterior en los perros, a este fenomeno a llegado a llamársele efecto de desamparo aprendido

  • el diseño triádico: los experimentos de desamparo aprendido se han realizado mediante este diseño. Este implica dos fases: a) exposición b)condicionamiento. Se expone a tres grupos al experimento comprobando que los efectos de la estimulación aversiva durante la fase de exposición dependen de si es posible o no escapar de la descarga.

  • La hipótesis del desmparo aprendido: supone que los animales aprenden que las descargas son independientes de su conducta. Además llegan a esperar que en el futuro los reforzadores sigan siendo independientes de su conducta. Esta expectativa de falta de control futura mina su capacidad de aprender nuevas respuestas instrumentales. El déficit de aprendizaje tiene lugar por dos motivos: a) la expectativa de falta de control futura hace que resulte más dificil aprender una contingencia entre respuesta y reforzador subsecuente. b) la expectaciónde falta de control futura reduce la motivación de respuestas.

  • Déficit de actividad:

  • Déficit de atención

  • Relaciones estimulo en el condicionamiento de escape: la caracteristica que define la conducta de escape es que la respuesta instrumental resulta en terminación de un estimulo aversivo. Sin embargo, hay también relaciones estimulo que son potencialmente muy importantes. Algunos de estos estimulos producidos por la respuesta se experimentan al principio de la respuesta de escape, y se les llama claves de retroalimentación de cesación de descarga.

  • TEMA 6: PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN

    Un programa de reforzamiento es una regla o criterio que determina cómo y cuando seguirá un reforzador a la ocurrencia de una respuesta. La tasa exacta de respuestas puede variar de una a otra situación, pero el patrón de resultados es muy predecible.

    Los programas de reforzamiento influyen tanto en cómo se aprende la respuesta instrumental como en la forma en que se mantiene después por medio de reforzamiento. Tradicionalmente, los investigadores que han estudiado los efectos del reforzamiento, se han interesado sobre todo en el mantenimiento de la conducta. Las investigaciones de los programas de reforzamiento han proporcionado una gran cantidad de información sobre los factores que controlan el mantenimiento y la ejecución repetida de la conducta instrumental más que su adquisición original.

    Programas simples de reforzamiento intermitente

    Un solo factor determina la ocurrencia de la respuesta instrumental que se refuerza.

    Programas de razón

    El reforzamiento depende solo del numero de respuestas que ha ejecutado el organismo. Tal programa se denomina tecnicamente reforzamiento continuo (RFC) . Las situaciones en que la respuesta se refuerza solo parte del tiempo se dice que implican reforzamiento parcial o intermitente.

    Razón fija el reforzamiento continuo implica una razón fija de una respuesta por reforzador. En un programa de reforzamiento continuo, los organismos responden caracteristicamente a una tasa estable aunque moderada. Cuando rige un programa intermitente de razón fija tiene lugar un patron muy diferente de respuestas.

    La tasa cero que tiene lugar justo después del reforzamiento se denomina pausa posreforzamiento , y la elevada y constante tasa de respuestas que completa cada criterio o condición de razón se llama carrera

    Razón variable en un programa de razón fija se requiere un numero predecible de respuestas para cada reforzador. La predictibilidad puede modificarse si se varía el numero de respuestas requeridas. En el programa de razón variable es necesario un numero distinto de respuestas para cada recompensa. El valor numérico de un programa de razón variable indica el número promedio de respuestas requeridas por reforzador. eN virtud de que no es predecible el numero de respuestas requeridas para el reforzamiento, son menos probables las pausas predecibles en la tasa de respuestas con los programas de razón variable. La tasa de respuestas total en los programas de razón fija y variable es similar siempre y cuando se requieran numeros similares de respuestas.

    Programas de intervalo

    Intervalo fijo en un programa de intervalo, solo se refuerza la respuesta si ha transcurrido un tiempo establecido después de la ultima entrega del reforzador, en este tipo de programa, el tiempo establecido permanece constante de una a otra ocasión. A medida que se acerca el tiempo de disponibilidad del siguiente reforzador, se incrementa la tasa de respuestas. Este aumento se manifiesta como una aceleración en el registro acumulativo hacia el final del intervalo. El patrón de respuestas que se desarrolla se llama festoneo.

    Intervalo variable las respuestas se refuerzan si suceden luego de un intervalo variable Dresde la entrega del reforzador anterior, el intrevalo promedio es de dos minutos.

    Concepto de disponibilidad limitada en los programas simples de intervalo, una vez que el reforzador está disponible, permanece asi hasta que se da la respuesta requerida. Una vez efor