Psicología
Memoria
Facultat de Psicologia
Universitat Autònoma de Barcelona
APM : MEMÒRIA Dossier 3: Les grans tradicions en l'estudi de la memòria. |
Professors: Josep Baqués
Curs: 2004-2005
Semestre: segon
3. LAS GRANDES TRADICIONES
Las grandes tradiciones en el estudio experimental de la memoria.
El enfoque Ebbinghaus.
El enfoque Bartlett.
La tradición asociacionista versus la tradición cognitivista.
2. El nuevo enfoque en la investigación de la memoria: La psicología cognitiva.
BIBLIOGRAFÍA RECOMENDADA
BADDELEY, A.D. (1998). Memoria Humana: Teoría y Práctica. Madrid: McGraw Hill.
DE VEGA, M. (1984). Introducción a la Psicología cognitiva Madrid: Alianza.
GARZON, A., DIGES, M. y SEOANE, J. (1982). El estudio de la memoria en la última década. En I. Delclaux y J.Seoane Psicología cognitiva y procesamiento de la información. Madrid: Pirámide.
MAYOR, J. y DE VEGA, M. (1992). Memoria y representación. Madrid: Alhambra.
RUIZ-VARGAS, J.M. (1991). Psicología de la memoria. Madrid: Alianza.
SAIZ, D. y SAIZ, M. (1989). Una introducción a los estudios de la memoria. Barcelona: Avesta.
SAIZ, D., SAIZ, M. y BAQUES, J. (1996). Psicología de la memoria. Manual de Prácticas. Barcelona: Avesta.
LECTURAS OBLIGATORIAS DEL MANUAL T3
-
Cap. 7. El inicio del estudio experimental de la memoria: El enfoque de Hermann Ebbinghaus.
-
Cap. 8. Recordar como proceso versus memoria como facultad: El enfoque de Frederic C. Bartlett.
I recomanem la lectura complementària del final d'aquest dossier.
1. LAS GRANDES TRADICIONES EN EL ESTUDIOS EXPERIMENTAL DE LA MEMORIA.
1. Introducción.
Tenéis que tener en cuenta que la interpretación, explicación y estudio de los diferentes procesos psicológicos, como tendréis la oportunidad de analizar el próximo curso en la asignatura de Historia de la Psicología, responde siempre al marco teórico-científico que domina el campo de una ciencia. Cuando los principios de la epistemología de la ciencia cambian también cambia lo que puede o no puede estudiarse y cómo debe ser interpretado.
El estudio de la memoria al igual que el estudio de otros procesos se ha visto influido por estos predominios teóricos.
Haciendo una gran síntesis podríamos decir que a lo largo del siglo XX los diferentes enfoques que podemos encontrar en psicología de la memoria pueden encuadrarse en una de estas dos grandes tradiciones teóricas: a) el asociacionismo y b) el cognitivismo.
Estos dos enfoques se han diferenciado en su forma de definir las características de la memoria humana, así como por sus ideas acerca de lo que debe ser explicado, lo que es relevante y lo que no lo es. Encabezando estas dos tradiciones hemos de destacar dentro del campo de la Psicología de la memoria a las figuras del alemán Hermann Ebbinghaus (1850-1909) y del británico Frederic C. Bartlett (1886-1969), cuyas características desarrollaréis con la lectura de los capítulos 7 y 8 de Manual y con el trabajo que deberéis realizar para la discusión en clase.
La tradición de Ebbinghaus predominó en los enfoques funcionalistas y asociacionistas estímulo-respuesta que predominaron en el panorama de la Psicología hasta los años 50. A partir de los años 60 se ha recuperado la línea de trabajo de Bartlett.
Veamos ahora las líneas fundamentales de estos dos grandes enfoques. Por un lado, la tradición asociacionista recogería aquellos planteamientos fundamentados en la asociación y se caracteriza, en nuestro campo de estudio, por
considerar a la memoria como la encargada de conservar las copias de la realidad. La memoria es vista como la que guarda los recuerdos acumulados por los aprendizajes sucesivos y estos recuerdos, copias o huellas se consolidan a través de leyes asociativas.
y por el otro, la perspectiva cognitivista recogería todos aquellos planteamientos fundamentados en los aspectos cognitivos, y al explicar el funcionamiento mnémonico,
rompe con la idea de la memoria como copia literal y resalta su importancia, partiendo de la consideración de que el organismo procesa la información en base a sus experiencias y conocimientos previos. La memoria está en consecuencia en constante interrelación con el resto de procesos. Las nuevas informaciones pueden ser alteradas por los conocimientos previos, pero a su vez, éstas pueden alterar la información anterior.
Estas dos concepciones van más allá del propio concepto de memoria y se extienden a la visión del funcionamiento del comportamiento humano. Así el planteamiento cognitivo se interesa más por el aspecto informativo de los estímulos que por sus características físicas y por el comportamiento como resultado de la cognición. Si el asociacionismo consideraba al organismo como respondiendo a situaciones estimulares cargadas de información, los planteamientos cognitivos verían al organismo operando directamente sobre la información del estímulo interiorizado. Este enfoque diferencial nos lleva a dos concepciones de sujeto.
ASOCIACIONISMO: sujeto pasivo, meramente receptor de estímulos y emisor de simples y directas respuestas a estos estímulos, o sujeto aprendiz de asociaciones.
COGNITIVISMO: sujeto activo, que selecciona, reinterpreta, elabora y almacena información y en función de este procesamiento de la información responde, es decir, actúa.
De acuerdo con Baddeley el estudio de la memoria se balancearía entre el riesgo de la simplificación de Ebbinghaus y de la tradición asociacionista, con su correspondiente peligro de caer en la trivialidad y el enfásis de Bartlett y la tradición cognitiva en la complejidad de la memoria humana, con su correspondiente peligro de la imposibilidad de comprobación.
2. EL ENFOQUE ACTUAL DE LA PSICOLOGÍA DE LA MEMORIA: LA PSICOLOGÍA COGNITIVA.
La investigación de la memoria no se limita a los trabajos de Ebbinghaus y Bartlett y hay un gran número de investigadores que han abordado su estudio a lo largo de la Historia de la Psicología, sin embargo, estos dos autores sirven de ejemplo de las dos grandes tradiciones de investigación. Por ello nos vamos a permitir ser simplistas y dar un gran salto histórico y temporal para situarnos en las coordenadas de la investigación actual de la memoria que están representadas por los investigadores situados dentro de la psicología cognitiva.
La psicología cognitiva domina la escena psicológica desde mediados del siglo XX hasta la actualidad y ha desplazado el papel hegemónico que ejerció el conductismo durante las décadas anteriores. La mayoría de los autores consideran que en los años cincuenta y sesenta se produjo una “revolución cognitiva” que cambió substancialmente los supuestos básicos de nuestra disciplina. Se puede hacer una primera aproximación a su definición utilizando las palabras de Rivière que la define como:
Una ciencia objetiva de la mente, considerada como un sistema de conocimiento.
La psicología cognitiva recuperó el estudio de los procesos superiores, que había sido abandonado por el modelo conductista, y se interesó más por el aspecto informativo de los estímulos que por sus características físicas y en consecuencia por el comportamiento como resultado de la cognición.
“ El conductismo se había configurado en buena parte tomando como modelo de la psicología general, la psicología animal merced a una interpretación igualitaria y reduccionista de la evolución y al apoyo decisivo del positivismo lógico (...), el nuevo paradigma cognitivo emergió y está representado en buena parte por unos desarrollos que toman como modelo de la psicología general la psicología de unas máquinas que manejan símbolos e información y se relacionan inteligentemente con sus medios” (Caparros, A. 1984. La Psicología y sus perfiles. Introducción a la cultura psicológica. Barcelona: Barcanova, p. 193).
Así la psicología cognitiva, como nos indica Ruiz Vargas (1991):
“se basa en la suposición de que los patrones de conducta observable, junto con las experiencias subjetivas privadas, dependen de sucesos mentales inobservables que implican mecanismos y procesos mentales. El objetivo fundamental de la psicología cognitiva es identificar esos sucesos y determinar las relaciones entre ellos y entre éstos y las conductas observables” (Ruíz Vargas, J.M. (1991). Psicología de la Memoria. Madrid: Alianza, p. 43).
Los presupuestos básicos de este planteamiento teórico:
Se pueden agrupar en: presupuesto mentalista; presupuesto computacional, presupuesto restrictivo y presupuesto funcionalista.
La psicología cognitiva no entiende ni explica científicamente el comportamiento humano sin incorporar constructos internos mentales. Esto configuraría el presupuesto mentalista.
Por otro lado, la actividad mental consiste en un sistema de procesamiento simbólico de propósito general (es decir, aplicable a cualquier tarea o circunstancia). Los procesos mentales consisten en activar, manipular y transformar símbolos, los cuales se relacionan con cosas en el mundo externo. El propósito de la investigación psicológica es especificar los procesos y representaciones simbólicas que subyacen a nuestros actos (presupuesto computacional).
El presupuesto restrictivo se fundamenta en que los seres humanos tienen limitaciones en su capacidad de procesar información, limitaciones causadas por las estructuras y recursos de que disponen (los procesos cognitivos requieren un tiempo determinado, no se pueden ocupar de muchos elementos a la vez, etc.).
Y por último, la mente constituye un nivel de análisis legítimo en sí mismo, esto quiere decir, que no hemos de buscar la explicación de los procesos mentales en los fenómenos físicos que le sirven de soporte (es decir, el funcionamiento del cerebro), sino que los hemos de comprender por sí mismos en cuanto a la función que ejercen (presupuesto funcionalista).
El surgimiento de esta nueva forma de estudiar la psicología se produjo alrededor de los años cincuenta debido a la convergencia de una serie de contribuciones, tanto externas como internas a la Psicología y a la insatisfacción de cierto grupo de psicólogos con el enfoque conductista. Comúnmente se acepta como influencias externas a la Psicología los desarrollos aportados por: a) la teoría de la información, b) la lingüística generativa-transformacional de Chomsky y c) la ciencia de los ordenadores. Entre las influencias internas podemos destacar: a) la psicología soviética, b) Jean Piaget y la escuela de Ginebra, c) la psicología británica (Bartlett, Broadbent) y d) la psicología social cognitiva (Lewin y seguidores).
Muchos de los psicólogos cognitivos han adoptado la metáfora explicativa de la mente funcionando como un ordenador. Esta interpretación de la metáfora mente-ordenador ha tenidos dos vertientes que han sido denominadas como la interpretación “fuerte” y la interpretación “débil”.
El paradigma computacionalista defiende una interpretación”fuerte” o literal de la metáfora mente-ordenador. Si la mente es un sistema de cómputo guiado por reglas sintácticas la podemos considerar funcionalmente idéntica a un programa de ordenador. La interpretación “débil”, por el contrario no asume literalmente la identidad mente-ordenador, sino que la considera una fuente de inspiración para construir modelos mentales, en un sentido más general, y maneja términos informáticos para referirse a las operaciones mentales.
La psicología cognitiva de la memoria
De hecho, esta nueva perspectiva en el estudio de la memoria surge, también, al igual que en el plano de la psicología en general, de una insatisfacción con el enfoque conductista y de la influencia del desarrollo de la lingüística y de factores como la teoría de la información y la revolución de los ordenadores, como acabamos de indicar. Quizás convenga que centréis vuestra atención sobre el impacto de las ciencia de los ordenadores. Es especialmente relevante la idea de que la investigación sobre la programación de los ordenadores dejó claro que era prácticamente imposible entender las relaciones input (estimulo)- ouput (respuesta) de un ordenador sin hacer referencia al proceso simbólico. Esto dio pie a plantearse que no era razonable ni lógico intentar, pues, seguir explicando el comportamiento humano limitándose simplemente a las relaciones externas (estimulo-respuesta).
Recordemos que la memoria se había concebido tradicionalmente como un almacén de recuerdos acumulados a lo largo de las actividades y aprendizajes del sujeto, cuya misión consistía en guardar pasivamente los recuerdos. En esta perspectiva estudiar la memoria consiste en conocer las condiciones de fijación, retención y olvido. El asociacionismo consideró al organismo como respondiendo a situaciones estimulares cargadas de información. Los nuevos planteamientos cambian esta concepción y contemplan al organismo operando directamente sobre la información del estímulo interiorizado. El desarrollo de la tecnología de los ordenadores hizo aparecer una nueva analogía: el sujeto procesador de información.
Si el sujeto interactúa con su medio no sólo respondiendo a la situación estimular sino en base a su experiencia y operando de forma activa sobre la información, es lógico que tome importancia el conocimiento previo que tiene el sujeto. Los nuevos planteamientos, por tanto, deben preguntarse cómo se utiliza, cómo se representa, cómo se adquiere y cómo se almacena este conocimiento.
El símil con el ordenador proporciona una posible respuesta. La memoria adquiere un lugar preferencial dentro de las investigaciones de la psicología y se hace necesario conocer sus estructuras y procesos para entender cómo se procesa y se representa la información. Esta influencia de la ciencia de los ordenadores en el estudio de la memoria, dentro de este marco teórico, dirigió los trabajos en dos direcciones: a) el estudio sobre la estructura de la memoria por analogía con los ordenadores y, b) el estudio de los códigos y formas de procesamiento de la información. En síntesis dio lugar a una visión estructural y/o una visión procesal de la memoria.
Los ordenadores dependen fuertemente de la estructuración, organización, gestión y capacidad de memoria. No es de extrañar que esta influencia hiciera que muchos de los psicólogos cognitivos centrarán sus líneas de investigación en el estudio de la memoria.
Sin embargo, la importancia que adquirió la memoria dentro de la investigación cognitiva no estuvo limitada a la influencia de la ciencia de los ordenadores, es decir, del símil con el ordenador, sino que estuvo reforzada, también, por el reconocimiento de que los procesos cognitivos en general y especialmente los procesos perceptivos implicados en el reconocimiento de patrones y objetos, precisan recurrir a la existencia de conocimientos previos almacenados en la memoria.
Las ideas de Garzón y Seoane, nos permiten resumir tres características del estudio de la memoria en esta nueva orientación, que sintetizarían los cambios que se produjeron a partir de los años 50 del siglo XX:
-
El sujeto no registra pasivamente la información, no es un mero receptor, sino que la elabora en función de sus conocimientos previos: el sujeto que aprende es un procesador activo de información. Se produce un énfasis en los procesos internos.
-
No se produce un rechazo total de la asociación, sino de la asociación estímulo-respuesta. La asociación se produce a nivel de contenido.
-
Se produce un cambio en la metodología de estudio. Si bien no se renuncia al método experimental, aparecen nuevos métodos. La investigación no queda reducida a los laboratorios y se utilizan nuevas técnicas y materiales.
LECTURA COMPLEMENTÀRIA
El computacionalismo: la `versión dura' de la psicología cognitiva. - Juan Antonio Vera. Universidad de Murcia
Nos interesa examinar aquí los supuestos de una de las líneas de investigación, con mayor tradición dentro de la psicología cognitiva, que hace del concepto de manipulación simbólica el centro de su argumentación: nos referimos al computacionalismo proposicionalista.
El objetivo de los psicólogos computacionalistas es hacer plausible la hipótesis según la cual `la mente humana es literalmente una computadora', un sistema mecánico de cómputo que utiliza exclusivamente información digital (de naturaleza proposicional fundamentalmente) y que la procesa siguiendo un conjunto de reglas bien definidas, próximas a las que rigen en el cálculo lógico
Quizás convega aclarar que `Calcular' no significa otra cosa que operar con representaciones numéricas para transformar una información de entrada en otra de salida. El concepto de `calculo', sin embargo, no debemos reducirlo al dominio de lo numérico, ya que no sólo está destinado a representar este tipo de entidades: la lógica moderna, por ejemplo, se caracteriza, como las matemáticas, por constituir un potente sistema de cálculo. En este sentido de `manipular símbolos para el cálculo' podemos considerar sinónimos los términos `cálculo' y `cómputo'. Por eso los angloparlantes utilizan el término `computadora' para referirse a las modernas máquinas diseñadas para trabajar con grandes bancos de información codificada numéricamente. Nosotros, dejándonos inducir por el vocablo francés, llamamos a esa misma máquina `ordenador'.
Como los cómputos de un ordenador se realizan sobre una información que necesariamente está codificada simbólicamente, no tiene sentido hablar de computación sin representación; ni viceversa. De ahí la importancia de precisar muy claramente cuál es el formato de representación idóneo para realizar cálculos a toda velocidad y con la mayor precisión. En este contexto es en el que adquiere todo su sentido el concepto de representación proposicional, en tanto que formato digital de representación que permite a los sistemas dedicados al procesamiento de la información llevar a cabo su tarea óptimamente.
Si pensamos ahora en esos psicólogos que defienden que, a cierto nivel de descripción, `la mente es una computadora', entenderemos mejor por qué la representación proposicional pasa a un primer plano de importancia en la explicación psicológica. El atinado título que el profesor Rivière escogió para el libro que ya hemos recomendado en núcleos anteriores, captura ejemplarmente la esencia de esta idea: los sistemas cognitivos y los ordenadores son dos casos pertenecientes a una misma categoría: la de los `Objetos con mente'. `Objetos' que reciben, codifican, transforman, guardan y recuperan información, siguiendo ciertas reglas computacionales. Y la mejor forma que se conoce hasta el momento para realizar estas funciones es trabajando con un código digital, como digital es la representación proposicional.
Si estuvierais interesados en profundizar en todas estas cuestiones os remito una vez más al citado libro de Rivière.
En la medida en que este tipo de psicólogos defiende una equivalencia fuerte entre la mente y los sistemas artificiales de cómputo (como los modernos ordenadores), su psicología ha sido conocida como la `versión dura' de la metáfora computacional. Para ellos, la mente humana es al cerebro lo que el programa que utilizan los ordenadores para funcionar (o Software) es a la materia física de la que están hechos (o Hardware). Es decir, que existe una relación de equivalencia funcional entre el sistema cognitivo y los ordenadores, lo que significa que estas dos estructuras diferentes desde un punto de vista material (neuronas y chips de silicio) son equivalentes desde el punto de vista funcional.
Para que entendáis es concepto de equivalencia funcional, se dice de dos objetos materialmente diferentes que son funcionalmente equivalentes cuando realizan las mismas operaciones o cumplen las mismas funciones dentro de un sistema. Es en este sentido paradigmática la comparación que establece entre una máquina fotográfica y el ojo humano. Ambos dispositivos son completamente diferentes en su composición material, pero en tanto que sistemas, funcionan mas o menos de la misma forma, son equivalentes. Así, podríamos buscar equivalencias funcionales entre los distintos componentes de la cámara y el ojo (pupila-diafragma; película-retina; enfoque-córnea; etc.). Y podemos describir al ojo humano `como si' fuera una cámara fotográfica, un dispositivo fotosensible especializado en registrar la información electromagnética.
Fijaos en que, según la versión dura de la psicología cognitiva, lo que hace una mente es exactamente lo mismo que lo que hace un ordenador; esto es manipular proposiciones siguiendo reglas precisas de computación. En este sentido, más que hablar de la `metáfora del ordenador', lo que afirman estos psicólogos es que la mente, de un modo literal, `es' un ordenador.
Un supuesto central de estos modelos es que el procesamiento de las proposiciones por parte de la computadora mental sigue un procedimiento secuencial (o serial) y reglas explícitas de cálculo a las que nos referiremos con el nombre de algoritmos
-
El concepto de algoritmo en los sistemas computacionales
Igual que los expertos en programación, los psicólogos computacionalistas utilizan el concepto de `algoritmo' para referirse a esos procedimientos mecánicos de cálculo que especifican claramente cuáles son las distintas operaciones que deberá realizar la mente para producir un resultado deseado.
Un algoritmo es, por consiguiente, un procedimiento efectivo de cálculo, que realiza mecánicamente un conjunto finito y secuenciado de operaciones lógicamente regladas
Tened siempre presente que tanto la descripción como la explicación `algorítmica' de la mente consiste en un tipo de descripción y de explicación funcional. Esto es: una explicación que se ocupa más de lo que hace nuestra mente y de cómo lo hace (los programas cognitivos), que de las propiedades de la materia que le sirve de sustrato físico (el cerebro). ¿Cuáles son los algoritmos que hacen que nuestra mente funcione como una máquina lógica; que se comporte como una especie de ordenador digital? Esta es una pregunta central para los psicólogos computacionalistas, que se interesan por explicar las propiedades de la mente en tanto objeto que puede ser descrito funcionalmente.
-
El papel de la conciencia dentro de un sistema computacional
El automatismo del sistema cognitivo
Una de las ideas cardinales que anima a los computacionalistas es la de poder ofrecer una explicación mecanicista del funcionamiento de la mente. De este modo, la mente sólo puede ser explicada en la medida en que se la conciba como una computadora que ejecuta automáticamente sus algoritmos. Y el funcionamiento automático es, por definición psicológica, inconsciente.
Los comportamientos regidos por la conciencia, por el contrario, son controlados subjetivamente, consumen recursos atencionales, pertenecen a la esfera voluntaria de la vida psíquica y escapan a cualquier tipo de determinación. La respuesta de los computacionalistas ante este dilema es inquietante, pero perfectamente razonable desde sus propios supuestos: la conciencia es sólo el producto o resultado de la manipulación inconsciente y mecánica (algorítmica) de los símbolos cognitivos, pero no participa en el control de la conducta. Desde esta perspectiva, la conciencia puede ser efecto, pero nunca causa de la conducta mental.
Para los defensores de la psicología cognitiva `fuerte', la mente es una cosa y la conciencia otra distinta. La mente es la máquina lógica (también llamada máquina abstracta o máquina virtual) y la conciencia es un epifenómeno, una entidad innecesaria para que exista conducta inteligente
Quizás convega aclararos que es un epifenómeno. Pués bién un epifenómeno es algo que evidentemente existe, pero que no interviene como causa en la producción de un suceso particular. Por ejemplo, se suele decir que la espuma de las olas son un epifenómeno en ese sentido de que es algo que siempre acompaña a la ola, pero es algo que de ningún modo efectivo determina el comportamiento de la misma.
De este modo, en una mente esencialmente automática, la conciencia sólo puede ser concebida como un epifenómeno, como una realidad derivada que no desempeña ningún papel significativo en el escenario de lo psicológico. De este modo, los psicólogos computacionalistas no ponen en duda la existencia de la conciencia (ellos, según dicen, también la tienen), pero afirman que no cumple ninguna función en la ordenación de nuestros actos mentales.
La conciencia de los robots
¿Tienen conciencia los robots? Así es como podríamos plantear el problema filosófico y científico que se esconde detrás de la propuesta computacionalista que ahora examinamos. Pensad por un momento en la posibilidad científico-técnica de construir un robot, cuya forma externa fuera indistinguible de la de un ser humano, al que se le ha programado para replicar todos nuestros comportamientos, incluyendo los inteligentes. De ser esto posible, tendríamos un doble perfecto del hombre, sólo que sin conciencia. Y, si el humanoide hace exactamente las mismas cosas que nosotros sólo que sin conciencia, ¿porque hemos de esperar que nuestra conciencia sirva para algo? He ahí, crudamente formulado, el quid de la cuestión.
Para que hagáis una pequeña reflexión, continuad leyendo. ¿Sueñan los androides con ovejas eléctricas? Así podríamos haber formulado la pregunta sobre la conciencia de los robots, si hubiéramos buscado un efecto literario. Y así fue, en efecto, como bautizó Philip K. Dick su novela sobre androides, cuando la lanzó al mercado en 1968. Después, en 1982, llegaría a las pantallas la versión cinematográfica de la novela, `Blade Runner', dirigida por Ridley Scott, donde el cine de ciencia-ficción alcanza el rango de obra maestra. Pues bien, si alguno de vosotros no ha tenido todavía la oportunidad de ver esta maravillosa cinta, que no pierda más el tiempo. Porque los problemas morales, filosóficos y científicos que quedan recogidos en esta película son de evidente interés para todos aquellos que estén atraídos la psicología cognitiva.
Y, al margen de la ficción, sin saliros de la ciencia-ciencia, podéis acercaros a la dirección web del Instituto Tecnológico de Massachusetts (MIT), (http://www.ai.mit.edu/projects/humanoid-robotics-group/cog/cog.html) para comprobar los últimos adelantos en relación con la construcción de robots inteligentes antropomorfos. También podéis acudir a la ilustrativa a la vez que entretenida página mantenida por David Chalmers (http://www.u.arizona.edu/~chalmers/index.html) si lo que os interesa es introduciros en el fascinante misterio de la conciencia.
El sistema de representación en los modelos PDP o conexionistas - Juan Antonio Vera. Universidad de Murcia
Los modelos que se engloban dentro del concepto de `Procesamiento Distribuido en Paralelo', entraron con fuerza en la psicología cognitiva a mediados de la década de los ochenta.
Esencialmente podríamos resumir la filosofía de los modelos de Procesamiento Distribuido en Paralelo diciendo que consisten en modelos que se esfuerzan por tomar en cuenta las propiedades del cerebro, que desconfían de la noción de símbolo y que abogan por un tipo de procesamiento distribuido y en paralelo, ejecutado por la actividad de un gran número de unidades puestas en conexión
Con esta pequeña definición esperamos, primero, que hayáis entendido por qué se identifican estos modelos con el nombre de Procesamiento Distribuido en Paralelo (desde ahora, `PDP') o también `conexionismo'; y, después, que observéis la naturaleza antagónica de los modelos conexionistas con respecto a aquellos otros que tienen su origen en la metáfora del ordenador.
Es oportuno que notéis que la postura de estos modelos es contradictoria con las versiones más tradicionales de la psicología cognitiva, hasta tal punto que muchas de las afirmaciones que hemos hecho a lo largo de este módulo acerca de la naturaleza simbólica de las operaciones mentales queda puesto seriamente en entredicho.
Propiedades definitorias de los modelos PDP
La metáfora del cerebro
En primer lugar, frente a la `metáfora del ordenador', los defensores de los modelos PDP proponen la `metáfora del cerebro'. Los conexionistas consideran que siendo el cerebro la máquina material real del sistema cognitivo humano, los modelos cognitivos deben tratar de aproximarse al máximo a sus rasgos característicos. Estiman que es muy importante construir modelos que tengan en cuenta la organización y el funcionamiento de las neuronas, en tanto que unidades reales del procesamiento de la información.
Debido a que en el sistema nervioso sólo encontramos neuronas (en estado de activación o reposo) y conexiones entre neuronas (que pueden ser de naturaleza excitatoria o inhibitoria) los modelos PDP defienden que una psicología realista debe trabajar con conceptos que se hagan cargo de esta peculiaridad. Así, postulan que el vocabulario del conexionista debe estar comprendido por términos que hagan referencia a cosas tales como `estimulación', `umbral de activación', `fuerza de conexión', `patrón de activación', `patrón de conexión', etc.
La red conexionista: un soporte flexible para las representaciones PDP
¿Cómo hemos de concebir en sí misma a una red conexionista? De un modo muy esquemático diremos que los elementos constitutivos de la red son las unidades y las conexiones. Las unidades se diferencian en unidades de entrada, unidades ocultas, y unidades de salida.
Además, cada una de las unidades de la red posee un nivel de sensibilidad propio que define su umbral de activación. Y las conexiones entre unidades están presididas por una fuerza, peso o intensidad de asociación, que puede ser de carácter excitarorio o inhibitorio.
Por otro lado, llamaremos patrón de activación al estado de activación global en que se encuentra en un momento dado el sistema, tomando en cuenta la activación del conjunto de todas las unidades; y patrón de conexión a la relación total de fuerzas de asociación entre las distintas unidades. El patrón de activación especifica lo que se está representando en cada momento y el patrón de conexión expresa el conocimiento previo de la red.
Finalmente, es importante reparar en que el patrón de conexión no es fijo, sino que se modifica en función de la experiencia, dando lugar a evoluciones y cambios en los conocimientos debidos al aprendizaje.
Naturaleza subsimbólica y distribuida de las representaciones
Como ya habréis advertido, los conceptos manejados por los conexionistas están muy lejos de corresponderse con los utilizados por la psicología cognitiva tradicional. Los modelos de la memoria semántica que hemos estudiado en esta asignatura, por ejemplo, reposan en el concepto de símbolo concreto que está efectivamente almacenado en algún lugar de la memoria. Para el PDP, por el contrario, el símbolo no se corresponde con ninguna entidad real.
En opinión de los conexionistas de ningún modo realista podemos afirmar que existan `imágenes' o `proposiciones' o `producciones' o cualesquiera otras formas simbólicas de codificar la información: lo único que hay en el cerebro son patrones de activación y patrones de conexión que, cuando se ponen en marcha, sitúan al hombre en relación con los objetos de su experiencia. Sólo en este sentido podríamos decir que un patrón de activación determinado guardan información referida al (o que representa el) ambiente en el que el ser humano ha de sobrevivir. Pero en cuanto el patrón desaparece, no queda nada en el sistema que pueda ser identificado como un símbolo codificado en la memoria y allí localizado para su uso posterior.
Para que tengáis un ejemplo, cuando vemos un objeto y recordamos una propiedad asociada a dicho objeto no es necesario postular, según PDP, ningún tipo de estructura simbólica al estilo de los modelos de redes semánticas como los estudiados en el hito tres de este módulo. En los casos más sencillos de reconocimiento de patrones, por ejemplo, las redes conexionistas garantizan que dos propiedades diferentes correspondientes a un objeto (p. ej., color y olor) puedan ser representadas a un mismo tiempo con la sola participación de unas pocas unidades interconectadas. En estos modelos no hay necesidad alguna de formular la existencia de una red semántica que enlace el objeto perteneciente a la categoría `limón' con las propiedades `ser amarillo' y `oler a azahar'.
Lo que dice PDP es que el patrón de conexión establecido en una sola red conexionista da lugar a distintos patrones de actividad asociados a sus propiedades relacionadas. Así, cuando vemos el dibujo de un limón en blanco y negro, el patrón de conexión que se pone en funcionamiento recoge de un modo automático todas las características que definen al objeto del dibujo. En este caso, objeto, color y aroma, estarían representados por el mismo conjunto de unidades de una red conexionista y desaparecerían con la misma rapidez con la que tardara en desactivarse la red. Es importante que observéis que toda la actividad de la red se ha desarrollado sin la necesidad de presumir la existencia de ningún símbolo, cuando en el caso de la red semántica habríamos necesitado poner en relación al menos tres de ellos.
Si no hay símbolos, ¿dónde se guarda la información aprendida por el sistema cognitivo? Desde el punto de vista de los modelos PDP, los conocimientos son entidades representadas de un modo distribuido por toda la red de conexiones, no objetos simbólicos distintos guardados en algún lugar de la memoria; son, en realidad, la totalidad de excitaciones e inhibiciones de una sola red conexionista tomada en su conjunto. En definitiva, en los modelos PDP el concepto de representación ha perdido su carácter localista y simbólico, para convertirse en una realidad subsimbólica y de naturaleza distribuida.
En una estructura conexionista, ya lo hemos dicho, las diversas representaciones que es capaz de manejar el sistema se encuentran distribuidas por toda la red. Todas las unidades de la red, junto con la fuerza de sus conexiones, están implicadas en los procesos de representación. Y las mismas unidades, sólo que con distintos parámetros de activación, pueden representar un gran número de cosas distintas. Es decir, que una representación particular ni se localiza en un lugar preciso de la red, ni su permanencia en el sistema dura más de lo que persiste el patrón de activación al que corresponde, ya que los patrones no activados no están en ningún sitio.
Mecanismo de procesamiento en modelos PDP
En los sistemas conexionistas, junto con el concepto de símbolo, también desaparece el concepto de algoritmo en tanto que regla explícita de cálculo que sigue una serie (o secuencia) de pasos bien definidos. Por el contrario, la actividad de las redes conexionistas es masiva y en paralelo. Para procesar cualquier tipo de información con un sistema PDP es preciso que participen al unísono todas las unidades que conforman la red.
Una red conexionista no sigue reglas para manipular sus representaciones, sólo trabaja con magnitudes físicas. Aunque pudiera dar la impresión de que el sistema está computando representaciones algorítmicamente, cuando nos fijamos en los resultados de su comportamiento global, a escala interna lo único que está poniéndose en juego es la actividad conjunta de un gran número de unidades que se excitan o se inhiben con una intensidad determinada. En este sentido, los cálculos de las máquinas conexionistas (y no es nada descabellado suponer que el cerebro sea una de ellas), sólo dependen de los valores de activación a partir de los cuales responden cada una de las unidades, y de la fuerza y el sentido de la asociación establecida entre las distintas unidades de la red.
Fijaos en la red de aquí abajo. Seguro que la reconoceréis, porque es la que hemos utilizado para estudiar los elementos constitutivos, estructurales, de una red conexionista, excepto que no hemos asignado ningún valor a las unidades de entrada. Pues bien, he aquí una de las redes conexionistas más famosas que os podemos presentar: la red capaz de responder correctamente a un problema de lógica, sin ser lógica ella misma, ni sus cálculos algorítmicos.
El asunto estriba en que esta red es capaz de responder correctamente al problema OEX (para los anglófonos: XOR). OEX (o XOR) es la manera que utilizaremos, siguiendo la tradición, para referirnos al operador lógico `o excluyente', es decir, aquella partícula lógica que establece que la relación entre dos proposiciones es del tipo `o esto, o aquello, pero no ambas cosas a la vez'.
El caso es que si os habéis fijado en el patrón de conexiones configurado por los pesos asociativos de la red, y si habéis entendido los fundamentos del PDP, seréis conscientes de que esta simple red es capaz de comportarse de acuerdo a la regla lógica.
Veréis, se trata de lo siguiente: cada unidad de entrada está capacitada para propagar una activación con peso +1 tanto a la unidad de salida, como a la unidad oculta. Sin embargo, la unidad oculta sólo se activará en el caso de que se supere su umbral propio que está establecido en 1,5; lo que exige sumar las conexiones de las dos unidades de entrada par que este efecto se produzca. Si las dos unidades de entrada efectivamente se encuentran activadas, entonces la unidad oculta refuerza el umbral de la unidad de salida con un peso de -2, modificando así su umbral previo que estaba cifrado en 0,5. De este modo, la suma de las conexiones entre las unidades de entrada y la oculta se anularían (1+1-2) y, consiguientemente, el patrón de actividad de la red en este caso particular representaría tal estado de cosas.
Si no estuviera ninguna de las dos unidades de entrada activada, obviamente no se produciría ningún efecto de propagación de activación en la red. Y, finalmente, si sólo es una la unidad de entrada activada, el patrón de actividad de la red representaría esta tercera posibilidad.
Si nos habéis seguido en la explicación, comprenderéis el significado de esta simple red en relación con el tipo de procesamiento distribuido y paralelo que defienden los modelos conexionistas. Ciertamente, su conducta podría interpretarse como si estuviera siguiendo la regla: `si, y sólo si, una de las unidades de entrada, sea cualquiera de ellas, está activa y la otra no, entonces responde'. Efectivamente, si el comportamiento del sistema estuviera sometido a reglas, tendríamos que postular la existencia de un conjunto de símbolos y de procedimientos efectivos para su manipulación. Pero la red sólo parece comportarse como si estuviera manipulando sus representaciones paso a paso, cuando lo único que hace es propagar activaciones excitatorias e inhibitorias entre sus unidades.
Muchas más, y muy interesantes, son las propiedades que definen a los modelos PDP. Y muchos también, y quizá tal vez algo más difíciles, los principios físicos y matemáticos que son necesarios para comprender en toda su hondura la propuesta conexionista. Pero, como primera aproximación al tema, creemos que ya es suficiente con lo expuesto en este núcleo de conocimiento.
CONTENIDO COMPLEMENTARIO CONEXIONISMO:
A continuación os ofrecemos un extracto del texto que hizo de capítulo 1 del libro `Procesamiento Distribuido en Paralelo'. En este libro se presentaron formalmente al gran publico los avances logrados desde esta perspectiva teórica que algunos han tachado de revolucionaria. En el extracto recogido aquí se muestra de un modo muy sugerente las virtudes y los supuestos teóricos de este potente programa de investigación. El Procesamiento Distribuido en Paralelo, aunque inspirado en un conjunto de ideas de larga tradición en la historia de la psicología y de la filosofía, consiguió entrar en el territorio de la psicología con una desafiante determinación de conquista. Y con sus nuevos postulados conexionistas, esta nueva concepción ha conseguido, cuando menos, proponerse como una fuerza alternativa a los modelos computacionalistas de la psicología cognitiva. Veamos como.
El atractivo del procesamiento distribuido en paralelo
¿Qué hace que las personas sean más listas que las máquinas? Desde luego las personas no son ni más rápidas ni más precisas. Y, sin embargo, a la gente le resulta mucho más fácil que a las máquinas percibir objetos situados en escenarios naturales y darse cuenta de sus relaciones, comprender el lenguaje y extraer de la memoria información adecuada al contexto, hacer planes y llevar a cabo acciones contextualmente apropiadas, así como ejecutar una amplia gama de tareas cognitivas naturales. A las personas también se les da mucho mejor que a las máquinas aprender a hacer todas estas cosas con mayor precisión y habilidad gracias a la experiencia.
¿A qué se deben estas diferencias? Una respuesta a esta pregunta, quizás la típica que cabe esperar de la inteligencia artificial, es que se trata de una cuestión de programación. La idea que hay tras esta respuesta es que, si dispusiéramos del programa de ordenador adecuado, seríamos capaces de reproducir la maestría y la adaptabilidad que caracterizan al procesamiento humano de la información.
No cabe duda de que esta respuesta es parcialmente correcta. Se han producido grandes avances en nuestra comprensión del conocimiento como consecuencia del desarrollo de lenguajes expresivos de ordenador de nivel superior y algoritmos de gran potencia. No cabe duda de que en el futuro se producirán más avances como éstos. Sin embargo, nosotros no creemos que todo se reduzca a una cuestión de programación.
En nuestra opinión, las personas son más inteligentes que los ordenadores actuales porque la arquitectura computacional básica que emplea el cerebro se encuentra mejor adaptada para enfrentarse a un especto fundamental de esas tareas naturales de procesamiento de información que tan bien se le dan a la gente.
Intuitivamente, parece que este tipo de tareas necesita mecanismos en los que cada aspecto de la información que hay en una situación dada pueda actuar sobre otros aspectos, de manera que cada aspecto esté influyendo sobre él. Para plasmar de forma articulada estas intuiciones, nosotros y otros investigadores hemos recurrido a una clase de modelos a los que hemos dado el nombre de modelos de procesamiento distribuido en paralelo o modelos PDP. Estos modelos parten de la suposición de que el procesamiento de la información se produce mediante la interacción de un gran número de elementos procesadores simples llamados “unidades”, cada una de las cuales envía señales excitadores e inhibidoras a otras unidades.
Una razón que explica el atractivo de los modelos PDP es su incuestionable “aroma fisiológico”. Parece que están mucho más ligados a la fisiología del cerebro que otros modelos de procesamiento de la información. El cerebro consta de un gran número de elementos con un elevado nivel de interconexión, que aparentemente se envían entre sí mensajes excitatorios e inhibitorios muy sencillos mediante los cuales ajustan sus excitaciones. Las propiedades de las unidades de muchos de los modelos PDP que vamos a examinar más adelante están inspirados en propiedades básicas de las estructuras neurales (...)
Aunque no cabe duda de que el atractivo de los modelos PDP se ve incrementado por su plausibilidad fisiológica y por el hecho de que estén inspirados en estructuras neurales, éstas no son las razones primarias por las que a nosotros nos resultan atractivos. Al fin y al cabo, nosotros somos científicos cognitivos y los modelos PDP nos resultan atractivos por razones psicológicas y computacionales. Estos modelos ofrecen la posibilidad de llegar a darnos una explicación, suficiente desde el punto de vista computacional y precisa desde el punto de vista psicológico, de los mecanismos que hay detrás de los fenómenos del conocimiento humano, los cuales nunca han conseguido explicarse satisfactoriamente mediante formalismos computacionales convencionales. Además, estos modelos han alterado radicalmente nuestra manera de pensar sobre la organización temporal del procesamiento, la naturaleza de la representación y los mecanismos del aprendizaje.
Los modelos de procesamiento distribuido en paralelo son una alternativa a los modelos seriales de la microestructura del conocimiento.
En los últimos años, ha habido mucho interés por el aprendizaje dentro de la ciencia cognitiva. Los enfoques computacionales del aprendizaje caen predominantemente dentro de lo que podríamos llamar “la tradición de la formulación de reglas explícitas”, de la que constituye una buena muestra el trabajo de Winston (1975), las sugerencias de Chomsky y el modelo ACT* de J. R. Anderson. Todos estos trabajos tienen en común la suposición de que la meta del aprendizaje es formular reglas explícitas (proposiciones, producciones, etc.) capaces de captar poderosas generalizaciones de una manera sucinta. Se trata de mecanismos muy poderosos, que generalmente poseen una cantidad considerable de conocimiento innato sobre un dominio determinado o un conjunto inicial de representaciones proposicionales primitivas, y que después formulan reglas generales hipotéticas, por ejemplo, comparando casos concretos y formulando generalizaciones explícitas.
El enfoque que adoptamos a la hora de desarrollar los modelos PDP es completamente distinto. En primer lugar, nosotros no partimos de la suposición de que el objetivo del aprendizaje sea la formulación de reglas explícitas. Nosotros partimos de la base de que lo que permite a una red de unidades simples actuar como si conociera unas reglas es la adquisición de fuerzas de conexión. En segundo lugar, no atribuimos al mecanismo de aprendizaje la posesión de potentes capacidades computacionales. Más bien, suponemos que existen mecanismos muy sencillos de modulación de las fuerzas de conexión que ajustan la fuerza de las conexiones entre las unidades basándose en información local que se encuentra disponible en las conexiones mismas.
Una vez captada la idea de que el conocimiento se encuentra almacenado en la fuerza de las interconexiones entre las unidades, surge una cuestión. ¿Existe algún motivo para que asignemos una unidad a cada patrón que deseemos aprender? Otra posibilidad, que exploramos ampliamente en este libro, es que el conocimiento relativo a un patrón concreto no se encuentre almacenado en las conexiones de una unidad especial reservada para ese patrón, sino que se encuentre distribuido por entre las conexiones pertenecientes a un gran número de unidades de procesamiento.
[Lo importante es que] se hace hincapié en los patrones de activación del conjunto de unidades y en mecanismos cuyo objetivo explícito es aprender cuáles son las fuerzas de conexión adecuadas para que los patrones de activación apropiados se activen en las circunstancias apropiadas.
Extracto del texto del Capítulo 1 introductorio a los modelos PDP o Conexionistas, tomado de su versión castellana, cuya referencia completa es la siguiente: McClelland, J. L., Rumelhart, D. E. Y Hinton, G. E. (1992). El atractivo del procesamiento distribuido en paralelo. En D. E. Rumelhart, J. L. McClelland y el grupo PDP, Introducción al procesamiento distribuido en paralelo (pp. 39-79). Madrid: Alianza (Edición original, 1986).
1
0,5
1,5
+1
+1
+1
+1
-2
Descargar
Enviado por: | Kamoni |
Idioma: | castellano |
País: | España |