La Teoría de las Categorías es una teoría matemática de gran abstracción en la que se analizan estructuras matemáticas y aquellas relaciones entre las mismas que tienen la propiedad de conservar sus respectivas estructuras internas.Pero en esta teoría puede estar la esencia misma de lo que hace nuestra intuición cuando aplica el conocimiento de un campo a otro distinto que parece semejante. Es por ello que esta teoría puede utilizarse para encontrar analogías entre las cosas que intuitivamente nos resultan similares y extraer las relaciones entre ellas que se nos presenten intuitivamente interesantes, en lugar de considerar cualquier relación o conjunto de relaciones espurias. Con estos filtros de relaciones y esquemas para la inferencia y generalización que aúnan el rigor matemático y la sintonía con la intuición podría haberse encontrado la piedra filosofal necesaria para avanzar en el conocimiento de la organización de la mente y, de paso, lo que es muy importante, de su evolución. Además, en la vertiente práctica, su aplicación permitiría grandes progresos en los campos enlazados de la robótica y la inteligencia artificial.
Un concepto esencial en esta teoría es el de
sistematicidad, que no es otra cosa que la maravillosamente económica capacidad de la mente para generalizar lo aprendido. La correcta explicación y el correcto entendimiento de este concepto son claves para entender la cognición humana. La teoría de las categorías parece ser el punto de partida perfecto para ello. Al menos esa es la idea del Doctor Steven Phillips, de la Mathematical Neuroinformatics Group, en el Human Technology Research Institute del National Institute of Advanced Industrial Science and Technology (AIST) en Tsukuba, Japón. Conjuntamente con William H. Wilson de la School of Computer Science and Engineering de la University of New South Wales en Sydney ha publicado lo que consideramos un extraordinario artículo «
A Category Theory explanation for the Systematicity of Human Cognition«. Y por eso hemos querido entrevistar al Doctor Phillips, que ha tenido la inmensa amabilidad de responder nuestras preguntas.
Estimado Profesor Phillips, Estamos muy impresionados por su Paper «A Category Theory explanation for the Systematicity of Human Cognition». Aunque no entiendo completamente las matematicas utilizadas en el Paper, parece que hay equivalencias entre estructuras matemáticas o (cognitivamente hablando) dominios de conocimiento y esta correspondencia entre estructuras o dominios pueden ser expresadas matemáticamente a su vez. Luego en lugar de enfocar el conocimiento en términos de objetos y relaciones concretas, desde los que hay manera fácil de generalizar ese conocimiento, es mejor ir un nivel mas arriba y abstraer relaciones, hablando de una manera simple.
1 – Déjeme que dé un ejemplo desde mi entendimiento del problema (Estoy seguro de que es erróneo, pero es solo para que usted construya una respuesta a partir de ello): La acción de «matar» es una relación abstracta porque puede aplicarse desde el dominio de los hombres al conjunto de las vacas y también desde el dominio de los virus al conjunto de los hombres. Hay una categoría de conocimiento que incluye «matar» en el sentido abstracto que contiene sus propiedades: no reflexiva, no simétrica etc, cuyo conocimiento puede ser aplicado a cualquier par de conjuntos que cumplen los requisitos de dicha categoría. ¿Es correcta esta descripción?
Esta es parte de la descripción, y una manera de comprender la sistematicidad. Dicho en términos simples: si tienes un proceso para representar cosas (A) que actúan como matadores, y un proceso para representar cosas que pueden ser matadas (B), y tienes un proceso para poner esas representaciones juntas para hacer una representación de una instanciación de «A mató B» entonces tienes una forma de hacer eso para (cualquiera) otra instancia de «A mató B» porque todas esas instancias son esencialmente el mismo proceso cognitivo.
La otra parte consiste en explicar por qué la sistematicidad necesariamente se sigue de la teoría propuesta para una arquitectura cognitiva particular, que fue el problema que originalmente suscitaron Fodor, Pylyshyn, y McLaughlin contra las arquitecturas conexionistas (redes neuronales): Aunque uno puede construir una arquitectura que tenga dicha propiedad (sistematicidad), uno también puede construir una que no la tenga. La gente es generalmente sistemática en sus habilidades cognitivas. Luego si tu teoría permite arquitecturas que tienen sistematicidad, pero permite asimismo arquitecturas que no la tengan, entonces necesitas una explicación adicional de por qué la sistematicidad siempre acaece. Es decir necesitas una explicación más allá de simplemente asumir que es posible.
Ken Aizawa escribió una excelente revisión del debate sobre la sistematicidad. Discutió con gran detalle este problema consistente en hacer la asunción ad hoc de que sólo las opciones sistemáticas suceden. También apuntó al hecho de que las aproximaciones clásicas sufren igualmente el mismo tipo de problemas. Es decir, aunque uno pueda idear sistemas de símbolos con sistematicidad, puede también idearlos sin esta propiedad. Por lo tanto ni el modelo clásico ni el conexionista explican totalmente la sistematicidad, aunque ambos la muestren en casos particulares.
2 Dejemos a un lado nuestras interpretaciones y hable usted mismo. ¿Puede explicarnos con un pequeño ejemplo para aficionados la sistematicidad de la mente humana?
Un ejemplo simple puede consistir en escribir números con varios dígitos. Una vez que tienes la habilidad de escribir los dígitos del cero hasta el nueve, y la habilidad de juntarlos para formar algunos ejemplos de números mas grandes, entonces puedes hacerlo para cualquier numero de varios dígitos. Eso es todo. No encontrarás gente que pueda escribir el numero 123 pero no el 321.
3- el relativamente nuevo desarrollo de la Teoría de las Categorias en Matemáticas está revolucionando muchos campos en nuestro tiempo. En ciencias de la computación hay lenguajes como Haskell que están casi completamente dominadas por estructuras matemáticas que derivan de la Teoría de las Categorías. ¿Que hace a la TC tan potente en términos explicativos y tan útil?
Pienso que el poder de la TC viene de la combinación de abstracción y precisión. Enfocada en las relaciones entre objetos (las llamadas flechas o morfismos que constituyen una categoría), la TC puede abstraer de los detalles superficiales de los problemas, luego es potencialmente aplicable a un campo mas amplio de problemas.
Por supuesto los psicólogos han reconocido la importancia de las relaciones entre las entidades que forman parte de la estructura de una tarea. Pero tomar una perspectiva relacional no es suficiente en sí mismo, ya que hay generalmente muchas mas relaciones potenciales entre entidades que entidades propiamente dichas, lo cual `puede volver el problema mas complicado. En la TC la composición de los morfismos (relaciones) es importante. Cómo se combinen las relaciones en nuevas relaciones da una importante información acerca del dominio que se estudie. Para ser una categoría, los morfismos (relaciones) deben componerse, y su composición debe ser asociativa. Luego no cualquier conjunto de relaciones construye una categoría. Las categorías, los functores y demás construcciones de la TC están definidas con precisión (aunque de forma abstracta). Si puedes re-expresar un problema en términos de TC, entonces te es posible también acceder a muchos de los resultados ya dados por los teóricos de la TC, lo que puede ser de utilidad para resolver el problema que se tenga entre manos.
4.- Además de en las aplicaciones prácticas, aquí estamos interesados en la estructura de la mente humana. Más allá de una solución práctica para los problemas de Inteligencia Artificial: ¿Piensa usted que la mente humana opera de esta manera?. El lenguaje humano ¿Refleja de alguna manera ese modelo matemático?
Las estructuras matemáticas y en particular las de TC dan una buena descripción de la cognición en términos de generalidad y precisión, aunque puede que no sean las más fáciles de entender. SIn embargo, esto no quiere decir que la gente vaya por ahí pensando en objetos matemáticos de TC. El mecanismo que esas estructuras matemáticas describen puede ser computacional, y la Teoría de Categorías Computacional es un campo que aplica la teoría de categorías a la computación. Así que, si miras la cognición humana como un sistema computacional, entonces la aproximación de la TC está dentro del espíritu general de una teoría computacional de la mente.
5- Si esto es así, ¿tiene usted alguna idea acerca de como llegaron a evolucionar esa sistematicidad y abstracción?. ¿Cuánto podría ser innato y cuánto adquirido de acuerdo con la arquitectura propuesta?. Esas categorías ¿podrían construirse a base de simple hechos descubiertos secuencialmente?
La relación entre la abstracción (y en particular las adjunciones, el sistema formal de relaciones entre dominios de conocimieto definido por la CT que uso para explicar la sistematicidad) y el desarrollo/aprendizaje es algo que quiero estudiar. Aunque es difícil decir cuánto de ello es innato, la TC apunta a múltiples niveles de representación que están estrechamente acoplados. En el contexto del aprendizaje, esto sugiere que las representaciones a múltiples niveles se aprenden simultáneamente. Esta perspectiva difiere del punto de vista del conexionismo, donde cada representación más abstracta se supone que emerge de un único nivel de aprendizaje movido por el ajuste de los pesos de las conexiones. Desde mi punto de vista, esta forma de conexionismo ha tenido dificultades para proveer de una idea plausible para el desarrollo de una cognición de mas alto nivel. El problema no es con la idea de «emergencia» como tal, sino que cualquier cosa que emerja (por ejemplo, regiones en el espacio de activación que uno puede identificar como correspondientes a un concepto abstracto) no es nunca utilizada por el sistema de aprendizaje. Luego ese tipo de sistemas requiere un re-entrenamiento extensivo para modificar su uso de esos conceptos abstractos (que ha descubierto), cosa que los humanos no necesitan. Por eso yo no espero, por ejemplo, que las adjunciones puedan ser construidas a partir de hechos simples solamente. En vez de eso, la capacidad para construir adjunciones debe ser parte de la arquitectura básica, y las adjunciones particulares requerirán aprendizaje a través de la interacción con el mundo exterior.
6- cuales son las perspectivas prácticas de esta alternativa y cuales van a ser sus próximos pasos ahí en Tsukuba?
Una aplicación práctica de la TC esta en el campo de la robótica (cognitiva). Hay paralelos en la manera en que la ciencia cognitiva y la robótica han progresado en las últimas décadas, habiendo sido influenciadas por teorías conexionistas y conductistas, respectivamente. Y aunque ambos campos han hecho progresos significativos en ciertas áreas, los investigadores son cada vez más consciente de los límites que tienen esas aproximaciones al problema. Un paso adelante sería el de incorporar la TC en el desarrollo e implementacion de las arquitecturas cognitivas.
7- ¿En que trabaja ahora? ¿Cual es el misterio que desearía desvelar?
Ahora estoy trabajando en extender la TC a las propiedades cuasi-sistemáticas, como las que se encuentran en el lenguaje, donde algunas pero no todas las posibles combinaciones de sus constituyentes están relacionadas sistemáticamente. Un ejemplo de cuasi-sistematicidad es la concordancia sujeto-verbo en Inglés. Por ejemplo, decimos “dogs chase cats”, “cats chase dogs”, y “dogs chase cat”, pero no “dog chase cats”, ni “dog chase cat”. Esto pretendemos abordarlo mediante una explicación de la sistematicidad mas general, que incluya los ejemplos previos como un caso especial. Espero tener pronto disponible un nuevo artículo detallando esta explicación.
Para mi, uno de los misterios más grandes es por qué la mente existe. ¿Cómo nuestra vida mental aparece a partir del mundo físico? Supongo que esa cuestión acerca del origen de la mente es para el científico cognitivo lo que la cuestión acerca del origen de la vida es para el biólogo.
Naturalmente la mente aparece a partir de propiedades dinámicas o computacionales del cerebro y su interacción con el cuerpo y el mundo. Pero ¿que propiedades específicamente distinguen al cerebro como la base de la mente de esos otros sistemas computacionales o dinámicos también incorporados que se suponen no son parte del pensamiento?