logo móvil
logo tablet

Cookies y Privacidad

Usamos cookies propias y de terceros para mejorar la experiencia de nuestros usuarios, analizar el tráfico del sitio y personalizar contenido. Si continúas navegando, asumimos que aceptas su uso. Para más información, consulta nuestra Política de Cookies

Portada

Imagen. / Cortesía de los investigadores.

2025-04-22

Una vía visual en el cerebro puede hacer más que reconocer objetos


Cuando la información visual entra al cerebro, viaja a través de dos vías que procesan diferentes aspectos de la información. Durante décadas, los científicos han planteado la hipótesis de que una de estas vías, la vía visual ventral, es responsable del reconocimiento de objetos, y que podría haber sido optimizada por la evolución para realizar precisamente eso.

En consonancia con esto, en la última década, los científicos del MIT han descubierto que cuando los modelos computacionales de la anatomía de la corriente ventral se optimizan para resolver la tarea de reconocimiento de objetos, son predictores notablemente buenos de las actividades neuronales en la corriente ventral.

Sin embargo, en un nuevo estudio, investigadores del MIT han demostrado que, al entrenar este tipo de modelos en tareas espaciales, los modelos resultantes también predicen con bastante precisión las actividades neuronales del flujo ventral. Esto sugiere que el flujo ventral podría no estar optimizado exclusivamente para el reconocimiento de objetos.

Esto deja abierta la pregunta sobre para qué se optimiza la corriente ventral. Creo que la perspectiva predominante en nuestro campo es que la corriente ventral está optimizada para el reconocimiento de objetos, pero este estudio ofrece una nueva perspectiva: que la corriente ventral también podría optimizarse para tareas espaciales, afirma Yudi Xie, estudiante de posgrado del MIT.

Xie es el autor principal del estudio, que se presentará en la Conferencia Internacional sobre Representaciones del Aprendizaje. Otros autores del artículo son Weichen Huang, estudiante visitante del programa del Instituto de Investigación Científica del MIT; Esther Alter, ingeniera de software del programa Quest for Intelligence del MIT; Jeremy Schwartz, miembro del equipo técnico de investigación patrocinado; Joshua Tenenbaum, profesor de ciencias cerebrales y cognitivas; y James DiCarlo, profesor Peter de Florez de Ciencias Cerebrales y Cognitivas, director del programa Quest for Intelligence y miembro del Instituto McGovern para la Investigación Cerebral del MIT.

Más allá del reconocimiento de objetos

Cuando observamos un objeto, nuestro sistema visual no solo puede identificarlo, sino también determinar otras características como su ubicación, su distancia y su orientación espacial. Desde principios de la década de 1980, los neurocientíficos han planteado la hipótesis de que el sistema visual de los primates se divide en dos vías: la ventral, encargada del reconocimiento de objetos, y la dorsal, que procesa las características relacionadas con la ubicación espacial.

Durante la última década, los investigadores han trabajado para modelar la corriente ventral mediante un tipo de modelo de aprendizaje profundo conocido como red neuronal convolucional (CNN). Los investigadores pueden entrenar estos modelos para realizar tareas de reconocimiento de objetos alimentándolos con conjuntos de datos que contienen miles de imágenes junto con etiquetas de categoría que las describen.

Las versiones más avanzadas de estas CNN presentan altas tasas de éxito en la categorización de imágenes. Además, los investigadores han descubierto que las activaciones internas de los modelos son muy similares a las actividades de las neuronas que procesan la información visual en el flujo ventral. Asimismo, cuanto más similares sean estos modelos al flujo ventral, mejor rendimiento tendrán en las tareas de reconocimiento de objetos. Esto ha llevado a muchos investigadores a plantear la hipótesis de que la función principal del flujo ventral es el reconocimiento de objetos.

Sin embargo, estudios experimentales, en particular un estudio del laboratorio DiCarlo de 2016, han descubierto que la corriente ventral también parece codificar características espaciales. Estas características incluyen el tamaño del objeto, su orientación (su grado de rotación) y su ubicación dentro del campo de visión. Con base en estos estudios, el equipo del MIT se propuso investigar si la corriente ventral podría desempeñar funciones adicionales más allá del reconocimiento de objetos.

“Nuestra pregunta central en este proyecto fue: ¿es posible pensar en la corriente ventral como optimizada para realizar estas tareas espaciales en lugar de solo tareas de categorización?”, dice Xie.

Para comprobar esta hipótesis, los investigadores se propusieron entrenar una CNN para identificar una o más características espaciales de un objeto, como la rotación, la ubicación y la distancia. Para entrenar los modelos, crearon un nuevo conjunto de datos de imágenes sintéticas. Estas imágenes muestran objetos como teteras o calculadoras superpuestos sobre diferentes fondos, en ubicaciones y orientaciones etiquetadas para facilitar su aprendizaje por el modelo.

Los investigadores descubrieron que las CNN entrenadas en solo una de estas tareas espaciales mostraron un alto nivel de “neuroalineación” con la corriente ventral, muy similar a los niveles observados en los modelos de CNN entrenados en el reconocimiento de objetos.

Los investigadores miden la neuroalineación mediante una técnica desarrollada por el laboratorio de DiCarlo. Esta técnica consiste en pedir a los modelos, una vez entrenados, que predigan la actividad neuronal que una imagen específica generaría en el cerebro. Los investigadores descubrieron que cuanto mejor se desempeñaban los modelos en la tarea espacial en la que habían sido entrenados, mayor era la neuroalineación que mostraban.

“Creo que no podemos asumir que el flujo ventral solo realiza la categorización de objetos, ya que muchas de estas otras funciones, como las tareas espaciales, también pueden generar esta fuerte correlación entre la neuroalineación de los modelos y su rendimiento”, afirma Xie. “Nuestra conclusión es que se puede optimizar mediante la categorización o la realización de estas tareas espaciales, y ambas proporcionan un modelo similar al del flujo ventral, según nuestras métricas actuales para evaluar la neuroalineación”.

Comparación de modelos

Los investigadores investigaron entonces por qué estos dos enfoques (entrenamiento para el reconocimiento de objetos y entrenamiento para las características espaciales) conducían a niveles similares de alineamiento neuronal. Para ello, realizaron un análisis conocido como alineamiento de núcleo centrado (CKA), que les permite medir el grado de similitud entre representaciones en diferentes CNN. Este análisis mostró que, en las capas iniciales e intermedias de los modelos, las representaciones que aprenden son prácticamente indistinguibles.

“En estas primeras capas, es prácticamente imposible distinguir estos modelos con solo observar sus representaciones”, afirma Xie. “Parece que aprenden una representación muy similar o unificada en las capas iniciales e intermedias, y en las etapas posteriores divergen para respaldar diferentes tareas”.

Los investigadores plantean la hipótesis de que, incluso cuando los modelos se entrenan para analizar una sola característica, también tienen en cuenta las características "no objetivo", es decir, aquellas con las que no se entrenan. Cuando los objetos presentan una mayor variabilidad en las características no objetivo, los modelos tienden a aprender representaciones más similares a las aprendidas por los modelos entrenados en otras tareas. Esto sugiere que los modelos utilizan toda la información disponible, lo que puede resultar en que diferentes modelos generen representaciones similares, afirman los investigadores.

“Una mayor variabilidad de características no objetivo realmente ayuda al modelo a aprender una mejor representación, en lugar de aprender una representación que las ignora”, dice Xie. “Es posible que los modelos, aunque se entrenan con un objetivo, estén aprendiendo simultáneamente otras cosas debido a la variabilidad de estas características no objetivo”.

En trabajos futuros, los investigadores esperan desarrollar nuevas formas de comparar diferentes modelos, con la esperanza de aprender más sobre cómo cada uno desarrolla representaciones internas de objetos basados ​​en diferencias en las tareas de entrenamiento y los datos de entrenamiento.

Podrían existir ligeras diferencias entre estos modelos, aunque nuestra forma actual de medir su similitud con el cerebro nos indica que se encuentran en un nivel muy similar. Esto sugiere que quizás aún quede trabajo por hacer para mejorar la comparación del modelo con el cerebro, de modo que podamos comprender mejor para qué se optimiza exactamente la corriente ventral, afirma Xie.

La investigación fue financiada por la Semiconductor Research Corporation y la Agencia de Proyectos de Investigación Avanzada de Defensa de Estados Unidos.

Autor

Autor
Imagen MIT

MIT

Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...

Noticias más leídas

Temas Virtualpro