El objetivo de la recuperación multimodal es encontrar datos relevantes de distintas modalidades, como imágenes y texto. Para salvar la brecha entre modalidades, la mayoría de los métodos existentes requieren muchos pares de muestras acopladas como datos de entrenamiento. Para reducir la demanda de datos de entrenamiento, proponemos un marco de recuperación intermodal que utiliza muestras acopladas y desacopladas. El marco consta de dos partes: La abstracción, que tiene como objetivo proporcionar representaciones monomodales de alto nivel con muestras desacopladas; a continuación, la asociación vincula diferentes modalidades a través de unas pocas muestras de entrenamiento acopladas. Además, bajo este marco, implementamos un método de recuperación cross-modal basado en la consistencia entre la estructura semántica de múltiples modalidades. En primer lugar, tanto las imágenes como el texto se representan con la representación basada en la estructura semántica, que representa cada muestra como su similitud a partir de los puntos de referencia que se generan a partir de la agrupación monomodal. A continuación, los puntos de referencia de las distintas modalidades se alinean mediante una estrategia de aprendizaje activo. Por último, la similitud intermodal puede medirse con la coherencia entre las estructuras semánticas. Los resultados del experimento demuestran que, con una abstracción adecuada de los datos monomodales, la relación entre las distintas modalidades puede simplificarse, y que incluso unos datos de entrenamiento multimodales acoplados limitados son suficientes para obtener una precisión de recuperación satisfactoria.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Video:
El defecto fundamental de las matemáticas
Artículo:
Una extensión de la desigualdad de Young
Artículo:
Un enfoque LMI para la estabilidad de sistemas lineales variables en el tiempo con perturbación no lineal en escalas de tiempo.
Artículo:
Un nuevo mapa caótico híbrido y su aplicación al cifrado y ocultación de imágenes
Artículo:
l 1 -Diseño de controladores de estado inducido para sistemas difusos positivos
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Los web services como herramienta generadora de valor en las organizaciones