El objetivo de la recuperación multimodal es encontrar datos relevantes de distintas modalidades, como imágenes y texto. Para salvar la brecha entre modalidades, la mayoría de los métodos existentes requieren muchos pares de muestras acopladas como datos de entrenamiento. Para reducir la demanda de datos de entrenamiento, proponemos un marco de recuperación intermodal que utiliza muestras acopladas y desacopladas. El marco consta de dos partes: La abstracción, que tiene como objetivo proporcionar representaciones monomodales de alto nivel con muestras desacopladas; a continuación, la asociación vincula diferentes modalidades a través de unas pocas muestras de entrenamiento acopladas. Además, bajo este marco, implementamos un método de recuperación cross-modal basado en la consistencia entre la estructura semántica de múltiples modalidades. En primer lugar, tanto las imágenes como el texto se representan con la representación basada en la estructura semántica, que representa cada muestra como su similitud a partir de los puntos de referencia que se generan a partir de la agrupación monomodal. A continuación, los puntos de referencia de las distintas modalidades se alinean mediante una estrategia de aprendizaje activo. Por último, la similitud intermodal puede medirse con la coherencia entre las estructuras semánticas. Los resultados del experimento demuestran que, con una abstracción adecuada de los datos monomodales, la relación entre las distintas modalidades puede simplificarse, y que incluso unos datos de entrenamiento multimodales acoplados limitados son suficientes para obtener una precisión de recuperación satisfactoria.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Estabilidad generalizada de la ecuación funcional cuadrática de Euler-Lagrange
Artículo:
Estabilización del sistema de bola sobre viga mediante el enfoque inverso de Lyapunov
Artículo:
Operadores Hermitianos e Isometrías en Álgebras de Banach de Aplicaciones Continuas con Valores en -Álgebras Conmutativas Unitarias
Artículo:
Algoritmo mejorado de detección de comunidades locales mediante probabilidad de selección
Artículo:
Sincronización generalizada de un sistema caótico estocástico discreto con coeficiente de distribución de Poisson