El objetivo de la recuperación multimodal es encontrar datos relevantes de distintas modalidades, como imágenes y texto. Para salvar la brecha entre modalidades, la mayoría de los métodos existentes requieren muchos pares de muestras acopladas como datos de entrenamiento. Para reducir la demanda de datos de entrenamiento, proponemos un marco de recuperación intermodal que utiliza muestras acopladas y desacopladas. El marco consta de dos partes: La abstracción, que tiene como objetivo proporcionar representaciones monomodales de alto nivel con muestras desacopladas; a continuación, la asociación vincula diferentes modalidades a través de unas pocas muestras de entrenamiento acopladas. Además, bajo este marco, implementamos un método de recuperación cross-modal basado en la consistencia entre la estructura semántica de múltiples modalidades. En primer lugar, tanto las imágenes como el texto se representan con la representación basada en la estructura semántica, que representa cada muestra como su similitud a partir de los puntos de referencia que se generan a partir de la agrupación monomodal. A continuación, los puntos de referencia de las distintas modalidades se alinean mediante una estrategia de aprendizaje activo. Por último, la similitud intermodal puede medirse con la coherencia entre las estructuras semánticas. Los resultados del experimento demuestran que, con una abstracción adecuada de los datos monomodales, la relación entre las distintas modalidades puede simplificarse, y que incluso unos datos de entrenamiento multimodales acoplados limitados son suficientes para obtener una precisión de recuperación satisfactoria.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Ecuación de Falkner-Skan con transferencia de calor: Un nuevo enfoque numérico estocástico
Artículos:
Aproximación Galerkin Local Discontinua Totalmente Discreta para Ecuaciones de Subdifusión/Superdifusión Fraccional en Tiempo-Espacio
Artículos:
Adaptación del contexto de modelos de productividad laboral en la construcción basados en sistemas de inferencia difusa.
Artículos:
Dinámica Fraccional de Algoritmos Genéticos Utilizando Teselación de Espacio Hexagonal
Artículos:
Una solución al problema de completitud para espacios cuasi-pseudométricos.
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.