El lenguaje y la visin son las dos partes ms esenciales de la inteligencia humana para interpretar el mundo real que nos rodea. Cmo establecer conexiones entre lenguaje y visin es el punto clave de la investigacin actual. Recientemente se han estudiado a fondo mtodos de multimodalidad como la incrustacin semntica visual, que unifica imgenes y textos correspondientes en el mismo espacio de caractersticas. Inspirndonos en el reciente desarrollo del aumento de datos de texto y en una tcnica sencilla pero potente propuesta denominada EDA (easy data augmentation), podemos ampliar la informacin con datos dados utilizando EDA para mejorar el rendimiento de los modelos. En este artculo, aprovechamos la tcnica de aumento de datos de texto y la inicializacin de incrustacin de palabras para la recuperacin multimodal. Utilizamos EDA para el aumento de los datos de texto, la inicializacin de la incrustacin de palabras para el codificador de texto basado en redes neuronales recurrentes y la minimizacin de la brecha entre los dos espacios mediante la prdida de clasificacin de tripletas con minera negativa dura. En dos conjuntos de datos basados en Flickr, conseguimos la misma recuperacin con slo el 60% del conjunto de datos de entrenamiento que con el entrenamiento normal con todos los datos disponibles. Los resultados de los experimentos demuestran la mejora de nuestro modelo propuesto y, en todos los conjuntos de datos de este artculo (Flickr8k, Flickr30k y MS-COCO), nuestro modelo obtiene mejores resultados en las tareas de anotacin y recuperacin de imgenes; los experimentos tambin demuestran que el aumento de datos de texto es ms adecuado para conjuntos de datos ms pequeos, mientras que la inicializacin con incrustacin de palabras es adecuada para los ms grandes.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Investigación de un método estocástico inverso para estimar una fuerza externa: Aplicaciones a la interacción entre el oleaje y la estructura
Artículo:
Las desigualdades de Hijazi en variedades riemannianas completas
Artículo:
Un Nuevo Algoritmo Numérico para Problemas de Valor de Frontera de Dos Puntos
Artículo:
Nota sobre el análisis de convergencia del Método de Perturbación Homotópica para Ecuaciones en Derivadas Parciales Fraccionarias
Artículo:
Aprendiendo de los datos de dispositivos ponibles a gran escala para predecir la tendencia epidémica de COVID-19
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones