Biblioteca122.294 documentos en línea

Artículo

Deep Multimodal Fusion Autoencoder for Saliency Prediction of RGB-D ImagesAutocodificador profundo de fusión multimodal para la predicción de saliencia de imágenes RGB-D

Resumen

En los últimos años, la predicción de regiones salientes en imágenes RGB-D se ha convertido en un foco de investigación. En comparación con su homólogo RGB, la predicción de saliencia de las imágenes RGB-D es más difícil. En este estudio, proponemos un nuevo autocodificador profundo de fusión multimodal para la predicción de saliencia de imágenes RGB-D. El autocodificador central entrenable del modelo de predicción de saliencia RGB-D emplea dos modalidades brutas (RGB e información de profundidad/disparidad) como entradas y sus correspondientes atributos de fijación ocular como etiquetas. El autocodificador consta de cuatro redes principales: red de canales de color, red de canales de disparidad, red de concatenación de características y red de aprendizaje de características. El autocodificador puede extraer la compleja relación y aprovechar al máximo las características complementarias entre las señales de color y disparidad. Por último, el mapa de saliencia se predice a través de una subred de combinación de características, que combina las características profundas extraídas de un aprendizaje previo y subredes de aprendizaje de características convolucionales. Comparamos el autocodificador propuesto con otros modelos de predicción de saliencia en dos conjuntos de datos de referencia disponibles públicamente. Los resultados demuestran que el autocodificador propuesto supera a estos modelos por un margen significativo.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento