Biblioteca122.739 documentos en línea

Artículo

Automatic Image Captioning Based on ResNet50 and LSTM with Soft AttentionGeneración automática de subtítulos de imágenes basada en ResNet50 y LSTM con Atención Suave

Resumen

La descripción automática de imágenes con descripciones adecuadas se ha convertido en un problema interesante y desafiante. En este documento, presentamos un modelo conjunto AICRL, que es capaz de llevar a cabo la descripción automática de imágenes basada en ResNet50 y LSTM con atención suave. AICRL consta de un codificador y un decodificador. El codificador adopta ResNet50 basado en la red neuronal convolucional, que crea una representación extensa de la imagen dada al incrustarla en un vector de longitud fija. El decodificador está diseñado con LSTM, una red neuronal recurrente y un mecanismo de atención suave, para enfocar selectivamente la atención en ciertas partes de una imagen para predecir la siguiente oración. Hemos entrenado AICRL en un gran conjunto de datos MS COCO 2014 para maximizar la probabilidad de la oración de descripción objetivo dada las imágenes de entrenamiento y lo hemos evaluado en varias métricas como BLEU, METEROR y CIDEr. Nuestros resultados experimentales indican que AICRL es efectivo en la gener

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento