Biblioteca122.294 documentos en línea

Artículo

Text to Realistic Image Generation with Attentional Concatenation Generative Adversarial NetworksGeneración de imágenes realistas a partir de texto con Redes Generativas Adversarias de Concatenación Atencional.

Resumen

En este documento, proponemos una Red Generativa Adversarial de Concatenación de Atención (ACGAN) con el objetivo de generar imágenes de alta resolución de 1024x1024. En primer lugar, proponemos una estructura de cascada multinivel para la síntesis de texto a imagen. Durante el progreso del entrenamiento, añadimos gradualmente nuevas capas y, al mismo tiempo, utilizamos los resultados y vectores de palabras de la capa anterior como entradas a la siguiente capa para generar imágenes de alta resolución con detalles fotorrealistas. En segundo lugar, se introduce el modelo de similitud multimodal de atención profunda en la red, y emparejamos los vectores de palabras con imágenes en un espacio semántico común para calcular una pérdida de emparejamiento detallada para entrenar al generador. De esta manera, podemos prestar atención a la información detallada a nivel de palabra en la semántica. Por último, se añade la medida de diversidad al discriminador, lo que permite que el generador obtenga direcciones de gradiente más diversas y mejore la diversidad de las muestras gener

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento