Biblioteca122.294 documentos en línea

Artículo

Extracting Parallel Sentences from Nonparallel Corpora Using Parallel Hierarchical Attention NetworkExtracción de frases paralelas de corpus no paralelos mediante una red de atención jerárquica paralela

Resumen

La recopilación de oraciones paralelas a partir de datos no paralelos es un problema de investigación del procesamiento del lenguaje natural que viene de lejos. En particular, las oraciones paralelas de entrenamiento son muy importantes para la calidad de los sistemas de traducción automática. Aunque muchos de los métodos existentes han mostrado resultados alentadores, no pueden aprender varios pesos de alineación en las oraciones paralelas. Para abordar este problema, proponemos una novedosa red neuronal de atención jerárquica paralela que codifica las oraciones monolingües frente a las bilingües y construye un clasificador para extraer las oraciones paralelas. En particular, nuestra estructura del mecanismo de atención puede aprender diferentes pesos de alineación de las palabras en las oraciones paralelas. Los resultados experimentales muestran que nuestro modelo puede obtener un rendimiento de vanguardia en el conjunto de datos inglés-francés, inglés-alemán e inglés-chino de la tarea compartida BUCC 2017 sobre la extracción de oraciones paralelas.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento