Biblioteca122.294 documentos en línea

Artículo

Mixed-Level Neural Machine TranslationTraducción automática neuronal de nivel mixto

Resumen

Al construir el primer sistema de traducción automática neural ruso-vietnamita, nos enfrentamos al problema de elegir un sistema de unidades de traducción en el que se basan las incrustaciones de origen y destino. Los sistemas de unidades de traducción homogéneos disponibles con la misma unidad de traducción en el lado de origen y en el de destino no se adaptan perfectamente al par de idiomas investigado. Para resolver el problema, en este trabajo proponemos un novedoso sistema de unidades de traducción heterogéneas, teniendo en cuenta las características lingüísticas de la lengua rusa sintética y la lengua vietnamita analítica. En concreto, reducimos el nivel de incrustación en la parte de origen dividiendo el token en subtokens y aumentamos el nivel de incrustación en la parte de destino fusionando tokens vecinos en un supertoken. Los resultados del experimento muestran que el sistema heterogéneo propuesto mejora en 1,17 BLEU al mejor sistema de traducción homogéneo ruso-vietnamita existente. Nuestro enfoque podría aplicarse a la construcción de robots de traducción para pares de idiomas con diferentes características lingüísticas.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento