Al construir el primer sistema de traducción automática neural ruso-vietnamita, nos enfrentamos al problema de elegir un sistema de unidades de traducción en el que se basan las incrustaciones de origen y destino. Los sistemas de unidades de traducción homogéneos disponibles con la misma unidad de traducción en el lado de origen y en el de destino no se adaptan perfectamente al par de idiomas investigado. Para resolver el problema, en este trabajo proponemos un novedoso sistema de unidades de traducción heterogéneas, teniendo en cuenta las características lingüísticas de la lengua rusa sintética y la lengua vietnamita analítica. En concreto, reducimos el nivel de incrustación en la parte de origen dividiendo el token en subtokens y aumentamos el nivel de incrustación en la parte de destino fusionando tokens vecinos en un supertoken. Los resultados del experimento muestran que el sistema heterogéneo propuesto mejora en 1,17 BLEU al mejor sistema de traducción homogéneo ruso-vietnamita existente. Nuestro enfoque podría aplicarse a la construcción de robots de traducción para pares de idiomas con diferentes características lingüísticas.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un algoritmo memético para minimizar el makespan en el problema del Job Shop Scheduling
Artículo:
El efecto de los cambios en la inclinación de los incisivos inferiores en la recesión gingival.
Artículo:
Cinética de la Transformación de Fase del Indio en Presencia de Politetrafluoroetileno: Implicaciones para las Medidas DSC en Polímeros y sus Compuestos
Artículo:
Investigación del chip de muestreo microfluídico de ruptura dieléctrica
Artículo:
Síntesis y actividades catalíticas y biológicas de nanopartículas de plata y cobre utilizando Cassia occidentalis