La identificación de palabras prestadas se ha estudiado en los últimos años para aliviar la escasez de datos en varias tareas de procesamiento del lenguaje natural (PLN), como la traducción automática, la recuperación de información multilingüe, etc. Sin embargo, los estudios recientes sobre este tema suelen centrar sus esfuerzos en las lenguas de alto nivel de recursos (como el chino, el inglés y el ruso); en el caso de las lenguas de bajo nivel de recursos, como el uigur y el mongol, debido a la limitación de recursos y a la falta de datos anotados, la identificación de palabras de préstamo en estas lenguas tiende a tener un menor rendimiento. Para superar este problema, primero proponemos un método de aumento de datos basado en restricciones léxicas para generar datos de entrenamiento para la identificación de palabras de préstamo en lenguas de bajo recurso; después, se introduce un modelo de identificación de palabras de préstamo basado en una RNN logarítmica-lineal para mejorar el rendimiento de la identificación de palabras de préstamo en lenguas de bajo recurso mediante la incorporación de características como incrustaciones a nivel de palabra, incrustaciones a nivel de carácter, similitud de pronunciación y partes del habla (POS) en un modelo. Los resultados experimentales sobre la identificación de palabras de préstamo en uigur (en este estudio, nos centramos principalmente en las palabras de préstamo árabes, chinas, rusas y turcas en uigur) mostraron que nuestro método propuesto logra el mejor rendimiento en comparación con varios sistemas de referencia fuertes.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Comparación de dos controladores de fuerza-posición con compensación de la gravedad simulados en un brazo humanoide
Video:
Evolución estructural de las nanopartículas mediante imágenes de rayos X coherentes de Bragg-Marie-Ingrid Richard
Artículo:
Prevalencia y asociación de la infección por micoplasma en el desarrollo de la enfermedad arterial coronaria
Artículo:
Estudio espectroscópico del infrarrojo cercano de minerales de clorita
Artículo:
Diagnóstico de la enfermedad de Alzheimer basado en características corticales y subcorticales