Durante décadas, se han utilizado técnicas de aprendizaje automático para procesar textos en amárico. La aplicación potencial del aprendizaje profundo en la clasificación de documentos en amárico no se ha explotado debido a la falta de recursos lingüísticos. En este artículo, presentamos un modelo de aprendizaje profundo para la clasificación de documentos de noticias en amárico. El modelo propuesto utiliza fastText para generar vectores de texto para representar el significado semántico de los textos y resolver el problema de los métodos tradicionales. La matriz de vectores de texto se introduce en la capa de incrustación de una red neuronal convolucional (CNN), que extrae automáticamente las características. Realizamos experimentos con un conjunto de datos de seis categorías de noticias, y nuestro método produjo una precisión de clasificación del 93,79%. Comparamos nuestro método con algoritmos de aprendizaje automático bien conocidos, como la máquina de vectores de apoyo (SVM), el perceptrón multicapa (MLP), el árbol de decisión (DT), XGBoost (XGB) y el bosque aleatorio (RF), y obtuvimos buenos resultados.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Sensor térmico activo para mejorar la detección distribuida de temperatura en matrices hápticas
Artículo:
Espectroscopía Raman de la película bicapa de DLC/a-Si preparada por arco catódico filtrado pulsado
Artículo:
Fabricación y caracterización de nanocapas energéticas de Al/NiO
Artículo:
Preparación de nanocompuestos de polímeros-silicato usando bentonitas colombianas modificadas
Artículo:
Cuestiones emergentes e ideas iniciales sobre biopelículas bacterianas: De la infección ortopédica a la metabolómica