Biblioteca122.294 documentos en línea

Artículo

Hybrid Feature Selection for Amharic News Document ClassificationSelección híbrida de características para la clasificación de noticias en amárico

Resumen

Hoy en da, la cantidad de documentos digitales en amrico ha crecido rpidamente. Por ello, la clasificacin automtica de textos es extremadamente importante. La seleccin adecuada de las caractersticas tiene un papel crucial en la precisin de la clasificacin y el tiempo de clculo. Cuando el conjunto inicial de caractersticas es considerablemente grande, es importante elegir las caractersticas adecuadas. En este artculo, presentamos un mtodo hbrido de seleccin de caractersticas, denominado IGCHIDF, que consiste en mtodos de seleccin de caractersticas de ganancia de informacin (IG), chi-cuadrado (CHI) y frecuencia de documentos (DF). Evaluamos el mtodo de seleccin de caractersticas propuesto en dos conjuntos de datos: el conjunto de datos 1, que contiene 9 categoras de noticias, y el conjunto de datos 2, que contiene 13 categoras de noticias. Nuestros resultados experimentales muestran que el mtodo propuesto funciona mejor que otros mtodos en ambos conjuntos de datos. La precisin de clasificacin del mtodo IGCHIDF es hasta un 3,96% superior a la del mtodo IG, hasta un 11,16% superior a la del mtodo CHI y un 7,3% superior a la del mtodo DF en el conjunto de datos 2, respectivamente.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento