Hoy en da, la cantidad de documentos digitales en amrico ha crecido rpidamente. Por ello, la clasificacin automtica de textos es extremadamente importante. La seleccin adecuada de las caractersticas tiene un papel crucial en la precisin de la clasificacin y el tiempo de clculo. Cuando el conjunto inicial de caractersticas es considerablemente grande, es importante elegir las caractersticas adecuadas. En este artculo, presentamos un mtodo hbrido de seleccin de caractersticas, denominado IGCHIDF, que consiste en mtodos de seleccin de caractersticas de ganancia de informacin (IG), chi-cuadrado (CHI) y frecuencia de documentos (DF). Evaluamos el mtodo de seleccin de caractersticas propuesto en dos conjuntos de datos: el conjunto de datos 1, que contiene 9 categoras de noticias, y el conjunto de datos 2, que contiene 13 categoras de noticias. Nuestros resultados experimentales muestran que el mtodo propuesto funciona mejor que otros mtodos en ambos conjuntos de datos. La precisin de clasificacin del mtodo IGCHIDF es hasta un 3,96% superior a la del mtodo IG, hasta un 11,16% superior a la del mtodo CHI y un 7,3% superior a la del mtodo DF en el conjunto de datos 2, respectivamente.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Diseño y optimización de un sistema de control de fábrica inteligente basado en un modelo de sistema gemelo digital
Artículo:
Análisis de flutter basado en la grilla de Smolyak con incertidumbre aerodinámica estocástica
Artículo:
Límites de Aprendizaje del Principio de ERM para Secuencias de Muestras Dependientes del Tiempo
Artículo:
Algunos teoremas de punto fijo de tipo integral para aplicaciones no autoinyectivas que satisfacen condiciones contractivas débiles generalizadas en espacios simétricos.
Artículo:
Dinámica casi exacta de Coulomb de cargas iguales.