Biblioteca122.739 documentos en línea

Artículo

A New Big Data Feature Selection Approach for Text ClassificationUn Nuevo Enfoque de Selección de Características de Big Data para la Clasificación de Texto

Resumen

La selección de características (FS) es una tarea fundamental para problemas de clasificación de texto. La selección de características de texto tiene como objetivo representar documentos utilizando las características más relevantes. Este proceso puede reducir el tamaño de los conjuntos de datos y mejorar el rendimiento de los algoritmos de aprendizaje automático. Muchos investigadores se han centrado en elaborar técnicas de FS eficientes. Sin embargo, la mayoría de los enfoques propuestos se evalúan para conjuntos de datos pequeños y se validan utilizando máquinas individuales. A medida que la dimensionalidad de los datos textuales aumenta, los métodos tradicionales de FS deben mejorarse y paralelizarse para manejar grandes datos textuales. Este artículo propone un enfoque distribuido para la selección de características basado en el método de información mutua (MI), que se aplica ampliamente en el reconocimiento de patrones y el aprendizaje automático. Una desventaja de MI es que ignora la frecuencia de los términos durante la selección de características. La propuesta introduce un método de FS distribuido, a saber, Máxima Frec

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento