Biblioteca122.739 documentos en línea

Artículo

A Lightweight Data Preprocessing Strategy with Fast Contradiction Analysis for Incremental Classifier LearningUna estrategia ligera de preprocesamiento de datos con análisis rápido de contradicciones para el aprendizaje incremental de clasificadores

Resumen

Un objetivo primordial en la construcción de modelos de minería de flujos de datos es lograr una buena precisión, un aprendizaje rápido y robustez frente al ruido. Aunque en el pasado se han propuesto muchas técnicas, los esfuerzos por mejorar la precisión de los modelos de clasificación han sido algo dispares. Estas técnicas incluyen, entre otras, la selección de características, la reducción de la dimensionalidad y la eliminación del ruido de los datos de entrenamiento. Una limitación común a todas estas técnicas es la suposición de que debe aplicarse el conjunto completo de datos de entrenamiento. Aunque esto ha sido eficaz para el entrenamiento por lotes tradicional, puede no ser práctico para el aprendizaje incremental de clasificadores, también conocido como minería de flujos de datos, donde sólo se ve una única pasada del flujo de datos a la vez. Debido a que los flujos de datos pueden llegar a ser infinitos y al fenómeno denominado big data, el tiempo de preprocesamiento de los datos debe reducirse al mínimo. En este artículo se presenta una nueva estrategia de preprocesamiento de datos adecuada para la depuración progresiva de los datos ruidosos del conjunto de datos de entrenamiento sin necesidad de procesar todo el conjunto de datos de una sola vez. Mediante una simulación informática, se demuestra que esta estrategia ofrece la importante ventaja de permitir la eliminación dinámica de los registros erróneos del proceso de aprendizaje incremental del clasificador.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento