Biblioteca122.294 documentos en línea

Artículo

A Novel SMOTE-Based Classification Approach to Online Data Imbalance ProblemUn nuevo enfoque de clasificación basado en SMOTE para el problema del desequilibrio de datos en línea

Resumen

En muchas aplicaciones prácticas de ingeniería, los datos suelen recogerse en patrones en línea. Sin embargo, si las clases de estos datos están muy desequilibradas, el rendimiento de la clasificación se verá restringido. En este trabajo, se propone un nuevo enfoque de clasificación para resolver el problema del desequilibrio de datos en línea mediante la integración de un algoritmo de aprendizaje rápido y eficiente, es decir, Extreme Learning Machine (ELM), y una estrategia de muestreo típica, es decir, la técnica de sobremuestreo de minorías sintéticas (SMOTE). Para reducir el desequilibrio grave, la división granular de las muestras de clase mayor se realiza de acuerdo con la característica de distribución de las muestras, y las muestras originales se sustituyen por el núcleo granular obtenido para preparar un conjunto de muestras equilibrado. En la etapa en línea, en primer lugar se realiza la división de la granulación para la clase menor y, a continuación, se lleva a cabo un sobremuestreo utilizando SMOTE en la región alrededor del núcleo de gránulos y el borde de gránulos. Por lo tanto, el conjunto de muestras de entrenamiento se equilibra gradualmente y el modelo ELM en línea se actualiza dinámicamente. También introducimos teóricamente la entropía de información difusa para demostrar que el enfoque propuesto tiene el límite inferior de fiabilidad del modelo tras el submuestreo. Se realizan experimentos numéricos con dos tipos diferentes de conjuntos de datos, y los resultados demuestran que el enfoque propuesto supera a algunos de los métodos más avanzados en términos de rendimiento de generalización y estabilidad numérica.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento