Biblioteca122.739 documentos en línea

Artículo

HSDP: A Hybrid Sampling Method for Imbalanced Big Data Based on Data PartitionHSDP: Un método de muestreo híbrido para datos desequilibrados a gran escala basado en la partición de datos.

Resumen

Los clasificadores clásicos son ineficaces para lidiar con el problema de la clasificación de conjuntos de datos grandes e desbalanceados. Re-muestrear los conjuntos de datos y equilibrar la distribución de las muestras antes de entrenar el clasificador es uno de los enfoques más populares para resolver este problema. En este artículo se propone un método de muestreo híbrido efectivo y sencillo basado en la partición de datos (HSDP). En primer lugar, todas las muestras de datos se dividen en diferentes regiones de datos. Luego, se eliminan las muestras de datos en la región de muestras minoritarias ruidosas y se seleccionan las muestras en la región de muestras minoritarias fronterizas como semillas de sobremuestreo para generar muestras sintéticas. Finalmente, se lleva a cabo un proceso de sobremuestreo ponderado considerando la generación de muestras sintéticas en el mismo clúster de la semilla de sobremuestreo. El peso de cada muestra seleccionada de la clase minoritaria se calcula mediante la prop

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento