Biblioteca122.294 documentos en línea

Artículo

Prediction of Breast Cancer from Imbalance Respect Using Cluster-Based Undersampling MethodPredicción del cáncer de mama a partir del respeto del desequilibrio mediante un método de submuestreo basado en conglomerados

Resumen

Para superar el problema del desequilibrio de dos clases existente en el diagnóstico del cáncer de mama, se propone un híbrido de K-means y Boosted C5.0 (K-Boosted C5.0) basado en el submuestreo. K-means se utiliza para seleccionar las muestras informativas cercanas al límite. Durante la fase de entrenamiento, el algoritmo K-means agrupa los casos mayoritarios y minoritarios y selecciona un número similar de casos de cada grupo. A continuación, se utiliza C5.0 como clasificador. Como hay un factor de selección de instancias diferente a través de la agrupación que fomenta la diversidad del subespacio de entrenamiento en K-Boosted C5.0, sería una gran ventaja para obtener un mejor rendimiento. Para probar el rendimiento del nuevo clasificador híbrido, se implementa en 12 conjuntos de datos a pequeña escala y 2 a gran escala, que son los conjuntos de datos utilizados a menudo en el aprendizaje con desequilibrio de clases. Los amplios resultados experimentales muestran que nuestro método híbrido propuesto supera a la mayoría de los algoritmos de la competencia en términos de coeficiente de correlación de Matthews (MCC) e índices de precisión. Puede ser una buena alternativa a los conocidos métodos de aprendizaje automático.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento