Para superar el problema del desequilibrio de dos clases existente en el diagnóstico del cáncer de mama, se propone un híbrido de K-means y Boosted C5.0 (K-Boosted C5.0) basado en el submuestreo. K-means se utiliza para seleccionar las muestras informativas cercanas al límite. Durante la fase de entrenamiento, el algoritmo K-means agrupa los casos mayoritarios y minoritarios y selecciona un número similar de casos de cada grupo. A continuación, se utiliza C5.0 como clasificador. Como hay un factor de selección de instancias diferente a través de la agrupación que fomenta la diversidad del subespacio de entrenamiento en K-Boosted C5.0, sería una gran ventaja para obtener un mejor rendimiento. Para probar el rendimiento del nuevo clasificador híbrido, se implementa en 12 conjuntos de datos a pequeña escala y 2 a gran escala, que son los conjuntos de datos utilizados a menudo en el aprendizaje con desequilibrio de clases. Los amplios resultados experimentales muestran que nuestro método híbrido propuesto supera a la mayoría de los algoritmos de la competencia en términos de coeficiente de correlación de Matthews (MCC) e índices de precisión. Puede ser una buena alternativa a los conocidos métodos de aprendizaje automático.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Integración viral y cáncer de cuello uterino
Artículo:
Detección de la hormona del estrés en la leche para el bienestar animal mediante el método QCM
Artículo:
Papel de la anestesia regional en el tratamiento del dolor postoperatorio
Artículo:
GSR-TDMA: protocolo MAC de acceso múltiple por división de tiempo y reutilización espacial geométrica para redes de sensores acústicos submarinos multisalto
Artículo:
Efecto del dopaje de partículas de ZnO de diferentes tamaños en las propiedades dieléctricas de los compuestos de polietileno