Los conjuntos de datos médicos suelen estar compuestos predominantemente por ejemplos "normales" y sólo un pequeño porcentaje de "anormales", por lo que es muy importante reconocer correctamente los ejemplos anormales. Sin embargo, los métodos de aprendizaje de clasificación convencionales intentan conseguir una alta precisión asumiendo que el número de ejemplos de cualquier clase es similar entre sí, lo que conduce al hecho de que los ejemplos de clases anormales suelen ser ignorados y clasificados erróneamente como normales. En este artículo, proponemos un método de ensamblaje simple pero eficaz llamado ensemble of rotation trees (ERT) para tratar este problema en conjuntos de datos médicos desequilibrados. ERT aprende un conjunto a través de las siguientes cuatro etapas: (1) submuestreo de subconjuntos de la clase normal, (2) obtención de nuevos conjuntos de entrenamiento equilibrados mediante la combinación de cada subconjunto y clase anormal, (3) inducción de una matriz de rotación en un subconjunto de muestreo aleatorio de cada nuevo conjunto equilibrado, y en cada espacio de matriz de rotación, (4) aprendizaje de un árbol de decisión en cada dato de entrenamiento equilibrado. En este caso, la matriz de rotación sirve principalmente para mejorar la diversidad entre los miembros del conjunto, y la técnica de submuestreo pretende mejorar el rendimiento de los modelos aprendidos en la clase anormal. Los resultados experimentales muestran que, en comparación con otros métodos del estado de la técnica, ERT muestra un rendimiento significativamente mejor en conjuntos de datos médicos desequilibrados.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Estabilidades para las Ecuaciones de Euler-Poisson no Isentrópicas
Artículo:
Interacción sinérgica de antibióticos contra bacterias multidrogorresistentes aisladas de un entorno de efluente de matadero.
Artículo:
Predicción de riesgos mediante el uso de redes neuronales artificiales en el desarrollo global de software
Artículo:
Resolución del problema de diseño de la célula de fabricación mediante la optimización de enjambre binario con ratios de mezcla dinámicos
Artículo:
Reprogramación de Proteínas: Presente y Futuro