Predicción del cáncer de mama mediante algoritmos de aprendizaje automático en diferentes conjuntos de datos
Prediction of breast cancer using machine learning algorithms on different datasets
El cáncer de mama es una enfermedad cada día más frecuente, que provoca reacciones emocionales y de comportamiento y tiene consecuencias fatales si no se detecta a tiempo. En este punto, los métodos tradicionales son insuficientes, especialmente en el diagnóstico precoz. En este contexto, el objetivo de este estudio era predecir el cáncer de mama mediante algoritmos de aprendizaje automático (ML) en diferentes conjuntos de datos y demostrar la aplicabilidad de estos algoritmos. Se compararon las prestaciones de los algoritmos en conjuntos de datos equilibrados y desequilibrados, teniendo en cuenta las métricas de rendimiento obtenidas en aplicaciones en diferentes conjuntos de datos. Además, se desarrolló un modelo basado en el método Borda Voting incluyendo en el proceso los resultados obtenidos a partir de cuatro algoritmos diferentes (NB, KNN, DT y RF). Los valores de predicción obtenidos de cada algoritmo se escribieron en diferentes columnas del mismo archivo excel y el valor más repetitivo se aceptó como valor de resultado final. El modelo desarrollado se probó con datos reales consistentes en 60 registros y se analizaron los resultados. Cuando se examinaron los resultados, se vio que se obtenía un mayor rendimiento con el modelo de RF propuesto en comparación con estudios similares de la bibliografía. Por último, los resultados de predicción obtenidos con el modelo desarrollado revelaron la aplicabilidad de los algoritmos ML en el diagnóstico del cáncer de mama.
1. INTRODUCCION
Los datos transferidos al entorno digital aumentan con el desarrollo de la tecnología y el uso generalizado de las redes sociales. Estos datos, denominados basura, son pro-cesados y utilizados para resolver diversos problemas de algunos usuarios. Los métodos de minería de datos utilizados para dar sentido a estos datos demuestran la importancia de los procesos de procesamiento de datos y reconocimiento de patrones. Los algoritmos de aprendizaje automático (ML), basados en la minería de datos y en la alta tasa de éxito estimada mediante la experiencia, pueden adaptarse a los cambios y resolver problemas complejos, por lo que se han desarrollado día a día y se utilizan en muchos campos [1]. En informática médica, los algoritmos ML se utilizan en muchos estudios, especialmente en los que se realizan predicciones para el diagnóstico de enfermedades. Los algoritmos ML se utilizan a menudo para predecir enfermedades que son especialmente importantes para el diagnóstico precoz de cáncer de mama [2]. Según la Organización Mundial de la Salud (OMS), el cáncer de mama es el tipo de cáncer más predominante en el mundo, con la sorprendente cifra de 2,26 millones de pacientes diagnosticados en 2020. Es uno de los tipos de cáncer más frecuentemente diagnosticados en 2020 y ocupa el quinto lugar en muertes relacionadas con el cáncer [3].
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:3427 kb