Biblioteca122.739 documentos en línea

Artículo

An Efficient Cancer Classification Model Using Microarray and High-Dimensional DataUn modelo eficiente de clasificación del cáncer utilizando datos de microarrays y de alta dimensión

Resumen

El cáncer puede considerarse una de las principales causas de muerte en todo el mundo. Una de las herramientas más eficaces para poder manejar el diagnóstico, el pronóstico y el tratamiento del cáncer es mediante el uso de la técnica de perfiles de expresión que se basa en el gen de microarrays. Para cada punto de datos (muestra), los datos de expresión de genes suelen recibir decenas de miles de genes. Como resultado, estos datos son a gran escala, de alta dimensión y altamente redundantes. La clasificación de los perfiles de expresión génica se considera un problema (NP)-difícil. La selección de características (genes) es uno de los métodos más eficaces para tratar este problema. En este trabajo se presenta un enfoque híbrido de clasificación del cáncer, y se utilizaron varias técnicas de aprendizaje automático en el modelo híbrido: El coeficiente de correlación de Pearson como un selector y reductor de características basado en la correlación, un clasificador de Árbol de Decisión que es fácil de interpretar y no requiere un parámetro, y Grid Search CV (validación cruzada) para optimizar el hiperparámetro de profundidad máxima. Se utilizan siete conjuntos de datos estándar de microarrays de cáncer para evaluar nuestro modelo. Para identificar qué características son las más informativas y relativas utilizando el modelo propuesto, se emplean varias medidas de rendimiento, incluyendo la precisión de la clasificación, la especificidad, la sensibilidad, la puntuación F1 y el AUC. Según los resultados, la estrategia sugerida disminuye en gran medida el número de genes necesarios para la clasificación, selecciona las características más informativas y aumenta la precisión de la clasificación.

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento