Biblioteca122.739 documentos en línea

Artículos

RNA-Seq-Based Breast Cancer Subtypes Classification Using Machine Learning ApproachesClasificación de subtipos de cáncer de mama basada en RNA-Seq utilizando enfoques de aprendizaje automático

Resumen

Antecedentes. El carcinoma invasivo de mama (BRCA) no es una enfermedad única, ya que cada subtipo tiene una estructura morfológica distinta. Aunque se han propuesto varios métodos computacionales para llevar a cabo la identificación de los subtipos de cáncer de mama, los mecanismos de interacción específicos de los genes implicados en los subtipos siguen siendo incompletos. Identificar y explorar los mecanismos de interacción correspondientes de los genes para cada subtipo de cáncer de mama puede imponer un impacto importante en el tratamiento personalizado para diferentes pacientes. Métodos. Integramos la importancia biológica de los genes de las redes reguladoras de genes al análisis de expresión diferencial y, a continuación, obtenemos los genes diferencialmente expresados ponderados (DEGs ponderados). Un gen con un peso elevado significa que regula más genes diana y, por tanto, tiene más importancia biológica. Además, construimos redes de coexpresión de genes para los grupos de control y del experimento, y las estructuras que interactúan significativamente nos animaron a diseñar el correspondiente enriquecimiento de la Ontología Genética (GO) basado en las redes de coexpresión de genes (GOEGCN). El GOEGCN considera el análisis de distinción de dos lados entre las redes de coexpresión de genes para los grupos de control y de experimento. El método nos permite estudiar cómo las parejas de genes coexpresados modulados impactan en las funciones biológicas a nivel de GO. Resultados. Modelamos la clasificación binaria con DEGs ponderados para cada subtipo. El clasificador binario pudo hacer una buena predicción para una muestra no vista, y los resultados experimentales validaron la eficacia de nuestros enfoques propuestos. Los nuevos términos GO enriquecidos basados en GOEGCN para los grupos de control y experimento de cada subtipo explican hasta cierto punto los cambios específicos de la función biológica de acuerdo con la distinción de dos lados de las estructuras de la red de coexpresión. Conclusión. Los DEGs ponderados contienen la importancia biológica derivada de la red de regulación de genes. Basándose en los DEGs ponderados, se aprendieron cinco clasificadores binarios que mostraron un buen rendimiento en cuanto a las métricas "Sensibilidad", "Especificidad", "Precisión", "F1" y "AUC". El GOEGCN con DEGs ponderados para los grupos de control y del experimento presentó unos resultados de análisis de enriquecimiento de GO novedosos y los nuevos términos de GO enriquecidos revelarían en mayor medida los cambios de funciones biológicas específicas entre todos los subtipos de BRCA. El código R de esta investigación está disponible en https://github.com/yxchspring/GOEGCN_BRCA_Subtypes.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento