Biblioteca122.739 documentos en línea

Artículo

Automatic Prediction of Recurrence of Major Cardiovascular Events: A Text Mining Study Using Chest X-Ray ReportsPredicción automática de recurrencia de episodios cardiovasculares graves: Un estudio de minería de textos a partir de informes de radiografía de tórax

Resumen

Antecedentes y objetivo. Las historias clínicas electrónicas (HCE) contienen información de texto libre sobre síntomas, diagnóstico, tratamiento y pronóstico de enfermedades. Sin embargo, no se puede acceder fácilmente a esta mina de oro potencial de información sanitaria ni utilizarla a menos que se apliquen técnicas adecuadas de minería de textos. El objetivo de este proyecto era desarrollar y evaluar una canalización de minería de textos en una arquitectura de aprendizaje multimodal para demostrar el valor de la clasificación de textos médicos en informes de radiografías de tórax para la predicción del riesgo cardiovascular. Buscamos evaluar la integración de varios enfoques de representación de texto y datos clínicos estructurados con métodos de aprendizaje profundo de vanguardia en el proceso de minería de textos médicos. Métodos. Utilizamos datos de HCE de pacientes incluidos en el estudio Second Manifestations of ARTerial disease (SMART). Proponemos una arquitectura multimodal basada en aprendizaje profundo para nuestra tubería de minería de textos que integra la representación neural del texto con predictores clínicos preprocesados para la predicción de recurrencia de eventos cardiovasculares mayores en pacientes cardiovasculares. En primer lugar, se aplicó el preprocesamiento de texto, incluida la limpieza y el stemming, para filtrar los textos no deseados de los informes radiológicos de rayos X. A continuación, se utilizaron métodos de representación de textos para representar numéricamente los informes radiológicos no estructurados con vectores. Posteriormente, estos métodos de representación de texto se añadieron a modelos de predicción para evaluar su relevancia clínica. En este paso, aplicamos regresión logística, máquina de vectores soporte (SVM), red neuronal perceptrón multicapa, red neuronal convolucional, memoria a largo plazo (LSTM) y red neuronal profunda bidireccional LSTM (BiLSTM). Resultados. Realizamos varios experimentos para evaluar el valor añadido del texto en la predicción de eventos cardiovasculares graves. Los dos escenarios principales fueron la integración de informes radiológicos (1) con predictores clínicos clásicos y (2) con sólo la edad y el sexo en el caso de no disponer de predictores clínicos. En total, se utilizaron datos de 5.603 pacientes con validación cruzada de 5 veces para entrenar los modelos. En el primer escenario, el modelo BiLSTM multimodal (MI-BiLSTM) alcanzó un área bajo la curva (AUC) del 84,7%, una tasa de clasificación errónea del 14,3% y una puntuación F1 del 83,8%. En este escenario, el modelo SVM, entrenado en variables clínicas y representación de bolsa de palabras, logró la tasa de clasificación errónea más baja, del 12,2%. En el caso de predictores clínicos no disponibles, el modelo MI-BiLSTM entrenado en informes radiológicos y variables demográficas (edad y sexo) alcanzó un AUC, una puntuación F1 y una tasa de clasificación errónea del 74,5%, el 70,8% y el 20,4%, respectivamente. Conclusiones. Utilizando el estudio de caso de informes radiológicos de rayos X de tórax de atención rutinaria, demostramos la relevancia clínica de integrar características de texto y predictores clásicos en nuestra canalización de minería de texto para la predicción del riesgo cardiovascular. El modelo MI-BiLSTM con representación de incrustación de palabras pareció tener un rendimiento deseable cuando se entrenó con datos de texto integrados con las variables clínicas del estudio SMART. Nuestros resultados extraídos de informes de radiografías de tórax mostraron que los modelos que utilizan datos de texto además de valores de laboratorio superan a los que sólo utilizan predictores clínicos conocidos.

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento