Antecedentes y objetivo. Las historias clínicas electrónicas (HCE) contienen información de texto libre sobre síntomas, diagnóstico, tratamiento y pronóstico de enfermedades. Sin embargo, no se puede acceder fácilmente a esta mina de oro potencial de información sanitaria ni utilizarla a menos que se apliquen técnicas adecuadas de minería de textos. El objetivo de este proyecto era desarrollar y evaluar una canalización de minería de textos en una arquitectura de aprendizaje multimodal para demostrar el valor de la clasificación de textos médicos en informes de radiografías de tórax para la predicción del riesgo cardiovascular. Buscamos evaluar la integración de varios enfoques de representación de texto y datos clínicos estructurados con métodos de aprendizaje profundo de vanguardia en el proceso de minería de textos médicos. Métodos. Utilizamos datos de HCE de pacientes incluidos en el estudio Second Manifestations of ARTerial disease (SMART). Proponemos una arquitectura multimodal basada en aprendizaje profundo para nuestra tubería de minería de textos que integra la representación neural del texto con predictores clínicos preprocesados para la predicción de recurrencia de eventos cardiovasculares mayores en pacientes cardiovasculares. En primer lugar, se aplicó el preprocesamiento de texto, incluida la limpieza y el stemming, para filtrar los textos no deseados de los informes radiológicos de rayos X. A continuación, se utilizaron métodos de representación de textos para representar numéricamente los informes radiológicos no estructurados con vectores. Posteriormente, estos métodos de representación de texto se añadieron a modelos de predicción para evaluar su relevancia clínica. En este paso, aplicamos regresión logística, máquina de vectores soporte (SVM), red neuronal perceptrón multicapa, red neuronal convolucional, memoria a largo plazo (LSTM) y red neuronal profunda bidireccional LSTM (BiLSTM). Resultados. Realizamos varios experimentos para evaluar el valor añadido del texto en la predicción de eventos cardiovasculares graves. Los dos escenarios principales fueron la integración de informes radiológicos (1) con predictores clínicos clásicos y (2) con sólo la edad y el sexo en el caso de no disponer de predictores clínicos. En total, se utilizaron datos de 5.603 pacientes con validación cruzada de 5 veces para entrenar los modelos. En el primer escenario, el modelo BiLSTM multimodal (MI-BiLSTM) alcanzó un área bajo la curva (AUC) del 84,7%, una tasa de clasificación errónea del 14,3% y una puntuación F1 del 83,8%. En este escenario, el modelo SVM, entrenado en variables clínicas y representación de bolsa de palabras, logró la tasa de clasificación errónea más baja, del 12,2%. En el caso de predictores clínicos no disponibles, el modelo MI-BiLSTM entrenado en informes radiológicos y variables demográficas (edad y sexo) alcanzó un AUC, una puntuación F1 y una tasa de clasificación errónea del 74,5%, el 70,8% y el 20,4%, respectivamente. Conclusiones. Utilizando el estudio de caso de informes radiológicos de rayos X de tórax de atención rutinaria, demostramos la relevancia clínica de integrar características de texto y predictores clásicos en nuestra canalización de minería de texto para la predicción del riesgo cardiovascular. El modelo MI-BiLSTM con representación de incrustación de palabras pareció tener un rendimiento deseable cuando se entrenó con datos de texto integrados con las variables clínicas del estudio SMART. Nuestros resultados extraídos de informes de radiografías de tórax mostraron que los modelos que utilizan datos de texto además de valores de laboratorio superan a los que sólo utilizan predictores clínicos conocidos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
RNA-Dependiente RNA Objetivo por Sistemas CRISPR-Cas: Caracterizaciones y aplicaciones.
Artículos:
Evaluación de la ampliación del conducto radicular utilizando limas rotatorias Mtwo y BioRace.
Artículos:
Actuador flexible inteligente accionado por tendón
Artículos:
Sistemas de envasado inteligentes: Sensores y nanosensores para controlar la calidad y seguridad de los alimentos
Artículos:
Análisis EEG paramétrico y no paramétrico para la evaluación de la actividad EEG en niños pequeños con epilepsia controlada
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.