Biblioteca122.294 documentos en línea

Artículo

A New Data Representation Based on Training Data Characteristics to Extract Drug Name Entity in Medical TextUna nueva representación de datos basada en las características de los datos de entrenamiento para extraer la entidad del nombre del medicamento en el texto médico

Resumen

Una tarea esencial en la extracción de información del corpus médico es el reconocimiento de nombres de medicamentos. En comparación con las fuentes de texto procedentes de otros ámbitos, la minería de textos médicos plantea más desafíos, por ejemplo, un texto más desestructurado, el rápido crecimiento de la adición de nuevos términos, una amplia gama de variación de nombres para el mismo fármaco, la falta de fuentes de conjuntos de datos etiquetados y de conocimiento externo, y las múltiples representaciones de tokens para un solo nombre de fármaco. Aunque se han propuesto muchos enfoques para superar la tarea, siguen existiendo algunos problemas con un bajo rendimiento de la puntuación F (inferior a 0,75). Este artículo presenta un nuevo tratamiento en las técnicas de representación de datos para superar algunos de esos retos. Proponemos tres técnicas de representación de datos basadas en las características de la distribución de las palabras y las similitudes de las palabras como resultado del entrenamiento de incrustación de palabras. La primera técnica se evalúa con el modelo de NN estándar, es decir, MLP. La segunda técnica incluye dos clasificadores de red profunda, es decir, DBN y SAE. La tercera técnica representa la frase como una secuencia que se evalúa con un modelo NN recurrente, es decir, LSTM. En la extracción de las entidades de nombres de fármacos, la tercera técnica ofrece el mejor rendimiento de puntuación F en comparación con el estado del arte, siendo su puntuación F media de 0,8645.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento