Biblioteca122.294 documentos en línea

Artículo

A Silver Standard Biomedical Corpus for Arabic LanguageUn Corpus Biomédico Estándar Plata para el Idioma Árabe

Resumen

El crecimiento rápido de datos en muchas áreas, así como en el ámbito biomédico, requiere la asistencia de sistemas de extracción de información para adquirir el conocimiento muy necesario sobre entidades específicas como proteínas, medicamentos o enfermedades prácticamente en poco tiempo. Los corpora anotados sirven para facilitar el proceso de construcción de sistemas de procesamiento del lenguaje natural. Mientras se ha realizado un trabajo colosal en esta área para el idioma inglés, otros idiomas como el árabe parecen carecer de estos recursos, especialmente en el área de la salud. Por lo tanto, en este trabajo presentamos un método para desarrollar un corpus médico de estándar plata para el idioma árabe con un diccionario como herramienta de supervisión mínima. El corpus contiene 49,856 oraciones etiquetadas con 13 tipos de entidades correspondientes a un subconjunto de tipos de conceptos de UMLS (Sistema de Lenguaje Médico Unificado). La evaluación de un subconjunto del corpus mostró la eficiencia del método utilizado para etiquetarlo con un 90% de precisión.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento