El crecimiento rápido de datos en muchas áreas, así como en el ámbito biomédico, requiere la asistencia de sistemas de extracción de información para adquirir el conocimiento muy necesario sobre entidades específicas como proteínas, medicamentos o enfermedades prácticamente en poco tiempo. Los corpora anotados sirven para facilitar el proceso de construcción de sistemas de procesamiento del lenguaje natural. Mientras se ha realizado un trabajo colosal en esta área para el idioma inglés, otros idiomas como el árabe parecen carecer de estos recursos, especialmente en el área de la salud. Por lo tanto, en este trabajo presentamos un método para desarrollar un corpus médico de estándar plata para el idioma árabe con un diccionario como herramienta de supervisión mínima. El corpus contiene 49,856 oraciones etiquetadas con 13 tipos de entidades correspondientes a un subconjunto de tipos de conceptos de UMLS (Sistema de Lenguaje Médico Unificado). La evaluación de un subconjunto del corpus mostró la eficiencia del método utilizado para etiquetarlo con un 90% de precisión.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Mapeo de activación de clases basado en la atención en canales espaciales para interpretar modelos de clasificación de imágenes basados en CNN
Artículo:
La estrategia de gestión de ganancias de las empresas listadas en la región del Delta del Río de las Perlas de China basada en la teoría de redes complejas.
Artículo:
Gamified Mobile Applications for Improving Driving Behavior: Un estudio de mapeo sistemático
Artículo:
Especificaciones de calidad de servicio en marcos de uso compartido de sensores móviles a pequeña escala que tienen en cuenta la proximidad
Artículo:
Máquina de Boltzmann Restringida asistida por Algoritmo de Estimación de Distribución para Problemas Complejos