La extracción automática de eventos a partir de un texto es un paso importante en la adquisición de conocimientos y la creación de bases de datos. El trabajo manual en el desarrollo del sistema de extracción es indispensable, ya sea en la anotación del corpus o en la creación de vocabularios y patrones para un sistema basado en el conocimiento. Los trabajos recientes se han centrado en la adaptación del sistema existente (para la extracción de textos en inglés) a nuevos dominios. La extracción de eventos en otros idiomas no se ha estudiado debido a la falta de recursos y algoritmos necesarios para el procesamiento del lenguaje natural. En este artículo definimos un conjunto de recursos lingüísticos necesarios para el desarrollo de un sistema de extracción de eventos en ruso basado en el conocimiento: un vocabulario de modelos de subordinación, un vocabulario de desencadenantes de eventos y un vocabulario de elementos de marco que son bloques de construcción básicos para los patrones semánticos. Proponemos un conjunto de métodos para la creación de dichos vocabularios en ruso y en otros idiomas utilizando el Corpus NGram de Google Books. Los métodos se evalúan en el desarrollo de un sistema de extracción de eventos para el ruso.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Clasificación cuantitativa del cuarzo mediante espectroscopia de rotura inducida por láser en combinación con análisis de función discriminante
Artículo:
Corrección ortogonal de la señal para mejorar el modelo de regresión de la estabilidad en sistemas de sensores de gas
Artículo:
Evaluación de quitosano microcristalino y membranas de fibrina como portadores del factor de crecimiento derivado de plaquetas-BB con amoxicilina
Artículo:
El Impacto de los Tribunales de Tratamiento de Drogas en la Recuperación: Una Revisión Sistemática
Artículo:
Sistema piezorresistivo de detección de la respiración con carcasa portátil impresa en 3D