Biblioteca122.739 documentos en línea

Artículo

Knowledge-Driven Event Extraction in Russian: Corpus-Based Linguistic ResourcesExtracción de eventos basada en el conocimiento en ruso: Recursos lingüísticos basados en corpus

Resumen

La extracción automática de eventos a partir de un texto es un paso importante en la adquisición de conocimientos y la creación de bases de datos. El trabajo manual en el desarrollo del sistema de extracción es indispensable, ya sea en la anotación del corpus o en la creación de vocabularios y patrones para un sistema basado en el conocimiento. Los trabajos recientes se han centrado en la adaptación del sistema existente (para la extracción de textos en inglés) a nuevos dominios. La extracción de eventos en otros idiomas no se ha estudiado debido a la falta de recursos y algoritmos necesarios para el procesamiento del lenguaje natural. En este artículo definimos un conjunto de recursos lingüísticos necesarios para el desarrollo de un sistema de extracción de eventos en ruso basado en el conocimiento: un vocabulario de modelos de subordinación, un vocabulario de desencadenantes de eventos y un vocabulario de elementos de marco que son bloques de construcción básicos para los patrones semánticos. Proponemos un conjunto de métodos para la creación de dichos vocabularios en ruso y en otros idiomas utilizando el Corpus NGram de Google Books. Los métodos se evalúan en el desarrollo de un sistema de extracción de eventos para el ruso.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento