Automatic Extractive Single Document Summarization: A Systematic Mapping
Resumen Extractivo Automático de Documento Único: Un Mapeo Sistemático
La Abstracción Automática Extractiva de Documentos Individuales (AESDS, por sus siglas en inglés) es un área de investigación cuyo objetivo es crear una versión condensada de un documento con la información más relevante; cada día adquiere más importancia debido a la necesidad de los usuarios de obtener rápidamente información sobre documentos publicados en Internet. En el resumen automático de documentos, cada elemento debe ser evaluado y clasificado para generar un resumen. En este sentido, existen tres enfoques en función del número de objetivos que evalúan: mono objetivo, multiobjetivo y multiobjetivo. Este mapeo sistemático tiene como objetivo proporcionar conocimientos sobre los métodos y técnicas utilizados en las técnicas extractivas para la AESDS, analizando el número de objetivos y características evaluadas, lo que puede ser útil para futuras investigaciones. Este mapeo se realizó utilizando un proceso genérico para la realización de revisiones sistemáticas donde se construyó una cadena de búsqueda considerando algunas preguntas de investigación. Luego se utilizó un filtro con criterios de inclusión y exclusión para seleccionar los estudios primarios con los que se realizará el análisis. Además, estos estudios se clasifican según la relevancia de su contenido. Este proceso se resume en tres etapas principales: planificación, ejecución y análisis de resultados. Al final del mapeo, se identificaron las siguientes observaciones: (i) Existe una preferencia por el uso de métodos de aprendizaje automático y el uso de técnicas de agrupación, (ii) la importancia de utilizar ambos tipos de características (estadísticas y semánticas), y (iii) la necesidad de explorar el enfoque de objetivos múltiples.
I. INTRODUCCIÓN
El crecimiento de los documentos públicos disponibles en la Web ha hecho necesario desarrollar métodos para generar resúmenes de forma rápida y automática con la información documental más relevante. El objetivo del resumen automático de un solo documento es proporcionar una versión corta del documento preservando la idea principal de su contenido, aplicándolo a múltiples áreas de estudio en las que se consideran documentos de diferentes tipos, como noticias, blogs, eventos, correos electrónicos. , películas, documentos científicos y comprensión de textos, entre otros [ 1 ].
El resumen automático de documentos se puede clasificar según cómo se genera el resumen: abstractivo, extractivo o híbrido. Los resúmenes abstractivos se generan utilizando técnicas de procesamiento del lenguaje natural que modifican las oraciones para hacer el resumen más coherente. Los resúmenes extractivos se generan con las frases originales del documento seleccionando las más relevantes. Estos son más rápidos y sencillos que los resúmenes abstractivos [ 2 ]. Mientras tanto, los resúmenes híbridos se generan considerando la cantidad más significativa de información original, realizando modificaciones menores.
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:330 kb