Biblioteca122.739 documentos en línea

Artículo

Using Natural Language Preprocessing Architecture (NLPA) for Big Data Text SourcesUtilizando la Arquitectura de Procesamiento del Lenguaje Natural (APLN) para Fuentes de Texto de Big Data

Resumen

Durante los últimos años, el análisis de big data se ha convertido en un medio popular para aprovechar múltiples fuentes (inicialmente sin valor) y encontrar conocimiento relevante sobre dominios reales. Sin embargo, una gran cantidad de fuentes de big data proporcionan datos textuales no estructurados. Un análisis adecuado requiere herramientas capaces de combinar de manera adecuada el big data y técnicas de análisis de texto. Teniendo esto en cuenta, combinamos un marco de trabajo de canalización (BDP4J (Big Data Pipelining For Java)) con la implementación de un conjunto de técnicas de preprocesamiento de texto para crear NLPA (Natural Language Preprocessing Architecture), un complemento de código abierto y extensible que implementa pasos de preprocesamiento que pueden combinarse fácilmente para crear una canalización. Además, NLPA incorpora la posibilidad de generar conjuntos de datos utilizando ya sea una representación de datos basada en tokens clásicos o conjuntos de datos basados en synsets más nuevos que se procesarían aún más utilizando información semántica (es decir, utilizando ontologías). Este trabajo presenta

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento