Biblioteca122.294 documentos en línea

Artículo

Cross-Checking Multiple Data Sources Using Multiway Join in MapReduceComprobación cruzada de múltiples fuentes de datos utilizando la unión de múltiples vías en MapReduce.

Resumen

A medida que las fuentes de datos acumulan información y el tamaño de los datos aumenta, se vuelve cada vez más difícil mantener la corrección y validez de estos conjuntos de datos. Por lo tanto, deben surgir herramientas para facilitar esta tarea desafiante. La verificación de hechos generalmente implica un gran número de fuentes de datos que hablan sobre lo mismo, pero no estamos seguros de cuál tiene la información correcta o si tienen información sobre la consulta que nos interesa. Una unión entre todas o algunas fuentes de datos puede guiarnos a través de un proceso de verificación de hechos. Sin embargo, cuando queremos realizar esta unión en un entorno computacional distribuido como MapReduce, no es obvio cómo distribuir eficientemente los registros en las fuentes de datos a las tareas de reducción para unir cualquier subconjunto de ellos en un solo trabajo de MapReduce. Con este fin, proponemos un enfoque eficiente utilizando la unión múltiple para cotejar estas fuentes de datos en una sola ronda.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento