La unión de múltiples conjuntos de datos en MapReduce puede aumentar los gastos generales de disco y de red, ya que los resultados intermedios de la unión tienen que escribirse en el sistema de archivos distribuido subyacente, o los registros de salida del mapa tienen que replicarse varias veces. Este artículo propone un método para aplicar filtros basados en el orden de procesamiento de los conjuntos de datos de entrada, que es adecuado para los dos tipos de uniones multidireccionales: uniones de atributos comunes y uniones de atributos distintos. El número de registros redundantes filtrados depende del orden de procesamiento. En las uniones por atributos comunes, no es necesario replicar los registros de entrada, por lo que se crea un conjunto de filtros que se aplican sucesivamente. En las uniones de atributos distintos, los registros de entrada tienen que replicarse, por lo que es necesario crear varios conjuntos de filtros, que dependen del número de atributos de unión. Los resultados experimentales mostraron que nuestro enfoque superaba a una cascada de uniones bidireccionales y a las uniones multidireccionales básicas en los casos en que se unían pequeñas porciones de los conjuntos de datos de entrada.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Propiedades de oscilación para sistemas de ecuaciones diferenciales parciales de orden superior con argumentos deviantes distribuidos.
Artículo:
Cálculo fraccional de variaciones en términos de una integral fraccional generalizada con aplicaciones a la física
Artículo:
Estimación de la Flotación de la Marca de Navegación Basada en el Descenso Gradiente de Orden Fraccionario con Momento para la Red Neuronal RBF
Artículo:
Control difuso basado en el comportamiento para la navegación de robots móviles
Artículo:
Complejidad en tiempo lineal de la búsqueda Breadth-First mediante un sistema P con división de membranas