Biblioteca122.739 documentos en línea

Artículo

MapReduce-Based Dynamic Partition Join with Shannon Entropy for Data SkewnessUnión de particiones dinámicas basada en MapReduce con entropía de Shannon para la asimetría de datos

Resumen

Las operaciones de unión de conjuntos de datos juegan un papel crucial en la obtención de las relaciones de datos masivos en la vida real. Unir dos conjuntos de datos con MapReduce requiere un diseño adecuado de las etapas de Map y Reduce para diferentes escenarios. Los factores que afectan la eficiencia de la unión de MapReduce incluyen la densidad de los conjuntos de datos y la transmisión de datos en clústeres como Hadoop. Este estudio tiene como objetivo mejorar la eficiencia de los algoritmos de unión de MapReduce en Hadoop aprovechando la entropía de Shannon para medir los cambios de información de los conjuntos de datos que se unen en diferentes etapas de MapReduce. Para reducir la incertidumbre de los conjuntos de datos en las uniones a través de la red, se propone un nuevo algoritmo de unión de MapReduce con estrategias de partición dinámica llamado unión de partición dinámica (DPJ). Aprovechando los cambios de entropía en las particiones de los conjuntos de datos durante las etapas de Map y Reduce,

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento