El clustering es una de las tareas más importantes de aprendizaje automático no supervisado, ampliamente utilizado en la recuperación de información, análisis de redes sociales, procesamiento de imágenes y otros campos. Con el crecimiento explosivo de los datos, los algoritmos de clustering clásicos no pueden cumplir con los requisitos de clustering para big data. Spark es una de las plataformas de procesamiento paralelo más populares para big data, y muchos investigadores han propuesto numerosos algoritmos de clustering paralelo basados en Spark. En este artículo, se clasifican y resumen los algoritmos de clustering paralelo existentes basados en Spark, se discute el marco de diseño paralelo de cada tipo de algoritmos, y después de comparar diferentes tipos de algoritmos, se discute la dirección de la investigación futura.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
TLDA: Un mecanismo eficiente de autenticación de datos en dos capas para redes centradas en contenidos
Artículo:
eMatch: Una aplicación Android para encontrar amigos en tu localidad
Artículo:
Controlador de Tiempo Predefinido basado en Diferenciador Adaptativo para Sistemas No Lineales Sujetos a Forma de Retroalimentación Pura y Perturbación Desconocida.
Artículo:
pSPARQL: Un lenguaje de consulta para datos RDF probabilísticos
Artículo:
Plataforma de dispositivos vestibles autoorganizados para ayudar y recordar a las personas en tiempo real