Biblioteca122.739 documentos en línea

Artículo

Clustering Categorical Data Using Community Detection TechniquesAgrupación de datos categóricos mediante técnicas de detección de comunidades

Resumen

Con la aparición del algoritmo k-modes, la caja de herramientas para la agrupación de datos categóricos dispone de una herramienta eficaz que se escala linealmente en el número de elementos de datos. Sin embargo, la inicialización aleatoria de los centros de los clusters en k-modes dificulta la obtención de un buen clustering sin recurrir a muchos ensayos. Los métodos recientemente propuestos para una mejor inicialización son deterministas y reducen considerablemente el coste de la agrupación. Una variedad de métodos de inicialización difieren en cómo la heurística elige el conjunto de centros iniciales. En este trabajo, abordamos el problema del clustering para datos categóricos desde la perspectiva de la detección de comunidades. En lugar de inicializar k modos y ejecutar varias iteraciones, nuestro esquema, CD-Clustering, construye un grafo no ponderado y detecta grupos de nodos altamente cohesionados utilizando una técnica rápida de detección de comunidades. Las k comunidades más detectadas por tamaño definirán los k modos. La evaluación en diez conjuntos de datos categóricos reales muestra que nuestro método supera a los métodos de inicialización existentes para los modos k en términos de exactitud, precisión y recuerdo en la mayoría de los casos.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento