Con la aparición del algoritmo k-modes, la caja de herramientas para la agrupación de datos categóricos dispone de una herramienta eficaz que se escala linealmente en el número de elementos de datos. Sin embargo, la inicialización aleatoria de los centros de los clusters en k-modes dificulta la obtención de un buen clustering sin recurrir a muchos ensayos. Los métodos recientemente propuestos para una mejor inicialización son deterministas y reducen considerablemente el coste de la agrupación. Una variedad de métodos de inicialización difieren en cómo la heurística elige el conjunto de centros iniciales. En este trabajo, abordamos el problema del clustering para datos categóricos desde la perspectiva de la detección de comunidades. En lugar de inicializar k modos y ejecutar varias iteraciones, nuestro esquema, CD-Clustering, construye un grafo no ponderado y detecta grupos de nodos altamente cohesionados utilizando una técnica rápida de detección de comunidades. Las k comunidades más detectadas por tamaño definirán los k modos. La evaluación en diez conjuntos de datos categóricos reales muestra que nuestro método supera a los métodos de inicialización existentes para los modos k en términos de exactitud, precisión y recuerdo en la mayoría de los casos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Formación de enlaces Au-Silano
Artículo:
Estructura y propiedades de flexión de las hojas de Typha
Artículo:
Síntesis de alto rendimiento de nanocables de Ag uniformes con elevadas relaciones de aspecto mediante la introducción de PVP de cadena larga en un proceso de poliol mejorado
Artículo:
Optimización del biosensor de guía de onda fotónica de banda eléctrica transversal para la detección de diabetes mellitus a partir de la sensibilidad a granel
Artículo:
Micropartículas de Proteínas de Gluten de Trigo Solubles en Etanol por Nanoprecipitación: Preparación, Caracterización y Estudio como Fertilizante de Liberación Prolongada