Con la aparición del algoritmo k-modes, la caja de herramientas para la agrupación de datos categóricos dispone de una herramienta eficaz que se escala linealmente en el número de elementos de datos. Sin embargo, la inicialización aleatoria de los centros de los clusters en k-modes dificulta la obtención de un buen clustering sin recurrir a muchos ensayos. Los métodos recientemente propuestos para una mejor inicialización son deterministas y reducen considerablemente el coste de la agrupación. Una variedad de métodos de inicialización difieren en cómo la heurística elige el conjunto de centros iniciales. En este trabajo, abordamos el problema del clustering para datos categóricos desde la perspectiva de la detección de comunidades. En lugar de inicializar k modos y ejecutar varias iteraciones, nuestro esquema, CD-Clustering, construye un grafo no ponderado y detecta grupos de nodos altamente cohesionados utilizando una técnica rápida de detección de comunidades. Las k comunidades más detectadas por tamaño definirán los k modos. La evaluación en diez conjuntos de datos categóricos reales muestra que nuestro método supera a los métodos de inicialización existentes para los modos k en términos de exactitud, precisión y recuerdo en la mayoría de los casos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Aplicación y evaluación de la gestión eficaz de la calidad por objetivos en la atención al paciente con drenaje persistente por sellado al vacío
Artículo:
Modelos en desarrollo de terapias derivadas de biotecnologia
Artículo:
Red de codificación temporal basada en la atención con máscara de movimiento independiente del fondo para el reconocimiento de acciones
Artículo:
Estudios sobre el tiempo de licuefacción y las proteínas implicadas en la mejora de las características seminales de los camellos dromedarios ()
Artículo:
Nanopartículas de Ru Soportadas sobre MIL-101 por el Método de Doble Solvente como Catalizadores de Alto Rendimiento para la Hidrólisis Catalítica del Borano Amoniacal
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones