Con la aparición del algoritmo k-modes, la caja de herramientas para la agrupación de datos categóricos dispone de una herramienta eficaz que se escala linealmente en el número de elementos de datos. Sin embargo, la inicialización aleatoria de los centros de los clusters en k-modes dificulta la obtención de un buen clustering sin recurrir a muchos ensayos. Los métodos recientemente propuestos para una mejor inicialización son deterministas y reducen considerablemente el coste de la agrupación. Una variedad de métodos de inicialización difieren en cómo la heurística elige el conjunto de centros iniciales. En este trabajo, abordamos el problema del clustering para datos categóricos desde la perspectiva de la detección de comunidades. En lugar de inicializar k modos y ejecutar varias iteraciones, nuestro esquema, CD-Clustering, construye un grafo no ponderado y detecta grupos de nodos altamente cohesionados utilizando una técnica rápida de detección de comunidades. Las k comunidades más detectadas por tamaño definirán los k modos. La evaluación en diez conjuntos de datos categóricos reales muestra que nuestro método supera a los métodos de inicialización existentes para los modos k en términos de exactitud, precisión y recuerdo en la mayoría de los casos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Una breve descripción de los problemas de desarrollo en la adolescencia en Hong Kong
Artículos:
Caracterización morfoestructural, composicional y electroquímica de nanocapas electrodepositadas sobre una nueva aleación Ti-15Ta-5Zr
Artículos:
Arquitectura eficiente de aprendizaje profundo para la detección y el reconocimiento de nódulos tiroideos
Artículos:
Diseño de estructuras de fabricación aditiva para aplicaciones biomédicas: Revisión de los procesos de fabricación aditiva aplicados al sector biomédico
Artículos:
Investigaciones experimentales y teóricas de los espectros de terahercios de los isómeros estructurales: Manosa y Galactosa
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.