La mayoría de los métodos de clustering más populares suelen tener algunas suposiciones fuertes del conjunto de datos. Por ejemplo, el método k-means asume implícitamente que todos los clusters provienen de distribuciones gaussianas esféricas que tienen diferentes medias pero la misma covarianza. Sin embargo, cuando se trata de conjuntos de datos que tienen formas de distribución diversas o una alta dimensionalidad, estas suposiciones podrían dejar de ser válidas. Para superar esta debilidad, propusimos un nuevo algoritmo de agrupación denominado algoritmo de separación de solidez ambiental localizada (LASS), que utiliza un nuevo criterio de aislamiento denominado distancia al centroide. En comparación con otros criterios de aislamiento basados en la densidad, nuestro criterio de aislamiento de distancia centroide propuesto aborda el problema causado por la alta dimensionalidad y la densidad variable. El experimento en un conjunto de datos de referencia bidimensional diseñado muestra que nuestro algoritmo LASS propuesto no sólo hereda la ventaja del método de agrupación de incrementos de disimilitud original para separar los clústeres naturalmente aislados, sino que también puede identificar los clústeres que son adyacentes, que se solapan y que están bajo ruido de fondo. Por último, comparamos nuestro algoritmo LASS con el método de agrupación por incrementos de disimilitud en un conjunto de datos masivos de usuarios de ordenadores con más de dos millones de registros que contienen información demográfica y de comportamiento. Los resultados muestran que el algoritmo LASS funciona muy bien en este conjunto de datos de usuarios de ordenadores y puede obtener más conocimientos de él.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Pacientes con fibrilación auricular en el Hospital Cantonal de Zenica: la hipertensión como factor de riesgo modificable más frecuente
Capítulo de libro:
Nanofibras a base de queratina
Artículo:
Caracterización espectroscópica de electrodos de película de poli(-aminofenol): Un artículo de revisión
Artículo:
Un nuevo método de evaluación de la capacidad de equilibrio estático basado en la medición del centro pélvico humano
Artículo:
Síntesis de nanopolvos de hidroxiapatita con una tasa de reabsorción programada
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones