Biblioteca122.739 documentos en línea

Artículo

Active Learning for Constrained Document Clustering with Uncertainty RegionAprendizaje activo para agrupamiento de documentos restringido con región de incertidumbre.

Resumen

El clustering restringido está destinado a mejorar la precisión y personalización basado en las restricciones expresadas por un Oráculo. En este artículo, se propone un nuevo algoritmo de clustering restringido y se seleccionan algunos pares de datos informativos durante un proceso iterativo. Luego, se presentan al Oráculo y su relación se responde con Must-link (ML) o Cannot-link (CL). En cada iteración, primero, se utiliza la máquina de vectores de soporte (SVM) basada en la etiqueta producida por el clustering actual. Según la distancia de cada documento desde el hiperplano, se crea la matriz de distancias. Además, basado en la similitud del coseno de word2vector de cada documento, se crea la matriz de similitud. Se calculan dos tipos de probabilidades (similitud y grado de similitud) y se suavizan para pertenecer a vecindarios. Los vecindarios forman las muestras que son etiquetadas por el Oráculo, para estar en el mismo grupo. Finalmente, al final de cada iteración, se seleccionan los datos

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento