Biblioteca122.294 documentos en línea

Artículo

Using Proximity Graph Cut for Fast and Robust Instance-Based Classification in Large DatasetsUtilizando Proximity Graph Cut para una clasificación rápida y robusta basada en instancias en conjuntos de datos grandes

Resumen

Los vecinos más cercanos (kNN) es un clasificador muy popular basado en instancias debido a su simplicidad y buen rendimiento empírico. Sin embargo, los conjuntos de datos a gran escala son un gran problema para construir clasificadores basados en vecindarios rápidos y compactos. Este trabajo presenta el diseño e implementación de un algoritmo de clasificación con estructuras de datos de índice, que nos permitiría construir soluciones rápidas y escalables para conjuntos de datos multidimensionales grandes. Proponemos un enfoque novedoso que utiliza la representación de grafo de proximidad de pequeño mundo navegable (NSW) de conjuntos de datos a gran escala. Nuestro enfoque muestra una aceleración de la velocidad de clasificación de 24 veces tanto para el tiempo promedio como para el percentil 99, con una precisión de clasificación asintóticamente cercana al método 1-NN. Observamos un tiempo de clasificación dos órdenes de magnitud mejor en casos en los que el método utiliza memoria de intercambio. Mostramos que el grafo

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento