Biblioteca122.739 documentos en línea

Artículo

Detection Method for Distributed Web-Crawlers: A Long-Tail Threshold ModelMétodo de detección de rastreadores web distribuidos: Un modelo de umbral de cola larga

Resumen

Este documento propone una contramedida avanzada contra los rastreadores web distribuidos. Investigamos otros métodos para la detección de rastreadores y analizamos cómo los rastreadores distribuidos pueden evadir estos métodos. Nuestro método puede detectar rastreadores distribuidos al centrarse en la propiedad de que el tráfico web sigue una distribución de potencia. Cuando ordenamos las páginas web por el número de solicitudes, la mayoría de las solicitudes se concentran en las páginas web más solicitadas con mayor frecuencia. Además, habrá algunas páginas web que los usuarios normales generalmente no solicitan. Sin embargo, los rastreadores solicitarán estas páginas web porque sus algoritmos están diseñados para solicitar de manera iterativa al analizar las páginas web para recopilar cada elemento que los rastreadores encuentran. Por lo tanto, podemos suponer que si algunas direcciones IP se utilizan con frecuencia para solicitar las páginas web que se encuentran en el área de la cola larga de un gráfico de distribución de potencia, esas direcciones IP pueden clasificarse como

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento