Biblioteca122.739 documentos en línea

Artículo

An Efficient Minimal Text Segmentation Method for URL Domain NamesUn Método de Segmentación de Texto Mínimo Eficiente para Nombres de Dominio de URL

Resumen

La segmentación de texto del nombre de dominio de una URL es un método directo y conveniente para analizar el comportamiento en línea de los usuarios y es crucial para determinar sus áreas de interés. Sin embargo, el rendimiento de las herramientas populares de segmentación de palabras es relativamente bajo debido a la estructura única del nombre de dominio del sitio web (como longitudes extremadamente cortas, nombres irregulares y falta de relación contextual). Para abordar este problema, este artículo propone un método eficiente de segmentación de texto mínimo (EMTS) para los nombres de dominio de URL con el fin de lograr una minería de texto adaptativa eficiente. Primero diseñamos un modelo jerárquico de tareas dirigido para reducir la interferencia de ruido en textos mínimos. Luego presentamos un método novedoso de integrar el juego de conflictos en el algoritmo de coincidencia máxima bidireccional, lo que puede hacer que las palabras con mayor peso y mayor probabilidad sean seleccionadas, mejorando así la precisión del reconocimiento. A continuación, la transliteración del pinyin chino y el mapeo

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento