Ficha técnica

15 | 0

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículo

Detecting Web Spam Based on Novel Features from Web Page Source CodeDetección del spam en la web a partir de características novedosas del código fuente de las páginas web

Resumen

El motor de búsqueda es crítico en la vida diaria de las personas porque determina la calidad de la información que las personas obtienen al buscar. La feroz competencia por el ranking en los motores de búsqueda no es beneficiosa ni para los usuarios ni para los motores de búsqueda. La investigación existente principalmente estudia el contenido y los enlaces de los sitios web. Sin embargo, ninguna de estas técnicas se enfoca en el análisis semántico del enlace y el texto del ancla para la detección. En este documento, proponemos un método de detección de spam web extrayendo conjuntos de características novedosas del código fuente de la página de inicio y eligiendo el bosque aleatorio (RF) como clasificador. Las características novedosas se extraen de los enlaces de las páginas de inicio, la estructura del lenguaje de marcado de hipertexto (HTML) y la similitud semántica del contenido. Realizamos experimentos en el conjunto de datos WEBSPAM-UK2007 y UK-2011 utilizando un método de validación cruzada de cinco pliegues. Además, diseñamos tres conjuntos de experiment

Materias:Seguridad informÃ¡tica ComunicaciÃ³n inalÃ¡mbrica Internet de las cosas Ataques de denegaciÃ³n distribuida de servicio
Subjects:Computer security Wireless communication Internet of things Distributed denial of service attacks
Palabras claves:Motor de búsqueda; Calidad de la información; Detección de spam en la web; Bosque aleatorio; Análisis semántico; Texto de anclaje
Keywords:Search engine; Information quality; Web spam detection; Random forest; Semantic analysis; Anchor text

Autor:Liu, Jiayong; Su, Yu; Lv, Shun; Huang, Cheng.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Ingeniería de sistemas
Año de publicación:2020.
Editor:Hindawi

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Detecting Web Spam Based on Novel Features from Web Page Source Code

DC.Title.eng

Detección del spam en la web a partir de características novedosas del código fuente de las páginas web

DC.Creator

Liu, Jiayong; Su, Yu; Lv, Shun; Huang, Cheng

DC.Subject.snpi.spa

Seguridad informÃ¡tica ComunicaciÃ³n inalÃ¡mbrica Internet de las cosas Ataques de denegaciÃ³n distribuida de servicio

DC.Subject.snpi.eng

Computer security Wireless communication Internet of things Distributed denial of service attacks

DC.Subject.spa

Motor de búsqueda; Calidad de la información; Detección de spam en la web; Bosque aleatorio; Análisis semántico; Texto de anclaje

DC.Subject.eng

Search engine; Information quality; Web spam detection; Random forest; Semantic analysis; Anchor text

DC.Description.spa

DC.Source

https://www.hindawi.com/journals/scn/2020/6662166

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/detectar-spam-web-con-nuevas-caracteristicas-del-codigo-fuente-95194

DC.Identifier.issn-isbn

ISSN:1939-0114

DC.Identifier.citacion

Revista Virtual Pro, ,

DC.Language

Inglés

DC.Relation

DC.Publisher

Hindawi

DC.Contributor

DC.Rights

Derechos de autor:6

DC.Date

2020

DC.Type

Artículo

DC.Format

pdf

DC.Identifier.file

https://downloads.hindawi.com/journals/scn/2020/6662166.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Información del documento

Titulo:Detecting Web Spam Based on Novel Features from Web Page Source Code
Autor:Liu, Jiayong; Su, Yu; Lv, Shun; Huang, Cheng
Tipo:Artículo
Año:2020
Idioma:Inglés
Editor:Hindawi
Materias:Seguridad informÃ¡tica ComunicaciÃ³n inalÃ¡mbrica Internet de las cosas Ataques de denegaciÃ³n distribuida de servicio
Descarga:0