Para muchas aplicaciones, encontrar casos raros o valores atípicos puede ser más interesante que encontrar patrones comunes. Los trabajos existentes sobre la detección de valores atípicos nunca tienen en cuenta el contexto de la web profunda. En este trabajo, argumentamos que, para muchos escenarios, es más significativo detectar valores atípicos en la web profunda. En el contexto de la web profunda, los usuarios deben enviar consultas a través de una interfaz de consulta para recuperar los datos correspondientes. Por tanto, los métodos tradicionales de minería de datos no pueden aplicarse directamente. La principal contribución de este artículo es el desarrollo de un nuevo método de minería de datos para la detección de valores atípicos en la web profunda. En nuestro enfoque, el espacio de consulta de una fuente de datos de la web profunda se estratifica en base a una muestra piloto. El muestreo de vecindad y el muestreo de incertidumbre se desarrollan en este trabajo con el objetivo de mejorar el recuerdo y la precisión basados en la estratificación. Por último, una cuidadosa evaluación del rendimiento de nuestro algoritmo confirma que nuestro enfoque puede detectar eficazmente los valores atípicos en la web profunda.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Diversidad genética del café arábica (Coffea arabica L.) en Nicaragua estimada mediante marcadores de microsatélites.
Artículo:
Imágenes de TC basadas en algoritmos inteligentes para la evaluación de la eficacia del docetaxel combinado con fluorouracilo en pacientes con cáncer gástrico
Artículo:
Espectroscopía Micro-Raman Polarizada en el Eje/Fuera del Eje para Silicio Monocristalino con Intensidad Resuelta en Ángulo
Artículo:
Efectividad de los humedales subterráneos verticales para la eliminación de hierro y manganeso de las aguas residuales en plantas de tratamiento de agua potable
Artículo:
Hidratación acelerada por CaCl2 del silicato tricálcico: Un estudio STXM combinado con 29Si MAS NMR
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones