Determining weighted, utility-based time variant association rules using frequent pattern tree
Determinación de reglas de asociación de variantes temporales ponderadas y basadas en la utilidad mediante un árbol de patrones frecuentes
La presente investigación se llevó a cabo en el Instituto Birla de Tecnología, fuera del Campus en Noida, India, en 2017. Para evaluar la eficiencia del enfoque propuesto para la minería de información se propusieron un método y un algoritmo para la minería de reglas de asociación ponderadas basadas en la utilidad y variables en el tiempo utilizando fp-tree. Se sugiere un método para encontrar reglas de asociación en datos ponderados por frecuencia y basados en utilidad orientados al tiempo, empleando una jerarquía para extraer conjuntos de elementos y establecer su asociación. Las dimensiones adoptadas al desarrollar el enfoque comprimieron un gran conjunto de datos variables en el tiempo a una estructura de datos más pequeña, al mismo tiempo que fp-tree se mantuvo alejado del conjunto de datos repetitivos, lo que finalmente nos dio una ventaja notable en articulaciones de tiempo y uso de memoria.
1. INTRODUCCIÓN
La minería de información variable en el tiempo puede considerarse como un procedimiento algorítmico paso a paso que adquiere información variable en el tiempo como entrada y proporciona patrones, conjuntos de elementos recurrentes, reglas de asociación o resúmenes como salida. La minería de patrones recurrentes en grandes conjuntos de datos transaccionales variables en el tiempo es actualmente un área de estudio centrada en la minería de datos. Varios algoritmos de realización de conjuntos de ítems recurrentes y variables en el tiempo presentan diversos problemas en cuanto a tiempo computacional, coste de entrada-salida y requisitos de espacio de memoria cuando se trata de una gran cantidad de datos transaccionales variables en el tiempo [1]. La minería de conjuntos de elementos recurrentes en conjuntos de datos transaccionales se basa únicamente en su ocurrencia sin tener en cuenta su factor de utilidad. Sin embargo, para muchos envíos reales, la utilidad de un conjunto de elementos basada en su precio, ganancias, ingresos o algún otro factor es significativa. Los problemas de minería de frecuencia ponderada basados en la utilidad se utilizan para localizar conjuntos de elementos frecuentes que tengan una utilidad superior a un mínimo especificado por el usuario. A diferencia de un algoritmo a priori [2], [3], que se basa en un marco de soporte y confianza, la minería de conjuntos de elementos recurrentes ponderados por frecuencia en función de su utilidad a partir de un conjunto de datos transaccionales variables en el tiempo plantea un reto mayor [4], [5].
La minería de conjuntos de artículos basados en la alta utilidad a partir de un conjunto de datos de transacciones variables en el tiempo se realiza para descubrir conjuntos de artículos que tienen una utilidad superior a un umbral preciso del usuario.
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:655 kb