Biblioteca122.739 documentos en línea

Artículo

Solving Misclassification of the Credit Card Imbalance Problem Using Near MissResolución del problema de la clasificación errónea de los desequilibrios de las tarjetas de crédito mediante el uso de casi errores

Resumen

En los conjuntos de datos de tarjetas de crdito ordinarias, hay muchas menos transacciones fraudulentas que ordinarias. Al abordar el problema del desequilibrio de las tarjetas de crdito, la solucin ideal debe tener un sesgo y una varianza bajos. Este artculo pretende ofrecer una investigacin experimental en profundidad del efecto de utilizar un enfoque hbrido de punto de datos para resolver el problema de la clasificacin errnea de clases en conjuntos de datos de tarjetas de crdito desequilibrados. El objetivo de la investigacin era utilizar una tcnica novedosa de gestin de conjuntos de datos desequilibrados para mejorar la eficacia de los algoritmos de aprendizaje automtico en la deteccin de fraudes o patrones anmalos en enormes volmenes de registros de transacciones financieras en los que la distribucin de clases estaba desequilibrada. El artculo propone el uso de un bosque aleatorio y un enfoque hbrido de puntos de datos que combina la seleccin de caractersticas con una tcnica de submuestreo basada en Near Miss. Evaluamos el mtodo propuesto en dos conjuntos de datos de tarjetas de crdito desequilibrados, a saber, el conjunto de datos de tarjetas de crdito europeas y el conjunto de datos de tarjetas de crdito UCI. Los resultados experimentales se presentaron mediante matrices de rendimiento. Se compararon los resultados de clasificacin de la regresin logstica, la mquina de vectores de soporte, el rbol de decisin y el bosque aleatorio antes y despus de utilizar nuestro mtodo. Los resultados mostraron que el enfoque propuesto mejoraba la precisin predictiva de los algoritmos de regresin logstica, mquina de vectores soporte, rbol de decisin y bosque aleatorio en los conjuntos de datos de tarjetas de crdito. Adems, descubrimos que, de los cuatro algoritmos, el bosque aleatorio era el que mejores resultados daba.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento