La calidad de los datos es esencial para su uso auténtico en análisis y aplicaciones. El gran volumen de datos de recaudación automatizada adolece inevitablemente de problemas de calidad, como la falta de datos y la invalidez de los mismos. Este artículo aborda un problema de datos inválidos en la base de datos de cobro automático de billetes (AFC) causado por la asociación errónea entre las máquinas expendedoras de billetes y las estaciones de metro, por ejemplo, una máquina expendedora de billetes situada en la estación A se asocia erróneamente con la estación B en la base de datos AFC. Esto podría dar lugar a tarifas inadecuadas en un sistema tarifario basado en la distancia y causar sesgos de análisis en la práctica de planificación/operación. Proponemos un enfoque basado en la descomposición tensorial y el bosque de aislamiento para detectar y corregir las máquinas de tarifas asociadas no válidas en el sistema. La descomposición tensorial extrae las características de los flujos de pasajeros y los tiempos de viaje que pasan por las máquinas expendedoras de billetes. El bosque de aislamiento acoplado a una red neuronal (NN) toma estas características como entradas para detectar las máquinas expendedoras de billetes erróneamente asociadas e inferir las estaciones de asociación correctas. Los estudios de caso realizados con datos de una red de metro demuestran que el método de detección propuesto alcanza una precisión superior al 90
de precisión en la detección de las asociaciones no válidas para hasta un 35% de asociaciones no válidas. La asociación inferida tiene una precisión del 90
incluso cuando el porcentaje de asociaciones no válidas alcanza el 40%. El método propuesto de detección de datos no válidos basado en datos es útil para la gestión de datos a gran escala en términos de comprobación y corrección de la calidad de los datos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Fundamentos de logística para profesionales de compras y suministros
Artículo:
Elección de la hora de salida (DTC) para viajes interurbanos durante unas vacaciones largas en Bangkok, Tailandia
Artículo:
Identificación del tipo de tren en S
Artículo:
Marco para la evaluación de la seguridad del tráfico en las intersecciones mediante la aplicación de la teoría de redes complejas
Artículo:
Análisis y evaluación del riesgo de conducción en la zona derecha de la ingeniería de reconstrucción y ampliación de autopistas
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
La necesidad de la planeación estratégica en las organizaciones industriales modernas
Artículo:
Sistemas de producción y potencial energético de la energía mareomotriz
Artículo:
Obtención de gas combustible mediante la bioconversión del alga marina Ulva lactuca