La calidad de los datos es esencial para su uso auténtico en análisis y aplicaciones. El gran volumen de datos de recaudación automatizada adolece inevitablemente de problemas de calidad, como la falta de datos y la invalidez de los mismos. Este artículo aborda un problema de datos inválidos en la base de datos de cobro automático de billetes (AFC) causado por la asociación errónea entre las máquinas expendedoras de billetes y las estaciones de metro, por ejemplo, una máquina expendedora de billetes situada en la estación A se asocia erróneamente con la estación B en la base de datos AFC. Esto podría dar lugar a tarifas inadecuadas en un sistema tarifario basado en la distancia y causar sesgos de análisis en la práctica de planificación/operación. Proponemos un enfoque basado en la descomposición tensorial y el bosque de aislamiento para detectar y corregir las máquinas de tarifas asociadas no válidas en el sistema. La descomposición tensorial extrae las características de los flujos de pasajeros y los tiempos de viaje que pasan por las máquinas expendedoras de billetes. El bosque de aislamiento acoplado a una red neuronal (NN) toma estas características como entradas para detectar las máquinas expendedoras de billetes erróneamente asociadas e inferir las estaciones de asociación correctas. Los estudios de caso realizados con datos de una red de metro demuestran que el método de detección propuesto alcanza una precisión superior al 90
de precisión en la detección de las asociaciones no válidas para hasta un 35% de asociaciones no válidas. La asociación inferida tiene una precisión del 90
incluso cuando el porcentaje de asociaciones no válidas alcanza el 40%. El método propuesto de detección de datos no válidos basado en datos es útil para la gestión de datos a gran escala en términos de comprobación y corrección de la calidad de los datos.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Un enfoque de consenso de tercer orden para el pelotón de vehículos con comunicación entre vehículos
Infografía:
Tacógrafos digitales
Artículo:
Optimización del inventario de la cadena de suministro de productos agrícolas frescos basada en el superdocking agrícola
Artículo:
Exploración de los factores asociados a la gravedad de las lesiones de los ciclistas en los accidentes entre vehículos y bicicletas eléctricas a partir de un modelo logit de parámetros aleatorios
Artículo:
Sistema de gestión de accidentes basado en la red de vehículos para un sistema de transporte inteligente en entornos urbanos
Artículo:
Medicina de la conservación ¿una disciplina para médicos veterinarios?
Libro:
Tratamiento de aguas para consumo humano : plantas de filtración rápida. Manual II : diseño de plantas de tecnología apropiada
Artículo:
Configuración de los valores de María, antes y después de la violación, en Satanás de Mario Mendoza
Showroom:
Panel fotovoltaico: Dimensionamiento y funcionamiento