La medición en rampa para un cuello de botella situado lejos de la rampa es más difícil que para un cuello de botella situado cerca de la rampa. Esto se debe a que, bajo el control de una estrategia de medición de rampas lineal convencional, cuando el tráfico medido de la rampa llega al cuello de botella distante aguas abajo, el estado del cuello de botella puede haber cambiado significativamente desde el momento en que se muestrea para calcular la tasa de medición; debido al tiempo considerable que este tráfico tendrá que recorrer la larga distancia entre la rampa y el cuello de botella. Como consecuencia de estos efectos de retardo temporal, pueden surgir importantes problemas de estabilidad. Los estudios anteriores han recurrido principalmente a compensar los efectos de retardo incorporando a los sistemas de control predictores de la evolución del flujo de tráfico. Este artículo presenta un enfoque alternativo. El problema de la medición de rampas para un cuello de botella distante aguas abajo se formula como un problema de aprendizaje Q, en el que un agente inteligente de medición de rampas aprende una política óptima no lineal de medición de rampas, de forma que la capacidad del cuello de botella distante aguas abajo pueda utilizarse al máximo, pero sin excederse y causar congestión. La política aprendida está en forma de retroalimentación pura, ya que sólo se necesita el estado actual del entorno para determinar la tasa de medición óptima para el momento actual. No es necesaria la predicción, ya que la anticipación de la evolución del flujo de tráfico se ha inculcado en la política de retroalimentación no lineal a través del aprendizaje. Para hacer frente al intimidante coste computacional asociado al espacio de estado continuo multidimensional, la función de valor de las acciones se aproxima mediante una red neuronal artificial, en lugar de una tabla de consulta. El mecanismo y el desarrollo de la función de valor aproximada y la forma en que el aprendizaje de sus parámetros se integra en el proceso de aprendizaje Q están bien explicados. Mediante experimentos, la política de medición en rampa aprendida ha demostrado eficacia y estabilidad benigna y cierto nivel de robustez frente a las incertidumbres de la demanda.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículos:
Evaluación del espacio compartido para reducir la congestión del tráfico
Artículos:
Método de protección de la privacidad de la trayectoria del vehículo basado en datos VLPR
Artículos:
Caracterización de la estructura de la red ferroviaria en China: Un enfoque de red ponderada compleja
Artículos:
Modelo de previsión no lineal del riesgo evolutivo del proyecto de APP
Artículos:
Investigación sobre la optimización de rutas de autobús personalizadas basada en la teoría de la incertidumbre
Artículos:
Comportamiento del aguacate Hass liofilizado durante la operación de rehidratación
Artículos:
Caracterización estructural de la materia orgánica de tres suelos provenientes del municipio de Aquitania-Boyacá, Colombia
Informes y Reportes:
Técnicas de recuperación de suelos contaminados
Artículos:
Una revisión de la etiopatogenia y características clínicas e histopatológicas del melanoma mucoso oral.