Con el desarrollo del IoT (Internet de las cosas), las redes de sensores pueden aportar una gran cantidad de datos valiosos. Además de utilizarse en las aplicaciones locales de IoT, los datos también pueden comercializarse en los servidores de borde conectados. Como mecanismo eficiente de asignación de recursos, la subasta doble se ha utilizado ampliamente en los mercados de valores y futuros, y también puede aplicarse a la asignación de recursos de datos en redes de sensores. En la actualidad, suelen existir múltiples servidores de borde que ejecutan subastas dobles compitiendo entre sí para atraer a usuarios (compradores) y productores (vendedores) de datos. Por lo tanto, el mercado de subastas dobles que se ejecuta en cada servidor de borde necesita un mecanismo eficiente para mejorar la eficiencia de la asignación. En concreto, la estrategia de precios de la subasta doble desempeña un papel importante a la hora de influir en los beneficios de los operadores y, por tanto, afectará a las elecciones de mercado y a las estrategias de puja de los operadores, lo que a su vez influirá en el resultado de la competencia de los mercados de subasta doble. Además, las estrategias de negociación de los operadores también afectarán a la estrategia de precios del mercado. Por lo tanto, necesitamos analizar la estrategia de precios de los mercados de subasta doble y las estrategias de negociación de los operadores. En concreto, utilizamos un algoritmo de aprendizaje profundo por refuerzo combinado con la teoría del campo medio para resolver este problema con un enorme espacio de estados y acciones. Para las estrategias de negociación, utilizamos el algoritmo Independent Parametrized Deep Q-Network (I-PDQN) combinado con la teoría del campo medio para calcular las estrategias de equilibrio de Nash. A continuación, lo comparamos con el algoritmo de juego ficticio (PF). Los resultados experimentales muestran que la velocidad de cálculo del algoritmo I-PDQN es significativamente superior a la del algoritmo FP. En cuanto a las estrategias de precios, los mercados de subasta doble ajustarán dinámicamente la estrategia de precios en función de las estrategias de negociación de los operadores. Se trata de un proceso secuencial de toma de decisiones en el que intervienen múltiples agentes. Por lo tanto, lo modelamos como un juego de Markov. Adoptamos el algoritmo Multiagent Deep Deterministic Policy Gradient (MADDPG) para analizar las estrategias de precios de equilibrio de Nash. Los resultados experimentales muestran que el algoritmo MADDPG resuelve el problema más rápidamente que el algoritmo FP.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Rápida degradación fotocatalítica de contaminantes del agua bajo rayos UV y luz solar mediante aerogel de nanofibra de celulosa envuelto en TiO2
Artículo:
Comparación crítica entre los métodos modificados de Monier-Williams y los métodos electroquímicos para determinar sulfito en soluciones acuosas.
Artículo:
Detección adaptativa con garantía de fiabilidad en canales con ruido blanco gaussiano de redes de sensores
Artículo:
Síntesis de nanocompuestos basados en grafeno e investigación de sus propiedades térmicas y eléctricas
Artículo:
El Proyecto P.A.T.H.S. en Hong Kong: Lecciones aprendidas e implicaciones para programas de desarrollo positivo de la juventud.
Libro:
Ergonomía en los sistemas de trabajo
Artículo:
Obtención de gas combustible mediante la bioconversión del alga marina Ulva lactuca
Artículo:
Sistemas de producción y potencial energético de la energía mareomotriz
Artículo:
La necesidad de la planeación estratégica en las organizaciones industriales modernas