摘要
交通信号控制是城市交通中的关键挑战,需要多个交叉口之间的协调以优化整体交通流量。尽管强化学习在自适应信号控制中展现出潜力,现有方法在多智能体协调和样本效率方面存在困难。本文提出MADT(多智能体决策变换器),将多智能体交通信号控制重新表述为序列建模问题。MADT通过引入图注意力机制建模交叉口间的空间依赖关系、时序变换器编码器捕捉交通动态以及目标性能条件来扩展决策变换器范式至多智能体场景。该方法能够从历史交通数据中进行离线学习,并支持潜在的在线微调。实验表明,在合成网格网络和真实交通场景中,MADT实现了最先进的性能,相比最强基线平均减少了5-6%的旅行时间,并表现出更优的相邻交叉口协调能力。
AI 推荐理由
论文涉及多智能体决策中的序列建模与目标性能条件,与Agent Memory相关但非核心主题。
论文信息