伯克利人工智能实验室利用强化学习解决交通拥堵
伯克利人工智能实验室发布了使用深度强化学习(RL)的新基准来为混合自治交通创建控制器,连接和自动驾驶车辆(CAV)与人类驾驶员和基础设施进行交互。诸如 Mujoco 或 Arcade Learning Environment 之类的基准测试能够使研究人员有效地比较他们的结果来激发新的研究,使他们能够专注于算法改进和控制技术而不是系统设计。为了通过 RL 促进交通控制方面的类似进展,研究人员们还提出了基于三种新的交通情景的四个基准,解释了混合自治交通应用中不同的强化学习问题,并介绍了每个控制问题,MDP 结构概述以及常用 RL 算法的初步性能结果。