加州伯克利大学人工智能实验室(BAIR)技术博客新文,「深度强化学习的物理逼真攻击」
深度强化学习(RL)在从数据中心散热到视频游戏等问题上日前都取得了超人的表现。其策略可能很快会被广泛部署到有关自动驾驶,谈判和自动交易的研究中。许多潜在的应用对安全至关重要:自动交易失败导致 Knight Capital 损失 4.6 亿美元,而自动驾驶汽车出现故障则会导致生命损失。因此,RL 策略的鲁棒性至关重要。那么是否可以通过选择在多智能体环境中采取对抗策略来攻击 RL 智能体,从而创建具有对抗性的自然观察?我们展示了在模拟人类人形机器人与本体感受观察之间的零和游戏中,对抗性策略的存在,可靠地击败受害者,但产生了看似随机且不协调的行为。我们发现,这些策略在高维环境中更为成功,并且与受害者与正常对手竞争时相比,在受害者策略网络中引起了实质上不同的激活。