换个角度考虑强化学习:通过强化学习实现自动化
约翰霍普金斯博士生兼 MILA 实习生的 Jacob Buckman 近日在其网站更新了一篇名为「通过强化学习实现自动化」的博客,深入研究了通过强化学习使任务自动化的含义。Jacob 在其博客中提到,该过程基本分为两个步骤:首先通过将其编写为 MDP 或 POMDP 来将问题减少到强化学习,然后解决 MDP 或 POMDP2 的最佳策略。然后,最佳策略使我们能够完全自动化该任务,无需人工再完成任意次。尽管它们非常简单,但目前并没有太多强化学习研究人员通过自动化的角度来考虑他们的工作。Jacob 认为这是非常有用的观点,并影响了其对强化学习看法。