Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

OpenAI Universe加入GTA5,在游戏大作中训练人工智能

昨天,OpenAI 宣布旗下的开源人工智能测试环境 Universe 加入了游戏大作《侠盗猎车手 5》。用户只需购买正版游戏,即可使用 Universe 中的人工智能在 Los Santos 中的 3D 环境中纵横驰骋。此次开源的项目让自动驾驶模拟测试平台 DeepDrive 在 GTA 世界中进行测试变得更加简便易行。


如何收集用于训练人工智能的数据一直是各家科技公司面临的难题。在通过各种方法收集真实世界数据的同时,一些公司也在致力于构建虚拟环境——它们可以提供近乎无限的可能性。


OpenAI 一直视图构建各种不同类型的人工智能训练环境。目前,Universe 中包括了大约 2600 种 Atari 游戏,1000 种 flash 游戏和 80 种浏览器环境,可供所有人用于训练人工智能系统。GTA5 的引入是该项目的最新举措,它为训练用于自动驾驶汽车的人工智能打开了又一扇大门。


GTA5 的游戏世界是一个内容丰富的 3D 世界。在以下视频中你们会看到,在 Universe 的新测试环境中,人工智能获取视频信息的帧数被限制在了 8FPS,环境信息和视角管理齐备。同时,在 Universe 中的 GTA5 已经将原版游戏中的所有暴力元素去除。



开始游戏


想让人工智能体进入 GTA5 的世界,你需要安装 Universe 的 Python 库(你不需要为此特意升级到最新版本)。你可以通过加入以下代码来嵌入人工智能体。与其他游戏类似,人工智能收集信息的渠道是基于游戏视频输出的。除键盘和鼠标之外,在此游戏中人工智能体可以使用模拟游戏手柄进行操纵。


相关链接:


  • Universe GTAV: https://github.com/openai/universe-windows-envs/blob/master/vnc-gtav/README.md#using-the-prebuilt-ami

  • Universe: https://github.com/openai/universe#install-universe


gta_v_agent_view-1b058456914a4a731ceb842bed541582904f13f33bf824e04f9315cca4828139.jpg在 GTA5 中,人工智能看到的游戏画面


DeepDrive


DeepDrive 是一个用于开发人工智能自动驾驶系统的开放平台。DeepDrive 使用定制框架和内存检查技术在 GTA5 中的模拟环境测试自动驾驶汽车系统。在本次发布中,OpenAI 同时提供了预先训练好的自动驾驶人工智能,以及用于训练这个系统的数据集以供参考。新的 DeepDrive 环境和人工智能都构建在 Universe 基础之上。


在 DeepDrive 与 Universe 整合之前,这个自动驾驶开放平台已经展现了与现代大型 3D 游戏良好的兼容性。但这次开源的系统使用起来更加方便。原始版本的 DeepDrive 应用需要使用 Windows 系统的电脑在本地运行,需要花费大约一整天的时间调试游戏和人工智能接口。而在新的 DeepDrive 中,人们只需花费大约 20 分钟来进行设置,新的系统也支持在 Linux 和 OS X 平台上运行,同时这一新的功能也与之前已有的 Universe 人工智能互相兼容(当然,使用模拟游戏手柄比键盘鼠标效果更好)。


发布


今天发布的内容包括:

  • GTA V 环境的源代码和 AMI

  • 一个预训练驾驶智能体,在 Caffe 和 TensorFlow 上的实现。


相关链接:

  • 源代码: https://github.com/openai/universe-windows-envs/tree/master/vnc-gtav

  • AMI:https://github.com/openai/universe-windows-envs/blob/master/vnc-gtav/README.md#using-the-prebuilt-ami

  • 用于 GTA5 的自动驾驶人工智能: https://github.com/deepdrive/deepdrive-universe


GTA5 的集成环境支持选择视角与自定义视野。同时也拥有用于强化学习训练的奖励机制,包含避免碰撞、与目的地距离和停留在路面上等等。


环境


在 Universe 之前,DeepDrive 使用一个 DirectX 进行屏幕捕捉,且需要在 Windows 中使用 C++ 接入 Caffe 来写智能体。现在该游戏在云中的 Windows 虚拟机上运行,并通过 websockets 和 VNC 与 Universe 通信。因此该智能体可在 Linux 或 Mac 上运行,也可被写入任何机器学习框架中。


gta-diagram-e0d755e52a552b0a6615418efc77aa1bdbd0bd5b88c3ae056e65f2168867c6c6.jpg


Universe 


Universe 在 VNC 上迁移画面(pixel)、键盘和鼠标,在 websockets 上迁移其他信息。为了支持转向与减速的操纵杆控制,我们把操纵杆控制行为放入了 websockets 的环境。


就像刚发布 Universe 时所说的那样,在公共互联网络上用户能维持到 20 FPS。

GTA V 为研究人员测试、开发人工智能提供了丰富、多样的环境。它的地图设置几乎是洛杉矶的 1/5 大小,为测试系统提供了广阔的范围。还有 257 种不同的车辆、7 种自行车和 14 类天气环境,使用单个模拟器探索大量的不同排列变化也是有可能的。


gta_v_night_small-e0095fd9ea7b0398991a5e1e5ef491f9361001e9604d9f6e4932b85222fc8fac.jpg

GTA V 中圣安地列斯 49 平方英里的岛城使得研究人员有能力在忙乱的大都市中、蜿蜒的山路、平坦的沙漠以及高速公路上训练人工智能


在该环境中,也能收集大量的标记数据:你能使用底层 GTA V 引擎来收集 2D 或 3D 边界盒(bounding boxes),并且为汽车、人行道、自行车、动物、路面、交通标志以及其他 GTA V 中超过 7000 类的物体进行标记。该环境也能通过 mods 延展到现实世界的汽车、道路建筑,甚至是整个城市。


预训练智能体


此次发布包括一个基线智能体,通过在人工智能玩游戏的 21 小时的数据集(大约 60 万张图片)上进行模仿学习得以训练。(内建游戏人工智能是个非常好的初始目标:它要比典型的人类玩家表现更好,因为它能获取游戏内部状态,即使它仍然会犯在高速公路上 180 度掉头这样的错误)。该基线智能体能干在多种不同的天气环境中进行驾驶、应对交通环境,遵守交通规则。它也只是个开始,我们诚邀社区其他人对它进行改进。



其他研究人员已经证明我们能够在 GTA V 上训练视觉系统,并使用它在现实世界中分类图片。Universe GTA V 融合体使得在模拟自动驾驶系统上尝试强化学习技术变得很轻松。


GTA V 融合进 Universe 自动地继承了所有的工具和语义,Universe 提供了可比性和可共享性,也使得在 GTA V 上评估智能体的表现变得更容易。它可被单独使用,或者作为获取通用 Universe 智能体的另一环境。

入门OpenAI文体娱乐开发环境Universe工程
暂无评论
暂无评论~