Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

小舟编辑

盈利后首次收购:DeepMind把自用物理模拟引擎MuJoCo买下来开源了

物理模拟引擎 MuJoCo 现在直接开源了。

日常生活中,人们通过与各种物体接触与世界互动。例如走路时脚接触地面,书写时手指与笔接触。接触虽然是种很普遍的现象,但研究起来却有些复杂。模拟身体接触也是机器人研究中非常重要的一部分。


MuJoCo 就是一款在接触动力学方面非常强大的物理模拟引擎,它提供了超快的动力学模拟,对于模拟机器人手臂和抓取任务特别有效,在模型预测控制和机器人模仿学习的研究中也颇具利用价值。

但是 MuJoCo 一直都需要付费使用,而且价格不菲。现在,DeepMind 宣布收购 MuJoCo,向所有用户免费开放 MuJoCo,并将其开源!

社区内的开发者大呼:「这真是一个好消息,我曾因为 MuJoCo 付费价格太高而放弃使用!」


DeepMind 表示此举是为了支持学术研究,推动科学发展。MuJoCo 也一直是 DeepMind 机器人团队的首选物理模拟引擎,具有丰富的接触模型、强大的场景描述语言和精心设计的 API。DeepMind 还表示开源是为了与 AI 社区一起持续改进 MuJoCo。不过,目前代码库还没有开放,DeepMind 表示预计将在 2022 年发布。

开源地址:https://github.com/deepmind/mujoco

强大的模拟引擎 MuJoCo

MuJoCo 最初是由华盛顿大学运动控制实验室主任、神经科学家 Emo Todorov 开发的,最初被用于解决最优控制,状态估计和系统识别等领域的问题。2015 年被 Robi LLC 打造成商业产品后,逐渐在机器人社区中被广泛使用,成为模拟环境和真实环境构建智能控制器的基础工具。

MuJoCo 的接触模型能够准确有效地捕获接触对象的显著特征。与其他刚体模拟器一样,它避免了接触部位变形的精细细节,并且模拟通常比实际运行速度快得多。与其他模拟器不同的是,MuJoCo 使用凸高斯原理解决接触力。MuJoCo 的模型也很灵活,提供了多个参数,可以调整这些参数以模拟各种接触现象。




MuJoCo 的强大还体现在它能够实现完整的运动方程,模拟一些较复杂的物理现象,例如牛顿摆:



还可以模拟旋转物体因角动量守恒而存在的「失重」情况:



MuJoCo 的核心引擎是用 C 语言编写的,因此可以轻松移植到各种架构。作为机器人研究领域的重要工具,MuJoCo 具备强大的场景描述能力,并包含真实世界机器人组件的各种元素,如等式约束、动作捕捉标记、肌腱、执行器和传感器。同时,MuJoCo 还支持人类和动物的肌肉骨骼模型,下图就是 MuJoCo 模拟人腿在肌腱施加力的驱动下摆动:


参考链接:
https://deepmind.com/blog/announcements/mujoco
https://www.reddit.com/r/MachineLearning/comments/qaouds/n_deepmind_acquires_mujoco_makes_it_freely/
产业DeepMind
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
神经科学技术

神经科学,又称神经生物学,是专门研究神经系统的结构、功能、发育、演化、遗传学、生物化学、生理学、药理学及病理学的一门科学。对行为及学习的研究都是神经科学的分支。 对人脑研究是个跨领域的范畴,当中涉及分子层面、细胞层面、神经小组、大型神经系统,如视觉神经系统、脑干、脑皮层。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

最优控制技术

最优控制是指在给定的约束条件下,寻求一个控制,使给定的系统性能指标达到极大值(或极小值)。它反映了系统有序结构向更高水平发展的必然要求。它属于最优化的范畴,与最优化有着共同的性质和理论基础。对于给定初始状态的系统,如果控制因素是时间的函数,没有系统状态反馈,称为开环最优控制,如果控制信号为系统状态及系统参数或其环境的函数,称为自适应控制。

动量技术

优化器的一种,是模拟物理里动量的概念,其在相关方向可以加速SGD,抑制振荡,从而加快收敛

模仿学习技术

模仿学习(Imitation Learning)背后的原理是是通过隐含地给学习器关于这个世界的先验信息,就能执行、学习人类行为。在模仿学习任务中,智能体(agent)为了学习到策略从而尽可能像人类专家那样执行一种行为,它会寻找一种最佳的方式来使用由该专家示范的训练集(输入-输出对)。

推荐文章
暂无评论
暂无评论~