机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」。而机器人则是执行任务的物理代理。根据机器人要执行的任务,机器人设计上会有诸如腿,轮子,关节和抓手等控制器(effector)。机器人还配备了传感器,可以让他们感知环境。现代机器人采用多种传感器,包括用于测量环境的摄像头和激光器,以及用于测量机器人自身运动的陀螺仪和加速度计。
机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。固定机器人的运动通常涉及一系列可控的关节。
第二类是移动机器人,移动机器人使用轮子,腿或类似机制在环境中移动。常见的移动机器人应用有货运机器人、空中机器人和自动载具。它们已被用于在医院中运送食物,在装卸码头移动集装箱等类似任务。无人驾驶地面车辆或UGV在街道,高速公路和越野路面上自主驾驶。无人飞行器(UAV)和用于深海勘探的通用水下航行器(AUVs)等也属于移动机器人的范畴。
机器人领域还包括假肢装置(人造假肢,耳朵和眼睛),智能环境(例如装备有传感器和效应器的整个房子)。
真正的机器人必须能够应对部分可观察,随机,动态和持续的环境。比如机器人相机无法看到四周的角落,并且由于齿轮打滑,摩擦等原因,运动指令会受到不确定性的影响。此外,在模拟环境中,可以使用简单的算法在数百万次试验的几个CPU小时内完成学习和训练。而在真实的环境中,运行这些试验可能需要几年的时间。因此,机器人需要不同部件和系统的协作才能实现最优的作业。如上文所述,其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。另外常见的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。举例来说,在这一领域常用的算法有,卡尔曼滤波器、粒子滤波器等定位算法,BFS算法、A*算法等搜索算法,还有Q-learning等强化学习算法。
除以上机器人领域一直在研究的传统任务,目前有关机器人的研究也越来越多元化。如通过深度强化学习和模拟学习让机器人获得一种类似于视觉肌肉记忆的能力(Visual Motor Skills),能够快速运动并且保持快速反应能力的机器人(波士顿动力人形机器人),软机器人技术,能够自监督学习(self-supervised learning)的机器人,可交互学习的机器人系统等等。
【描述来源:Russell, S. J., & Norvig, P. (2010). Artificial Intelligence (A Modern Approach). 】
发展历史
自从上世纪「Robot」一词诞生以来,人们已经为工业制造业设计了很多机器人。「Robot」这个词最早由艺术家 Josef Čapek 创造,并在剧作家Karel Capek的1921年的作品R.U.R中得到了推广。1941年,科幻小说家艾萨克·阿西莫夫(Isaac Asimov)在他于1942年发表的作品《转圈圈》中提出了机器人三定律,三定律在科幻小说中大放光彩,在一些其他作者的科幻小说中的机器人也遵守这三条定律。同时,三定律也具有一定的现实意义,在三定律基础上建立新兴学科“机械伦理学”旨在研究人类和机械之间的关系。但目前三定律并未实际应用在机器人上面。
第一台商业机器人是一台叫做Unimate的机器人手臂,是由Joseph Engelberger和George Devol开发的universal automation的缩写。 1961年,第一台Unimate机器人被出售给通用汽车,在那里它被用于制造电视显像管。 1961年也是Devol获得机器人第一项美国专利的一年。十一年后的1972年,日产汽车公司成为首家自动化机器人装配线的公司之一,该机器人由Kawasaki开发,机器人由Engelberger和Devol公司的Unimation提供。这种发展启动了一场主要在日本和美国进行的重大革命,而且这一革命仍在进行中。1978年PUMA机器人问世,PUMA是Programmable Universal Machine for Assembly的缩写。这一最初为通用汽车开发的PUMA机器人在随后的二十年机器人研究中成为了衡量机器人表现的标准。到2010年,全球运营机器人的数量估计为100万,其中一半以上安装在日本。
有关机器人研究的文献可以大致分为两部分:移动机器人和固定机器人。William Grey Walter的“Turtle”建于1948年,可被认为是第一个自主移动机器人,尽管其控制系统不可编程。 20世纪60年代初在约翰霍普金斯大学建造的“Hopkins Beast”更加复杂:它有模式识别硬件,可以识别标准交流电源插座的盖板。它能够搜索插座,插入电源,然后给电池充电。第一个通用移动机器人是“Shakey”,当时是斯坦福研究所(现为SRI)在20世纪60年代后期开发的。 Shakey是第一个整合感知,计划和执行的机器人,随后对AI的许多后续研究都受到了这一显着成就的影响。其他有影响力的项目包括Stanford Cart和CMU Rover。1990年,世界上最成功的商业机器人吸尘器公司 iRobot 成立。
1986年,Smith和Cheeseman将卡尔曼滤波器应用于机器人领域内景点的SLAM问题,该算法首先由Moutarlier和Chatila(1989)实现,后来由Leonard和Durrant-Whyte(1992)扩展。 Lu和Milios(1997)的一篇开创性论文认识到SLAM问题的稀疏性,这推动了Konolige(2004)和Montemerlo和Thrun(2004)提出的非线性优化技术的发展。1977年,Shatkay和Kaelbling发表的文章和Thrun等人于1998发表的文章将EM算法引入到用于数据关联的机器人映射领域。
2000年起,过去十年来,移动机器人技术的研究在几个重要的比赛中得到了发展。最早的竞赛有1992年开始的AAAI年度移动机器人竞赛。第一届竞赛获胜者是CARMEL——由Congdon等人于1992年提出;由Kitano及其同事于1995年发起的Robocup比赛旨在“在2050年之前开发一个完全自主的人形机器人队伍,这个机器人队可以赢得足球世界冠军队的胜利。” 由DARPA在2004年和2005年组织的DARPA大挑战赛要求自主机器人在不到10个小时的时间内在沙漠地形行驶超过100英里。在2004年时,没有机器人能走过8英里以上,导致很多人认为这个奖项永远不会被任何团队得到。 2005年,斯坦福大学的机器人STANLEY在不到7个小时的旅行中赢得了比赛——由Thrun等人于2006发表的论文对这一机器人进行了描述,DARPA然后组织了城市挑战赛,在这场比赛中,机器人要在城市环境中行驶60英里。卡内基梅隆大学的机器人BOSS获得了第一名——细节在Urmson和Whittaker在2008发表的论文中可以找到。2007年,库卡推出 KR titan (「世界上最大和最强的六轴工业机器人」),是吉尼斯世界纪录中世界最强壮的机器人。2009年,谷歌启动自动驾驶汽车项目。2016年,ABB 开发出 YuMi (「世界上第一款真正的协作式工业机器人」)。近年来,机器人研究的发展越来越快,如伯克利BAIR实验室致力于可交互学习的机器人系统,以类似强化学习的范式(目标函数不确定),能根据人类干预对自身轨迹进行修正,以最大化奖励,从而可以实时学习人类偏好。而CMU 和谷歌研究者正在使用基于博弈论和深度学习的对抗性训练策略来提升操作性任务,如抓取物体。
工业机器人是增长最快的应用领域,它们在 20 世纪 80 年代将这一领域带入了应用阶段。在安川电机、Fanuc、ABB、库卡等公司的努力下,我们认为进入 21 世纪之后,机器人领域就已经进入了社会影响阶段,此时各种工业机器人已经主宰了装配生产线。此外,软体机器人在很多领域也有广泛的应用,比如在医疗行业协助手术或在金融行业自动执行承销过程。
[描述来源:Russell, S. J., & Norvig, P. (2010). Artificial Intelligence (A Modern Approach). ]
主要事件
年份 | 事件 | 相关论文/Reference |
1920 | 艺术家 Josef Čapek 创造了「Robot」这个词,并通过其兄弟 Karel Čapek 的一部戏剧将其介绍了公众 | Čapek, C. (1920). Rossum's Universal Robots |
1941 | Isaac Asimov 提出「机器人三定律」 | Asimov, I. (1942). I, ROBOT. |
1948 | William Grey Walter 创造的 Turtle 被认为是第一个自动的移动机器人 | Walter, G. (1953). The Living Brain. Norton, New York. |
1954 | George Devol 和Joe Engleberger 发明了第一个可编程的机器人——实际上是机器臂;通用(GM)在 1961 年买下了这个机器人 | Engelberger, J. F. (1980). Robotics in practice : management and applications of industrial robots. AMACOM, New York. |
20世纪60年代末 | SRI开发出 Shakey(第一个通用移动式机器人) | Fikes, R. E. and Nilsson, N. J. (1971). STRIPS: A new approach to the application of theorem proving to problem solving. AIJ, 2(3–4), 189–208.//Nilsson, N. J. (1984). Shakey the robot. Technical note 323, SRI International. |
20世纪70年代 | 一款早期的自动驾驶汽车 Stanford Cart 问世 | Moravec, H. P. (1983). The stanford cart and the cmu rover. Proc. IEEE, 71(7), 872–884 |
1989 | Moutarlier和Chatila实现卡尔曼滤波器 | Moutarlier, P. and Chatila, R. (1989). Stochastic multisensory data fusion for mobile robot location and environment modeling. In ISRR-89 |
1992 | Leonard和Durrant-Whyte将卡尔曼滤波器进行了扩展 | Leonard, J. and Durrant-Whyte, H. (1992). Directed sonar sensing for mobile robot navigation. Kluwer |
1995 | CMU 改造了一辆旁蒂克 Trans Sport 小型厢车,得到了自动汽车 NavLab 5,它完成了 3100 英里的行程 | Pomerleau, D. (1995). RALPH: rapidly adapting lateral position handler. Intelligent Vehicles '95 Symposium.pp. 506-511. |
1997 | Lu和Milios的一篇开创性论文认识到SLAM问题的稀疏性 | Lu, F. and Milios, E. (1997). Globally consistent range scan alignment for environment mapping. Autonomous Robots, 4, 333–349. |
1998 | Thrun等人发表的文章将EM算法引入到用于数据关联的机器人映射领域 | Thrun, S., Fox, D., and Burgard, W. (1998). A probabilistic approach to concurrent mapping and localization for mobile robots. Machine Learning, 31, 29–53. |
2004 | Konolige提出非线性优化技术 | Konolige, K. (2004). Large-scale map-making. In AAAI-04, pp. 457–463. |
2005 | STANLEY 赢得 DARPA 挑战赛,完成了 132 英里行程 | Thrun, S. (2006). Stanley, the robot that won the DARPA Grand Challenge. J. Field Robotics, 23(9), 661–692. |
2007 | BOSS赢得了DARPA城市挑战赛 | Urmson, C. and Whittaker, W. (2008). Self-driving cars and the Urban Challenge. IEEE Intelligent Systems, 23(2), 66–68. |
2017 | 伯克利BAIR实验室开发出于可交互学习的机器人系统 | Bajcsy, A.; Losey, D. P.; Malley, M. K. O. and Dragan, A. D. (2017). Learning Robot Objectives from Physical Human Robot Interaction. Conference on Robot Learning (CoRL). |
2017 | CMU 和谷歌研究者正在使用基于博弈论和深度学习的对抗性训练策略来提升操作性任务,如抓取物体 | Pinto, L.; Davidson, J.; Gupta, A. (2017).Supervision via Competition: Robot Adversaries for Learning Tasks. ICRA. |
发展分析
瓶颈
- 设计和制造机器人需要相对较高的投资。
- 机器人通常根据行业设计,大多数机器人只能在设定的行业内工作。
- 法律法规和「机器人威胁论」可能会妨碍机器人领域的发展。
未来发展方向
- 将会出现全自动驾驶汽车(根据 SAE 分级标准是 5 级自动驾驶,即「完全驾驶自动化」)
- 我们可以预见会出现能执行多种任务的机器人,而不只是专注某个特定领域。
- 可能会出现人类无法分辨的人形机器人(类似汉森机器人公司的一些产品)。比如,机器人可以像真实人类一样工作,可以帮助人们做家务或当电影演员。
Contributor:Yuanyuan Li, Mos Zhang