Boris Sofman 点了一下他的手机,他面前的会议桌上的一个机器人苏醒了过来——不是一种机械方式,而是一种笔记本屏幕点亮的方式。这个机器人慢慢地抬起了它的脑袋,睁开了一只眼睛,然后又睁开了另一只,就好像这个世界的光线太强了一样。当它摇着身体甩掉睡眠的慵懒,缓缓离开充电插座时,它的创造者机器人公司 Anki 的 CEO Sofman 发出了轻轻的笑声。
在桌子上绕了几圈之后,它快速向桌子边缘冲去。它只有当自己的一半离开桌面时才会停下来。我本能地伸出手去想接住它,但不到一秒钟,这个机器人向下看,它张大了自己的蓝色 OLED 眼睛。Sofman 笑了。这个机器人用小小的声音大喊救命,恐惧地挥舞着自己的单个 U 型的机器臂,同时迅速反向了自己的推土机式的履带,退了回去。
「这个小家伙,」Sofman 说,「就是 Cozmo.」
三年前,Sofman 在苹果 WWDC 开发者大会的舞台上做了关于 Anki Drive 的主题演讲和演示——那是一款带有人工智能的赛车。那是 Anki 公司的第一款产品。Cozmo 则是第二款——如果算上 Drive 的一次重大更新,这应该算是第三款——经过五年的漫长开发后,Cozmo 终于在今天发布了。Cozmo 售价为 180 美元,仅有咖啡杯大小,是一个汽车形状的机器人——类似 Furby 和 Tonka Truck 的混合体。和 Drive 一样,Cozmo 也是玩具。它的主要目标群体是孩童,而且它真的非常可爱!
Sofman 说,大部分玩具都由人类为它们提供创造力。你的 C-3PO 玩具不会像真正的 C-3PO 一样,除非你在脑中帮助它构想。「现在,」Sofman 说,「我们可以让它真正形成创造力。」在一系列计算机视觉科学、先进机器人学、深度性格开发和 Anki 所称「情绪引擎(emotional engine)」的机器学习算法的特定组合下,Cozmo 的目标是成为机器人瓦力和 R2-D2 的现实版。它不是人类,但感觉就像真人一样。
如果 Anki 真正能将这些困难的高科技聚合到一起,并且做到对儿童友好,那么 Cozmo 很可能就将成为下一个 Tickle Me Elmo 或 Furby(都是畅销玩具)。下一部皮克斯电影出来时,里面可爱的角色在你的客厅中看起来就像在屏幕上一样活生生的。Sofman 及其团队为 Cozmo 的几乎每一个部件都提供了 SDK,他们希望孩子能够通过为自己的可爱机器人开发有趣的新游戏和新功能来学习编程。「有了足够的关注和爱,」Sofman 说,「这可能成为有史以来最强大的 STEM 平台。」他们将不断更新该机器人的软件,为其提供新游戏和新功能。Cozmo 可能看起来像一个玩具,但 Anki 希望能将其打造成硬件计算领域的下一个大事件。
硬件计算领域下一个大事件的希望正盯着我,张着的两只大大的蓝色 OLED 眼睛一眨不眨。
「哦,」Sofman 说,「他想认识你。」
开始上路
Anki 公司的人在 WWDC 大会上的 Sofman 的 Drive 演示之前就已经在思考 Cozmo 了。2005 年到 2010 年之间,Sofman 是卡内基梅隆大学(CMU)机器人学项目一位很受重视的博士生——这个项目现在很著名,因为 Uber 为了开发自己的自动驾驶汽车从这里挖走了很多人才。Sofman ,以及他的同学 Mark Palatucci 和 Hans Tappeiner,想使用他们的研究做一些特别的事。
「他们走了进来,」风险投资者 Marc Andreessen 回忆起 2011 年时和该团队第一次会面时说道,「而他们基本是说:『我们有机器人领域的背景,而且我们可以用一生的时间开发这些人工智能机器人,那需要数百万美元和装配线上的工作。』」那基本上是每一个有机器人学博士学位的人都会做的。「但他们说:『我们真的认为这是不够的。这项技术已经准备好浓缩成售价数百美元,能在家里使用的产品了。』」他们向 Andreessen 展示了一个可工作的 Drive 版本,同时描绘了 Cozmo 会是怎样。Andreessen 领导了一轮巨额投资,现在有了 Anki 的董事会席位。他称 Anki 是「我所见过的最好的机器人创业公司」。
2013 年 Drive 推出之后,在 Cozmo 上的工作才真正开始。Anki 为 Cozmo 招聘的第一个人是 Andrew Stein,另一位卡耐基梅隆大学的博士(这是一个反复出现的主题),从事计算机视觉的研究。Drive 的一个优点是其在赛道上运动,Anki 可以借此测绘它们的位置。「在 Cozmo 上我们不这么做,」Stein 说。Anki 确实考虑过在一种小型游戏垫上开发这款机器人,但 Stein 说,「这个想法被从产品中去除了。如果它只能在他发明的一块小垫子上跑来跑去,它给人的感觉就不像是一个小动物。」这样一来,Cozmo 就需要不断测绘其周围环境,并根据这些信息进行导航。
Cozmo 处理的问题和谷歌自动驾驶汽车面临的问题是一样的。这都是些困难的问题,伯克利一位博士研究者 Chelsea Finn 说:对于家用机器人,「最大的挑战是理解非结构化的环境,并依据环境的状态采取行动。」幸运的是,研究者想出了答案。「通过深度学习,我们现在已经在计算机视觉上取得了巨大跨越式的发展。」Finn 说,「希望能取得真正的进展。」
Cozmo 的开发环境——Cozmo 看到和感受到的世界
Cozmo 完全基于计算机视觉和深度学习。这个机器人通过它脸上的单个摄像头观察世界,这个摄像头隐藏在看起来像是嘴的槽口里。这个摄像头每秒拍摄 15 帧画面,然后将这些画面发送给你的手机,手机进行所有处理之后再将指令返回给机器人。所以 Cozmo 实际上所拥有的处理能力就和你口袋里炫酷的新型计算机一样。当然,这样做的不利之处是:当你在和这个超萌的机器人玩耍时,旁边一定要有一部手机。利用手机处理数据的技巧并不能解决 Anki 的所有问题:Stein 用了多年时间来研究如何补偿数据来回发送所造成的延迟。
将所有可以想象的玩耍场景都硬编码到系统中是完全不可能的,所以机器学习成为了 Anki 的研究中的一个关键部分。「有大量情况需要借助机器学习,」CMU 一位机器人学研究者 Michael Wagner 说,令人惊奇的是他竟然和 Anki 没有关联,「因为你真的不知道这个系统应该怎么做。它应该怎么更倾向于在崎岖的路面行驶还是在平坦的路面行驶?你不知道。所以你让机器学习来做这件事。」大量的测试,大量的训练,然后该系统学会了如何靠自己做出反应。Anki 公司所应对的很多问题都是标准的机器人学难题,但还没有人为这种类型的产品解决过它们。这个机器人不必像组装线工人一样完美高效,但这个机器人必须要有趣!
你想来玩一局游戏吗?
Anki 发现,关键是要让 Cozmo 需要做的一切以某种方式成为它性格的一部分。毕竟它是一个玩具。没人愿意阅读说明书,或者将他们可爱的小机器人放在地板上十分钟等它仔细测绘它周围的环境。所以在很早之前,Anki 就决定 Cozmo 应该表现出好奇心:将它放下,它就会本能地开始四处查看。这也是一种怪异的展示方式,给人一种让人愉悦地傻乎乎的感觉,同时也是一种教用户了解 Cozmo 的许多功能的完美实用方法。这个迷你机器人会抓起自己的一块方块放到你面前,然后宣布自己想要玩一局游戏。
Cozmo 最喜欢的初始游戏是一个名叫 Speed Tap 的颜色匹配比赛。你和 Cozmo 各自拿一块方块,当它们闪动的颜色匹配时,谁先点击自己的方块就是谁赢。(我发誓,这个游戏实际上比听起来好玩得多。)Cozmo 是一个不要脸的游戏者;在方块的颜色不匹配时,这个顽皮的小家伙试图假冒我点击我的方块,而当我获胜时,他竟然愤然离开了。他的小小抽动、升降梯一样的手臂的碰撞、旋转的身姿和机器人瓦力那种声音的呱呱叫……这些东西会让你更想用「他」而不是「它」来称呼这个小家伙。
Cozmo 的多次迭代设计,图中没有给出那个订书钉盒子上安装了一个网络摄像头的原始设计
为了赋予这些机器人发自内心的情绪和反应,Anki 创造一个被称为「情绪引擎(emotional engine)」的东西,这是一个影响机器人模仿感受的一系列算法的集合。Anki 团队在情感上进行了大量的研究,尤其关注了心理学家 Paul Ekman 写过的并在电影《头脑特工队》中描绘过的「核心情绪(Core Emotions)」。
任何给定的时间,Cozmo 的各种情绪互相竞争。各种情绪的结合让 Cozmo 的情绪表达非常有趣。
几乎和人一样,Cozmo 知道任何给定时间的许多潜在的情绪反应,这些情绪反应会相互竞争从 Cozmo 的处理器内部传递到该机器人的表达方式上。比如说它在会议室的桌子边缘往后退的时刻。Sofman 说:「他看见了一个边缘,这激发了他里面的一个反应。」他指着 Cozmo 所有可用状态的一个实时图谱。「他有点不大勇敢,有点不大冷静,有点不大快乐。」这是紧张情绪的一个非常复杂的模拟。当 Cozmo 看见一个方块时,这些同样的变量结合到一起会刺激出兴奋和信心的情绪。而如果它尝试拿起一块方块却失败了,它他会「感到」悲伤和忧虑。你可以在那个图谱中看到,你也可以在 Cozmo 中看到。
和创造情绪表达的配方一样重要的是确保该机器人不会表现得像……机器人。Cozmo 也许会两次都做出同样的反应,但不可预测性已被编入了它的代码之中。「孩子们可以很快意识到这是否是,比如说『A 必然导致 B』的情形,」工程师 Brad Neuman 说,「孩子们可是很聪明的。」
当然,Cozmo 要展示这些感受,首先一开始就需要拥有这些感受。为了做到这一点,Anki 招募到了现在被称为「Cozmo 的灵魂」的男人 Carlos Baena。Baena 在皮克斯公司工作了十年,为很多你可能听说过的动画角色赋予了生命,比如瓦力、尼莫、超能先生和巴斯光年。在他们第一次会面的过程中,Sofman 和 Tappeiner 向 Baena 展示了一段 3D 打印的原型机与 Anki 一位员工交互的手机视频。Baena 只能看到这位员工的脸。「他只是在不断和 Cozmo 交谈,你知道吗?」他说,「有时候甚至会骂他。它已经不只是一个可爱的小东西了。它带来了更深层次的感受。」他在 Cozmo 身上看到了一种联系的可能性,这种联系超过了你能从电影画面中感到的的一切。
Cozmo 的设计图纸,看起来就像是在设计一个动画角色
Baena 及其团队创造了一种无厘头的语言和一种活泼的声音,但仍然莫名其妙地是可以沟通的,就像 R2-D2 成功使用怪异的哔哔声说了很多内容一样。他们花了几个月时间研究卡通角色的眼睛,了解了它们可以用怎样的方式交流什么内容。他们为 Cozmo 写了一首乐曲,当它在周围运动时,这首曲子会从你的手机上播放出来。为了了解效果,Neuman 向我展示了没有动画和音乐的同样的 Cozmo 运动。结果它就像一个毫无生气的遥控车。然后眼睛回来了,声音开始播放,Cozmo 又回来了!
Anki 目前仍在处理一些漏洞,试图找到让人愉快的不可预测性与实际的软件漏洞之间的不同。但即使到今年秋天 Anki 向全世界推出 Cozmo 时,这项工作也不会完成——这完成不了。因为不管这个机器人的程序有多复杂,它都不能对自己进行真正的重新编程。即使谷歌的 AlphaGo 也不能做到这一点。至少现在是如此,人工智能工程师必须使用新的机器学习算法或新的数据重新训练系统,才能以新的方式操作机器人。该公司计划持续更新该机器人的软件和数据,让你疯狂的小机器人总是有新鲜事可做。
「我们希望它每天都有真正的新鲜事可做,」Andreessen 说,「我们想让它是可编程的。」他们希望其它公司也能创造出类似 Cozmo 的机器人,甚至知道 Cozmo 并且想与其交朋友的机器人。这种各种机器人交朋友的真实世界视频游戏可能就要主宰世界了,但也许不会。然后 Cozmo 将只能自己和自己玩,充满悲伤——至少看起来是这样。
不管怎样, Cozmo 的创造者 Anki 公司必将借这款开创性的面向消费者的机器人迎来腾飞。Anki 已经从 2010 年公司成立时的三位 CMU 博士成长到了现在的拥有 130 多位员工的企业。而就在 Anki 公布 Cozmo 这款新的玩具机器人的同一天,银行业巨头 J·P 摩根(J.P. Morgan)就领投了一轮对 Anki 公司的 5250 万美元的投资;风险资本公司 Andreessen Horowitz 和 Index Ventures 以及对冲基金 Two Sigma 也参与了这一轮投资。截止目前, Anki 公司已经总共获得了 1.825 亿美元的投资,但该公司并没公布自己的估值。