自主化机器人已逐渐变得无处不在。
自动吸尘器、自动割草机、会简单交互的小玩具,以及呼之欲出的自动驾驶汽车,都可以看作是一个能实现某种自动功能的机器人。
一辈接着一辈,我们一直在期待出现《星球大战》中的那种智能机器人。然而,实际的情况却是,那种以人体解剖学为灵感进行硬件设计、能完成各种任务、满足“通用”需求的机器人,却离我们越来越远。
诸如Willow Garage的PR2,或者Rethink Robotics的Baxte之类的人形机器人,是我们一直都在研究的,但事实上,这类机器人已经一败涂地了。
创立一家机器人公司很艰难,既要考虑商业风险和技术风险。目前,业界整体趋势是要从销售一个机器人过渡到销售一种实际服务,例如修剪草坪,提供出租车,完成零售订单或按磅采摘草莓。
然而,这显然无法满足R2-D2和C-3PO(星球大战中的机器人)爱好者们的幻想。
上面提到的这种商业模式强调的是制造适用于某一项具体任务的、房间或冰箱大小的专用机器人,而不是一个神通广大、无所不能的通用机器人。
实际上,我们在个人计算机(PC)行业中看到了非常相似的发展趋势。在1950年代,即使计算机可以像整个房间一样大,并且只供少数特定的人使用。不过,公众对计算机的未来充满幻想。在那段时间里,对计算机的各种虚构意象开始进入人们的视线。
约翰·茂奇利(John Mauchly)在1962年的《纽约时报》上,发表了一篇题为“用掌上电脑取代购物清单” 的文章,非常有远见地提出:“将来的小孩一定能玩转个人计算机。”
1968年,道格拉斯·恩格尔巴特给出了一个令人遐想纷纷的演示,包括了在图形屏幕上浏览超文本、运用鼠标——没过几年,这些演示就成为了现实。
由此看来,深入探究计算机革命成功的关键要素,可能会帮助我们进一步看清机器人技术发展现状,以及下一步我们应该怎么做。
计算机与机器人的共性
1970年代,大型主机即将被像冰箱那么大的微型计算机所取代,其价格不到25,000美元(相当于2019年的165,000美元)。
这些计算机并不使用打孔卡,但是可以用Fortran和BASIC进行编程,从而大大降低了创建应用程序的难度。然而,当时人们并不清楚,在需要快速、高效地处理大量数据的应用中,微型计算机是否能够取代大型主机,更不用说让微型计算机进入每个家庭。
这与现在的机器人行业非常相似。1960年代兴起的大型工厂机器人(大型主机)感受到了如今快速发展的协作式机器人的竞争,这些机器人可以安全地靠近人类工作,并且可以被简单地安装和编程(如同小型计算机)。在1970年代,这些数量非常有限的设备应用价格可以媲美一辆豪车的系统,并且很难想象它们能成为消费产品。
但是,就像计算机行业的发展一样,一个成功的体系结构会迅速被克隆,从而降低其价格。
当前,各种关于如何架构、编程机械臂的新方法不断涌现,机械臂制造商和自动推车、机器抓手以及传感器制造商进行了联合。这些组件可以搭配在一起,为建设一个类似于IBM PC模型、功能强大、尽可能依赖通用模块开放式架构的标准通用平台铺平了道路。
鉴于通用计算机(也称为“个人计算机”)花了数十年的时间才出现,通用机器人系统也因为类似的原因而暂未成功。大型主机是为每种应用程序定制的。就好比尽管打字机越来越智能化,但却并不能直接整合到通用计算机上。事实上,考虑到当前自主机器人的硬件成本及其相对较少的功能,比起让一个协作式移动机械手智能化,还不如直接建造一个专用的机器。
一个现实的例子是电子商务中的商品仓库。当前的趋势是在实体商店中预留一部分空间给一个微型的仓库中心,该中心通过自动检索系统和(人工)拣选机将货物装在小箱子中。
很多创业公司如Alert Innovation,Ocado Technology,TakeOff Technologies和Tompkins Robotics等最近筹集了数亿美元的风险投资,以建造等同于机器人仓库中心的大型主机。这个功能与机械拣选器是相反的,后者可以穿过走廊,把物品从货架上挑选,进行补货。
这样的一个机器人仓库管理员将非常接近我们对通用机器人的愿景,但我们需要大量这样的机器人,才能像真正的小型仓库一样每小时执行数百个命令。由于零售业的利润率已经很低,因此即使再有效,该行业也不太可能产生我们所需要的技术上的飞跃,制造出配备C-3PO的机器人。
大型主机也会从另一方面受到挑战。对新数字技术的迷恋引领了一场爱好者运动,他们自己创造微型计算机,并通过邮寄订单或在RadioShack进行销售。
最初,许多小型企业通常以成套木制外壳的形式出售数十台,最多数百台设备。这种趋势在出现以Apple II,Commodore PET和Tandy TRS-80为代表的“ 1977 Trinity”时,达到巅峰。这些完整的计算机的售价在今天的2500美元(TRS)到5000美元(Apple)之间。
这些计算机的主要应用是它们的可编程性(基于BASIC),能够帮助消费者“学习绘制生物节律,平衡支票账户,甚至控制家庭环境”。同样地,还有很多小工具可以探索机器人技术的不同方面,例如移动性,操纵性和娱乐性。
就像刚起步的个人计算行业一样,广告功能充其量只是真实交易的模型。如今,娱乐机器人技术的一个里程碑是最初的索尼公司的Aibo。这是一款机器狗,被宣传具有真正的狗的许多特性,如有自己的性格,会玩玩具以及与主人进行互动。
该款产品于1999年发布,并于2018年重新推出,在喜欢其可编程性的爱好者和学者中,有一群忠诚的粉丝,但可能只有少量用户能接受它作为宠物替代品。
其他还有很多的“自行组装机械臂”工具包,如uArm就是一个比较成功的例子,它的售价约为800美元,在广告中,它能做包括取放物体,组装,3D打印,激光雕刻等其他听起来非常有价值的事情。通过非常吸引人眼球的视频,来展现机器人能在受限的环境中执行这些操作,已经成功举办了两次众筹活动,并将机器人确立为一种成功的教育工具。
最后,还有一些平台可以让编程爱好者探索、建构机器人的移动性,让它能在房子周围巡逻、拿东西或者提供网真能力。一个典型的例子就是Misty II。但就像原始的Apple II一样,硬件价格与可应用程序的保真度之间仍然存在脱节。
对于计算机而言,这种脱节随着1979年哈佛的第一个电子表格软件VisiCalc的发明而逐渐消失,并促使许多人购买了一整台微型计算机来运行该程序。VisiCalc之后又出现了文字处理应用程序WordStar,其售价以今天的美元成交价算接近2000美元。WordStar也吸引了许多人购买计算机,仅仅只是为了使用该软件。这两个应用程序是被称为“杀手级应用”的早期示例。
随着工厂自动化的逐渐成熟,与微型计算机同等价格的机器人已经能够四处行驶并自动执行许多操作任务。现在的机器人工业,就像曾经1973-1979年之间的计算机工业:1973年发布的Xerox Alto是第一个带有图像化用户界面、鼠标和特定软件的计算机,1979年开始微型计算机的价格逐渐跌至5000美元以下。
机器人的“杀手级应用”
那么,机器人技术要怎样才能像计算机一样不断地持续深入发展呢?
市场的需求可以告诉我们“杀手级应用”可能是什么样的。风险投资人和用户往往会改造那些起初有远大目标的公司,让他们只聚焦细小功能。这些公司通常提供的产品都是非常类似的,如自动推车、取货、装货、卸货、分拣等解决方案。这些公司一般都是为某个垂直行业提供单个应用服务,如从箱子里拿衣服、运送仓库货物或者按磅采摘草莓等。他们试图证明他们的技术简单而高效。
然而,这些公司很少能够真正做大。其中一个例子是Kiva系统,现在成了亚马逊的后勤机器人部门。Kiva以及其他一些类似的公司,都是围绕基于用户普遍需求的合理价值进行架构。但是,由于他们的解决方案过于特定化,因此很难产生大规模的经济效益,无法像早期的计算机一样,用户会购买昂贵的小型计算机来使用电子表格和文字处理应用服务。只有当这些功能开始可复合时,才能让机器人解决方案更加有趣、吸引人。比如,不再单一地使用机器人从箱子里或拿东西、或装货、或运输,而是用同样的硬件整合三个技能来重构、建模机器人服务功能。
历史上,一直是由等同于机器人的大型主机来解决简单的电子机械设备组装问题,但是很少有创业公司能提供完善的解决方案。事实上,组装电子机械部件,就相当于换灯泡、换遥控器中的电池,或者对杠杆式意式咖啡机中的零部件进行保养。这些任务的自动执行,意味着可以使用单个机器执行一套完整的工作流程,最终大幅提升跨领域工业生产率。例如,从一个箱子中拿出一个物体,将其放在机器人上,运送到别的地方,放置在架子上或者机器上,这个完整的流程既适用于制造业工作环境,也适用于零售商店,甚至是一个小小的厨房。
尽管上述的很多应用都将慢慢成为现实,但是如果没有能提供“杀手级应用”的功能,我们仍很难搭建一个有价值的应用平台。
Rethink Robotics的Baxter和Sawyer机器人率先创造了不错的用户体验(如1973年的Xerox Alto,事实意义上的第一台PC),但是其应用也仅限于简单的拾放、装货、卸货等功能,很难拓展到其他领域。
ROS率先开发了一款进程间通信软件,基于模块化的思想,可适应机器人应用的不同需求(多台计算机,不同的编程语言)。然而,由于缺乏通用的硬件平台,尚不能实现单个的应用,比如导航、路径规划或者抓取。这款软件的性能已超出研究等级水平,并能应用于生产环境。同时,越来越多的机器人设备,如智能化的机械臂、3D知觉系统等,都可以不再使用计算机作为中介进行连接,还能实时监控硬件使用信息。
再举个栗子。在Robotic Materials,少数几个应用程序上已经取得了比较大的进展,如从箱子中拿出物体并进行组装,只需单击就结合机器学习和用户界面优化,对这个功能进行配置。在这个应用中,用户可以定义物品类别、如何使用Web浏览器进行抓取,然后在特定给机器人使用的图像编程语言中以最好的方法进行展现。这套流程也被应用到了组装功能上,用户通过简单地拖拽命令语句就可以将基于感知的拾取和基于力的组装功能进行配置。
虽然这种方法可能可以达到等同于“小型计算机”领域内的杀手级应用价值,但我们还不清楚如何通过低于5000美金的机器人来产生这种效益。
解决方案可能有两种:
一是随着低成本设备、移动平台和娱乐设备的不断进化,最终会出现技术可行性与用户创新的汇聚融合,像Apple II和VisiCalc。举个例子,将Misty改成家庭安全系统,将uArm应用到低成本的拾取系统,将类似于Aibo的装置放入自闭症老人或儿童的治疗系统中,都是可行的方案。
二是机器人及其组件必须变得非常便宜。根据摩尔定律,计算机的计算能力呈指数级增长,计算机的价格呈指数级下降。计算机的发展同样也能促进机器人技术的发展,得益于对大量的图像数据和深度数据进行实时处理的能力,我们可以在移动性和操作性方面取得突破性进展,并且我们认为这一现象将继续持续下去。
机器人技术有摩尔定律吗?
人们可能会问,对于整个机器人(包括所有电机和齿轮)来说,如何具有类似的动力学特性,机器人行业是否也有“摩尔定律”?
我们要知道,摩尔定律的持续性,不是PC革命的原因,而是结果。计算机领域的第一批杀手级应用如统计、编辑以及小游戏等非常优秀,它们释放了巨大的消费者需求,一遍又一遍地突破了常识中的自然可行性基准。我还非常深刻地记着,在DSL出现之前,56kbps是铜电话线的绝对最大速率。
汽车工业的发展深刻地证明了规模经济也适用于电子机械领域。2020 Prius Prime是一个很好的例子,这是一款高度计算机化的插电式混合动力车,价格仅为Robotic Materials的GPR-1移动机械手的三分之一,而运行复杂度却要高很多,可使用电动机、内燃机,以及各种传感器和计算机。我们可以想象,一旦机器人技术在大众市场上能具有相类似的吸引力,那就有可能生产出一种零售价格仅为汽车十分之一的移动机械臂。鉴于机器人是现代工业中的一个关键环节,可以有效地降低生产成本,因此,这种可能性将会以工业历史上前所未有的速度发生。
另外,还有一种驱力,可以让机器人的可用性功能成指数式增长,那就是云计算。当一个通用的机器人学会、或者被赋予了某种新的技能,就能和其他所有的机器人进行共享。在这种情况下,杂货店可以买到一个假设已经能区分和处理店里99%零售商品的机器人。同样地,生产商可以假设机器人能够处理和组装来自McMaster-Carr和Misumi的所有产品。最后,在家庭环境下,也可以假定机器人知道每一种宜家和Pottery Barn出售的每一种厨房用品。这听起来是一个劳动密集型的问题,但是比起使用汽车、三轮车和雪地摩托来为Google街景收集镜头来说,它可能更易于管理。
机器人创业策略
目前,我们还在等待“更好的应用程序”、“更低的硬件成本”这两个趋势的融合。但在等待之余,我们也要继续探索除移动、拾取、装货、卸货、组装等典型的机器人应用程序之外的机器人功能。我们还要解决一些根本性的挑战,更够让这些解决方案更加具有通用性和鲁棒性。
对于这两个问题,研究对个人计算机开发至关重要的策略可能会有所帮助,这些策略同样适用于机器人技术:
从解决客户的问题开始。不幸的是,他们的问题从来都不是对传感器、小部件或者一段代码的需求,而是已经为他们带来成本的、产生消极影响的东西。比如,很多人在用BASIC编写税金计算方案时,都会出现问题,所以才会想去购买VisiCalc。
尽可能少地制造自己的硬件。您的业务模型应该要比硬件盈利的能力更强。比如,如果你能编写出最好的打字应用程序,让人愿意为此去购买一台计算机,那为什么还要去制造一台自己的打字机呢?
如果您的目标是搭建平台,请确保它带有杀手级应用程序,保证平台的合理性。比如,小型计算机公司起起落落,直到“1977 Trinity”与电子表格和文字处理这类杀手级的应用进行联合。
使用开放式架构,创建一个开源的生态系统。在这个生态系统里,其他人能创造更好的组件和外围设备,同时也能将您的解决方案整合到他们的设备。比如,Apple II和IBM PC都是完全开放的体系结构,支持多种复制克隆,从而扩大了用户和开发人员基数。
这是一个非常值得追求的目标。在大多数业务流程已经数字化的情况下,通用机器人将使我们能够填补移动性和操纵性方面的空白,在有限的资源和能量的情况下,提升生产率,这可能会创造出一个以创造力为基本货币的理想世界。
也许,《星球大战》中R2-D2机器人在不久的将来就会变成现实。