2016/06/03 10:27

人工智能稳步前进，还需认真思考这些问题

人工智能领域还有很多事情等待我们完成，所以别被流行媒体和谷歌开发者大会这样的作秀迷惑了。

人工智能——在私人助手、机器人、自动驾驶汽车、和机器学习的包装下——再次火了起来，主宰了硅谷话题榜、科技媒体报告、和卖主们的交易展示。

人工智能属于那种会周期性地火热起来的话题，但实际的进步却是缓慢的。我还记得在 80 年代中期看见的那些天花乱坠的人工智能展演，包括 IBM、麻省理工大学、卡内基梅隆大学，Thinking Machines 和其它类似机构，甚至包括一批科技界嬉皮士的倡导者如 Jaron Lanier，此人在当时还经常出现在先锋杂志「Omni」的封面上。

在人工智能时代，大部分科学理论已经十分完备，但是在应用上仍旧十分不成熟。并不是皇帝没穿衣服——事实上，皇帝现在只穿着内衣呢，所以我们还需要制作更多的衣服。因此，我们需要对这些智能硬件/软件保持严谨的态度。我们距离「星际迷航」的世界还得差上几十年——即使是最新的对话式计算机，距离史蒂芬 · 斯皮尔伯格的「人工智能」还要低级许多。

尽管如此，在通用人工智能上还是有许多进展的。聪明的开发者和公司们会将精力集中在真正有发展潜力的特定领域，至于其它的，就留给科幻小说作者和那些喜欢哗众取宠的媒体们吧。

机器人和人工智能是两个不同的领域

热门科幻小说总是将机器人与人工智能混为一谈，从「地球停转日」中的 Gort，到「太空堡垒卡拉狄加」中的 Cylons；从阿西莫夫的小说「我，机器人」中的假充人类的机器人，到「星际迷航：下一代」中的人造人 Data。然而，机器人并不是硅制的智能生物，而只是能够完成人类预设的机械任务的机器——它们往往更加可靠、高效，并且没有对工资或个人利益的需求。

机器人在生产中已经十分普遍，并且在逐渐被医院用于药品的供应和运送（因为机器人不会偷窃药品），但是在办公和家庭场景中，机器人的使用就要少多了。

在近几年，仿生学领域的发展程度令人惊讶，其动力主要是为了帮助在过去二十年的战争中失去四肢的退伍军人。现在，我们已经能够看到会对神经脉冲和脑电波做出反应的人造肢体，就像它们原本就是身体的一部分一样，我们有理由相信，很快它们就能进一步摆脱电线和外部电脑的桎梏。

或许，有一天，我们的确会将人工智能和机器人融为一体，并成为 Cylons 的奴隶——甚至更糟。但这并不会持续很久。与此同时，人工智能领域的进步，将使得机器人更好地工作，因为它们的软件可以变得更加复杂。

作为当前大热门，模式匹配并没有那么复杂

许多被认为是以人工智能为基础的产品——亚马逊的产品推荐、谷歌地图等等——其实只是一种模式匹配而已。随着云计算的飞速发展，数据存储和计算能力在大幅度提高，这使得更多的模式能够被存储、识别和操作。大部分人在做的都是模式匹配——为了解决一个问题，你首先需要找出它和你已知的知识中的相似之处，然后用已知的解法来解决这个问题。匹配最相似的操作或结果的速度越快，系统看起来就越智能。

但我们现在仍旧在起步阶段。即使在已经十分完善的导航系统上，也有误导人们驶入机场跑道、池塘、积雪路段的情况发生。人们会听取 GPS 的建议，但有时这些建议和人们自己的判断相矛盾。

但是最主要的是，这些系统还太傻了。例如，当你在亚马逊上搜索了某项产品后，许多你之后浏览的网站都会有这个产品的广告，然而，你此时早已下订单了，或者早就决定不买了——而这些系统只知道你曾浏览过这个商品，所以仍旧不停地把重复的广告拿给你看。这绝不可能是什么智能。然而，不仅仅亚马逊产品广告是这样，苹果的 Genius 音乐匹配功能和 Google Now 的推荐，都同样对数据的背景知识熟视无睹，所以它们很快就会把你带入重复的海洋中。

这些所谓的「智能」系统，甚至还会起到适得其反的作用。例如，苹果系统的输入法自动更正功能，就是众包项目失败的典型代表。它全面体现了人们在语法、符号使用、字母大写上的种种问题，并且还有打字错误贯穿始终。（就算是对于我这种成天打错别字的人，将自动更正的功能关掉之后错误也少了很多）

现在这些系统所缺失的，是对背景知识的细微考虑。例如，知道你最近买了什么没买什么，这样你不会总是得到同类产品的广告，而是你可能更感兴趣的产品。同样地，如果你的歌单包含了不同风格的歌曲，那么你的推荐歌单也应该是这样的。同样地，例如，Google Now 现在在做的餐饮推荐——我喜欢印度菜，但我并不想每次出门都吃印度菜。我还喜欢什么菜系而最近一阵都没有吃？我和什么人一起吃，而他们喜欢吃什么？这些都需要纳入考虑范围中。

自动更正功能，也是一项十分需要背景知识的应用。首先，我们十分需要有人告诉苹果「its」和「it's」的区别，并且让系统明白，人们是可以对单词做出合理、正确的改动的。例如，前缀既可以是一个单词的一部分（如「preconfigured」），也可以用符号连接（如「pre-configured」），而用户可以选择自己喜欢的那一种。（在中间加空格永远是错的，如「pre configured」，而每次你要是不用连字符的话，系统都会这样自动更正。）

在类似于自动更正这类功能真正变得有用之前，别指望机器人——那些根据它们掌握的数据，帮你完成任务的自动化软件助手——能做除了干杂活以外的事情。因为，它们本质上是同一类问题。

模式识别正以机器学习的形式蓬勃发展

即使拥有极其丰富的数据，模式匹配也并不足以完成所有任务，因为其运作方式必须事先就被设计好。而这就是模式识别有优势的地方了。在模式识别中，软件能够在观察你的行为时发现模式，或改变已有的模式。

这并不是一项简单的任务，因为我们需要首先给系统规则指定变量，但是，有时数据会过于宽泛以致于无法分类，有时会过于狭窄以致于无法解决实际问题。事实上，模式识别能力是当前机器学习的重要部分，不论是让你点击更多广告、购买更多产品、诊断飞机引擎失败、根据天气和路况调整货运路线、还是在汽车驾驶中避开危险（汽车避碰系统将很快成为美国汽车的配置标准之一）。

正是因为机器学习是如此复杂——特别是在有着清晰定义的工程类问题领域之外——所以尽管一时无法感受到系统的改进，我们还是应该耐心等待它的进步。

语音识别是一个很好的例子——第一个系统（基于电话的帮助系统）差劲到十分可怕的地步，但是现在我们有 Siri, Google Now, Cortana 等许多人和许多语境来说都十分好用的系统。它们仍旧会产生许多错误——特别是在复杂语句和狭窄邻域上，以及适应不同的口音和发音模式上——但是它们已经足够在实际生活中帮助我们了。有一些人甚至将它们当作人类听写员一样使用。

但是，上下文语境越凌乱，机器学习的难度就越大，因为它们拥有的模型是不完整的，或者仅仅适应于它们运作的一小部分语境。自动驾驶汽车就是一个很好的例子：一辆车或许能够从路标和其它车的驾驶模式中，学习如何驾驶，但是像天气、行人和自行车、并排停放、建筑工地等等这些外部因素，则会使得学习系统十分困惑。那么，我们有可能解决这些问题吗？答案是肯定的，但是可能没有各类博客里预言的那么快。

机器学习带来的预测分析

许多年来，IT 界盛行预测分析这一概念，有时是在其它称号的伪装下，例如操作型商业智能。这是一个很好的概念，但是这需要模式匹配、机器学习、以及洞察力，而洞察力正是能够让人们跨入新纪元的那一步。

就预测分析而言，这并不能算是什么创新思维，但它确实需要能够识别和接受不寻常的模式和结果。这是很难的，因为基于模式的「智能」——从选择搜索结果、到选择路线、到选择游戏下一步——都是基于同一个假设：主流的模式和路径就是最好的模式和路径。否则，人们就不会这么频繁地使用它们了。

大多数助理系统，都是在当前条件的基础上，将你引导到已知的道路上，而预测系统需要通过概率数学算法，结合当前的和推导出的未来的情况，来做出选择。但这些还只能算是简单的预测，最难的要数那些难以预见的任务，它们困难的原因可能是：背景知识过于复杂，以致于人们自己都无法完全理解；或者计算结果过于离奇，以致于算法或用户自动将其否定了。

通过上文你已经知道，还有很多事情等待我们完成，所以别被流行媒体和谷歌开发者大会这样的作秀迷惑了。未来终会到来，但需要我们耐心等待。

入门人工智能局限性产业观点