Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

人工智能稳步前进,还需认真思考这些问题

人工智能领域还有很多事情等待我们完成,所以别被流行媒体和谷歌开发者大会这样的作秀迷惑了。


人工智能——在私人助手、机器人、自动驾驶汽车、和机器学习的包装下——再次火了起来,主宰了硅谷话题榜、科技媒体报告、和卖主们的交易展示。


人工智能属于那种会周期性地火热起来的话题,但实际的进步却是缓慢的。我还记得在 80 年代中期看见的那些天花乱坠的人工智能展演,包括 IBM、麻省理工大学、卡内基梅隆大学,Thinking Machines 和其它类似机构,甚至包括一批科技界嬉皮士的倡导者如 Jaron Lanier,此人在当时还经常出现在先锋杂志「Omni」的封面上。


在人工智能时代,大部分科学理论已经十分完备,但是在应用上仍旧十分不成熟。并不是皇帝没穿衣服——事实上,皇帝现在只穿着内衣呢,所以我们还需要制作更多的衣服。因此,我们需要对这些智能硬件/软件保持严谨的态度。我们距离「星际迷航」的世界还得差上几十年——即使是最新的对话式计算机,距离史蒂芬 · 斯皮尔伯格的「人工智能」还要低级许多。


尽管如此,在通用人工智能上还是有许多进展的。聪明的开发者和公司们会将精力集中在真正有发展潜力的特定领域,至于其它的,就留给科幻小说作者和那些喜欢哗众取宠的媒体们吧。


机器人和人工智能是两个不同的领域


热门科幻小说总是将机器人与人工智能混为一谈,从「地球停转日」中的 Gort,到「太空堡垒卡拉狄加」中的 Cylons;从阿西莫夫的小说「我,机器人」中的假充人类的机器人,到「星际迷航:下一代」中的人造人 Data。然而,机器人并不是硅制的智能生物,而只是能够完成人类预设的机械任务的机器——它们往往更加可靠、高效,并且没有对工资或个人利益的需求。


机器人在生产中已经十分普遍,并且在逐渐被医院用于药品的供应和运送(因为机器人不会偷窃药品),但是在办公和家庭场景中,机器人的使用就要少多了。


在近几年,仿生学领域的发展程度令人惊讶,其动力主要是为了帮助在过去二十年的战争中失去四肢的退伍军人。现在,我们已经能够看到会对神经脉冲和脑电波做出反应的人造肢体,就像它们原本就是身体的一部分一样,我们有理由相信,很快它们就能进一步摆脱电线和外部电脑的桎梏。


或许,有一天,我们的确会将人工智能和机器人融为一体,并成为 Cylons 的奴隶——甚至更糟。但这并不会持续很久。与此同时,人工智能领域的进步,将使得机器人更好地工作,因为它们的软件可以变得更加复杂。


作为当前大热门,模式匹配并没有那么复杂


许多被认为是以人工智能为基础的产品——亚马逊的产品推荐、谷歌地图等等——其实只是一种模式匹配而已。随着云计算的飞速发展,数据存储和计算能力在大幅度提高,这使得更多的模式能够被存储、识别和操作。大部分人在做的都是模式匹配——为了解决一个问题,你首先需要找出它和你已知的知识中的相似之处,然后用已知的解法来解决这个问题。匹配最相似的操作或结果的速度越快,系统看起来就越智能。


但我们现在仍旧在起步阶段。即使在已经十分完善的导航系统上,也有误导人们驶入机场跑道、池塘、积雪路段的情况发生。人们会听取 GPS 的建议,但有时这些建议和人们自己的判断相矛盾。


但是最主要的是,这些系统还太傻了。例如,当你在亚马逊上搜索了某项产品后,许多你之后浏览的网站都会有这个产品的广告,然而,你此时早已下订单了,或者早就决定不买了——而这些系统只知道你曾浏览过这个商品,所以仍旧不停地把重复的广告拿给你看。这绝不可能是什么智能。然而,不仅仅亚马逊产品广告是这样,苹果的 Genius 音乐匹配功能和 Google Now 的推荐,都同样对数据的背景知识熟视无睹,所以它们很快就会把你带入重复的海洋中。


这些所谓的「智能」系统,甚至还会起到适得其反的作用。例如,苹果系统的输入法自动更正功能,就是众包项目失败的典型代表。它全面体现了人们在语法、符号使用、字母大写上的种种问题,并且还有打字错误贯穿始终。(就算是对于我这种成天打错别字的人,将自动更正的功能关掉之后错误也少了很多)


现在这些系统所缺失的,是对背景知识的细微考虑。例如,知道你最近买了什么没买什么,这样你不会总是得到同类产品的广告,而是你可能更感兴趣的产品。同样地,如果你的歌单包含了不同风格的歌曲,那么你的推荐歌单也应该是这样的。同样地,例如,Google Now 现在在做的餐饮推荐——我喜欢印度菜,但我并不想每次出门都吃印度菜。我还喜欢什么菜系而最近一阵都没有吃?我和什么人一起吃,而他们喜欢吃什么?这些都需要纳入考虑范围中。


自动更正功能,也是一项十分需要背景知识的应用。首先,我们十分需要有人告诉苹果「its」和「it's」的区别,并且让系统明白,人们是可以对单词做出合理、正确的改动的。例如,前缀既可以是一个单词的一部分(如「preconfigured」),也可以用符号连接(如「pre-configured」),而用户可以选择自己喜欢的那一种。(在中间加空格永远是错的,如「pre configured」,而每次你要是不用连字符的话,系统都会这样自动更正。)


在类似于自动更正这类功能真正变得有用之前,别指望机器人——那些根据它们掌握的数据,帮你完成任务的自动化软件助手——能做除了干杂活以外的事情。因为,它们本质上是同一类问题。


模式识别正以机器学习的形式蓬勃发展


即使拥有极其丰富的数据,模式匹配也并不足以完成所有任务,因为其运作方式必须事先就被设计好。而这就是模式识别有优势的地方了。在模式识别中,软件能够在观察你的行为时发现模式,或改变已有的模式。


这并不是一项简单的任务,因为我们需要首先给系统规则指定变量,但是,有时数据会过于宽泛以致于无法分类,有时会过于狭窄以致于无法解决实际问题。事实上,模式识别能力是当前机器学习的重要部分,不论是让你点击更多广告、购买更多产品、诊断飞机引擎失败、根据天气和路况调整货运路线、还是在汽车驾驶中避开危险(汽车避碰系统将很快成为美国汽车的配置标准之一)。


正是因为机器学习是如此复杂——特别是在有着清晰定义的工程类问题领域之外——所以尽管一时无法感受到系统的改进,我们还是应该耐心等待它的进步。


语音识别是一个很好的例子——第一个系统(基于电话的帮助系统)差劲到十分可怕的地步,但是现在我们有 Siri, Google Now, Cortana 等许多人和许多语境来说都十分好用的系统。它们仍旧会产生许多错误——特别是在复杂语句和狭窄邻域上,以及适应不同的口音和发音模式上——但是它们已经足够在实际生活中帮助我们了。有一些人甚至将它们当作人类听写员一样使用。


但是,上下文语境越凌乱,机器学习的难度就越大,因为它们拥有的模型是不完整的,或者仅仅适应于它们运作的一小部分语境。自动驾驶汽车就是一个很好的例子:一辆车或许能够从路标和其它车的驾驶模式中,学习如何驾驶,但是像天气、行人和自行车、并排停放、建筑工地等等这些外部因素,则会使得学习系统十分困惑。那么,我们有可能解决这些问题吗?答案是肯定的,但是可能没有各类博客里预言的那么快。


机器学习带来的预测分析


许多年来,IT 界盛行预测分析这一概念,有时是在其它称号的伪装下,例如操作型商业智能。这是一个很好的概念,但是这需要模式匹配、机器学习、以及洞察力,而洞察力正是能够让人们跨入新纪元的那一步。


就预测分析而言,这并不能算是什么创新思维,但它确实需要能够识别和接受不寻常的模式和结果。这是很难的,因为基于模式的「智能」——从选择搜索结果、到选择路线、到选择游戏下一步——都是基于同一个假设:主流的模式和路径就是最好的模式和路径。否则,人们就不会这么频繁地使用它们了。


大多数助理系统,都是在当前条件的基础上,将你引导到已知的道路上,而预测系统需要通过概率数学算法,结合当前的和推导出的未来的情况,来做出选择。但这些还只能算是简单的预测,最难的要数那些难以预见的任务,它们困难的原因可能是:背景知识过于复杂,以致于人们自己都无法完全理解;或者计算结果过于离奇,以致于算法或用户自动将其否定了。


通过上文你已经知道,还有很多事情等待我们完成,所以别被流行媒体和谷歌开发者大会这样的作秀迷惑了。未来终会到来,但需要我们耐心等待。

入门人工智能局限性产业观点
暂无评论
暂无评论~