虚拟个人助理市场大赛拉开了序幕,早前,机器之心曾对比了
Siri、Google Now以及Cortana在功能上区别,未来,这些助理将会显著改变我们的生活。
本质上说,
虚拟个人助理实际上更像是一种操作系统,而非我们所认为的搜索引擎——它更加强大,有更多的功能。它将我们和各种形式的服务联接起来,它会构成一个平台,一方是海量的用户数据,一方是商家,就像在此之前的搜索和社交网络市场一样,虚拟个人助理市场表现出赢家通吃的现象,这也就不难理解为何各大公司争相加入这个战场。
在这篇文章中,我列出了6大技术要素,我相信这些要素会引起一些令人震惊的事,一些很快会因其服务于人类的能力而使我们颤栗的事。虚拟个人助理也很重要,因为我相信这是最可能造出像人一样的人工智能的途径。
什么是虚拟个人助理?
首先,让我们弄清楚这一术语一些让人困惑的地方。我在这将之定义为「虚拟个人助理」(Virtual Personal Assistant),但有很多不同的说法。脸书称之为「个人数字助理」(Personal Digital Assistant),维基百科认为它是「智能个人助理」(Intelligent Personal Assistant )。我不认同脸书的说法,因为PDAs也代表一种老一代的掌上电脑设备,像是苹果的牛顿和掌上个人数字助理。而「智能个人助理」似乎也不对,因为它还包括聪明的人工助理含义,尤其是在一个在线「众包」服务(如Upwork,该公司由Elance和oDesk融合重新注册商标成立)将我们和全世界各地的远程人工助理联系在一起的世界里。
所以,虚拟个人助理是什么呢?
虚拟个人助理,或者简写为VPA,是一种软件,该软件被设计成代替我们执行某些任务。它就像是其他服务的指导者,将这些服务以某种方式结合到一起,以便最优效地满足我们的需求。这些程序有时候也会被当做「代理商」,因为它们被授权代替我们做事,就像是人类代理商。除了协调服务,VPAs发展了它们对人类终端用户的深层理解,这也使我相信VPA是通向通用人工智能(Artificial General Intelligence)最有可能的途径,当然,那可能是很久以后的事了。
我们当中有很多已经开始和初步的虚拟个人助理一起工作了,当我们使用Google Now,苹果的Siri,亚马逊的Alexa,微软的Cortana,还有百度的度秘。而很快脸书也将会以它即将发布的产品「M」加入这一阵营。还有很多小公司也在发展VPA解决方法了(比如说,Hound的app非常好用),但我相信想要在VPA市场里成功,就要求有大规模的用户反馈,而这只有大型企业能够胜任。
六大技术要素
虚拟个人助理有两项基本工作:它们理解我们自身和我们周围环境以及它们运用这些理解的内容来代替我们操作其他软件处理事情。虚拟个人助理就像中介或者代理,并且它们最终将会十分了解我们。
我认为我们已经开始看到那些早期投资的有用的事情如今已初见成效,这不是什么魔法,人们将会在未来五年内体验到虚拟个人助理的奇妙。为了了解这其中的缘由,我们可以考虑以下六方面技术要素:
1)自然语言处理
面对用户的虚拟个人助理前端必须能够理解自然语言。这就是所谓的「自然语言处理(NLP)」,而且近几年机器学习在这一方面取得令人印象深刻的突破与进展。由于每年都数以百万计的终端用户对这些系统进行测试,因此苹果、谷歌、亚马逊、微软、IBM、百度和Facebook会不断提出解决方案来让这项功能(NLP)变得更好。
2)兴趣图谱
对「图谱」的一种解释是将其看作一个事物之间的关系图。在一份「兴趣图谱」中标记着我们感兴趣的事物之间的关系。一份兴趣图谱标出了我们的兴趣所在。
虚拟个人助理将会成为我们管理兴趣图谱的最初方式。今天,我们通过与成百上千的网站和服务交互来体现我们的兴趣,通过使用那些特定的服务,我们的兴趣散落在各个专有配置文件中。数字媒体中留下了我们接触过的每一件事情的「指纹」,特别是当我们使用服务时,用户界面设计者给了我们快捷而容易的展示我们兴趣的方式。我们的分布式在线资料具有很多种形式,包括我们在Facebook上分享喜好的模式,我们在google上的搜索方式以及我们在亚马逊上的购买方式。
当虚拟个人助理越来越多地协调我们与各种各样网站和服务间的交互时,我们的兴趣图谱就会在虚拟个人助理中越积越多。Searls博士的很有先见之明的「供应商管理关系」项目描述了对上述事情很重要的看法,即人们完全控制自身的数据。
3) 用户共鸣(又叫情商)
我们愚昧的坚信着我们是完全理性的人,但事实上我们的情感可以很强大的提炼出我们对世界的经验。通过情感上转存的 VPA 永远都无法像人类一样拥有情商。
如何准确的了解人类的情感是一个具有挑战的问题,目前有两个途径可以达到。第一个途径是通过类似于语言获得和词汇计数(LIWC)一样的工具进行文本分析,就像 Facebook曾经做过的一个试验,通过对 700,000 的Facebook的用户强制推送消极负面情绪的帖子,这是不太道德的「情绪感染」的试验。LIWC 只对大文本的内容有效(超过400个字),然而在大多数情况下我们和 VPA进行互动的时候很有可能限制了其适用性。
通过语音分析和利用视频进行面部表情分析来监测人们的感情,这是可能连接 VPA情商的途径。像 Addectiva, Emotient 和 NICE,这些是目前涉猎于这个领域的小公司,他们都重点关注在如何获取人们对广告的情感反应的一些呼叫中心的应用与解决方案。在这些公司当中, Affectiva 特别的有趣。它最早诞生于麻省理工大学的媒体实验室,一直致力于提供内置处理情感信号的手机解决方案。如果它们没有立马被主要的 VPA 玩家抢购的话,我将非常惊讶。
4)感官整合
人的感官可以让我们知晓我们的位置,感受环境光线,气压,湿度,温度以及一系列通过我们手机传输的其他感观数据。你可能会说我们的感官知觉从技术上来说已经在升级,虚拟个人助理不需要理解我们的语言,兴趣和感情;只要通过我们增强的感官流获取信息,它将帮助我们更好的感觉身边的世界正在发生什么,比如我们在午饭时间是否就在一个有趣的餐馆旁边?下一辆巴士是否准时到站?
情景计算通常用来描述未来不停增加的感官如何帮助我们控制世界。在某种重要意义上,通过感官整合,VPA 在我们现实和虚拟的世界扮演着重要的角色。
5)社交图谱
在过去的十年间, Facebook的突然兴起很大程度上反映了「社交图谱」越来越重要——这是一个将人们和不同事物联系起来的地图
在虚拟个人助理环境中,社交图谱类似于感官环境。相比物理环境,它将我们的社交环境绘制出来,对于人类这个社交物种来说,社交图谱是完全有必要的。我们将通过VPA所作的大部分事情,我们可以和其他人一起做,无论是搭个顺风车还是买杯咖啡,又或者是参加一个活动,这个社交图谱可以告诉我们VPA对我们来说很重要,并且通过扩展来引导我们与其他的 VPA进行协作。
6) 模式化集成
当VPA知道我们需要什么,接下来就需要将这些需求与第三方网页服务进行连接。VPA 懂得人类交流的程序是非常复杂的,但是我们不能认为在服务合作伙伴中存在相同级别的技术专家。为了保证沟通的清晰流畅,双方在形式上都要达成某种标准化语言。
在信息技术中,这种标准化语言被称为「本体论」。在软件发展中,这被称为结构或框架。它使第三方服务开发者与 VPA 之间发送和接收通信,占据着非常重要的角色。目前在这些模式中最为显著的是 Schema.org,它结合了 Google, Microsoft, Yahoo和 Yandex(目前占据着俄罗斯搜索引擎市场的60%份额)。Facebook已经选择开发自己的模式 — 称为 「 Open Graph」。
简单来说, Schema.org和Open Graph两个模式都给了你一些类似于VPA的短期功能的提示。Facebook重点关注在游戏,媒体,餐厅和健身,而 Schema.org则更多的是报道一些深度的有趣的新闻,创意性工作,医疗,组织性活动,定位,预定和产品介绍等。
魔法会成为新常态
我还记得第一次使用早期VPA产品时感受到的那种「哇喔」般的神奇感觉。当时,由于飞机延误,我正在旧金山机场候机。突然,我的手机收到了Google Now发过来的一条提醒,内容是最新的起飞时间——甚至在我看见机场内的信息屏显示出来之前。对我来说这就像魔法一般。
在未来几年内,随着越来越多的服务会与各类虚拟个人助理连接起来,我们都将会体验到这种令人挠头的魔法,但当然,这种感觉只会持续很小一会儿。很快地,我们将会习惯于它们,拥有自己的个人助理将会成为新常态。
我的一些疑虑
当想到VPA的未来的时候,我有这样一些疑虑。首先,我不知道我们是否可能以及如何扩展到「助理」这个比喻之外。我很清楚市场想把这个服务导向为「智能服务员」——也就是那些帮我们买东西的人。当然,VPA肯定需要比帮买东西更宽泛,但资本会集中在商品与服务中介上,所以软件开发也会专注在这上面。
然而,是否可能会有其他的模式或是比喻来描述这些服务可能的样子?「朋友」或是「咨询师」如何?它们能够帮我们更好地弄清楚自己的感受,以及我们如何融入周围的世界。亦或是「老师」如何?一直不断地帮助我们开发全部的潜能?或者「教练」、「导师」如何?想法并没有限制,我们也并不应该将自己限制在最易支持的已有商业模型上。
我还在考虑随着时间流逝,这些工具最终会演变成什么样子。事实上我认为VPA是当前最可能通向「类人智能」或被专家称作「通用人工智能」的路径。
在这个星球上有很多智能的表现形式。蝙蝠的智能根据蝙蝠的经验进行精细的调整,蚂蚁的智能则根据蚂蚁的经验进行调整,而人的智能也一样。我们将会创造多种形式的人工智能,强大但并不一定是类人的。而那些类人的人工智能对我们来说更智能,因为他们是根据人类经验进行调整的。
虚拟个人助理将主要通过它们对人类经验的中介能力来获得成功。它们将被设计为反映人类智能的东西。而不止于此,它们将在日夜与无数人的交互中进行学习。它们将会与我们每个人都完成一对一的训练阶段。通过这些训练,它们将学会如何像人一样。这也是为何我会认为虚拟个人助理会成为人工智能的第一种形式,并将被授予「通用人工智能」的头衔。
本文选自Vital,机器之心编译出品,参与成员:柒柒、孟婷、Wee.、小
諸