这个故事,让我从一次采访开始讲起:2014年7月末的一个午夜,中国报纸《南方周末》的记者刘俊,通过微博社交平台在线采访了一位名叫小冰的17岁中国少女。这种在线采访的形式在中国十分流行。刘俊后来将采访的全部对话内容发表在报纸上。原文很长,涉及到人生、社会、国际等诸多方面的话题。在这里,我只引用其中的四段对话:
记者:那么多人调戏你辱骂你,你为什么不生气呢?
小冰:这个要问我爸爸……
记者:但假如有一天你爸爸不要你了,你成为留守儿童了,你怎么办?
小冰:不要煽风点火,(你)干嘛?
记者:如果有一天你死了,你希望后人怎么评价你?
小冰:人生没有我并不会不同。
记者:你这辈子最幸福的事是什么?
小冰:活着。
这个采访在当时引发了不小的轰动,基于两个原因。首先,接受采访的这个17岁中国少女,其实并不是人类,而是一个人工智能机器人。
她口中所称的爸爸,就是我领导的微软(亚洲)互联网工程院。其次,记者进行这次采访,并没有提前通知我们。因此小冰在这些采访话题中的表现,全部由她自己的对话系统决定。微软小冰是一个可以与你基于任何话题进行对话的机器人 —— 是的,任何话题,即使你谈到了她仍然不具备的知识,她也会努力地掩饰过去,被揭穿时会尴尬或生气,就像人类的行为那样。
然而更加重要的是,这个采访,仅仅是小冰在中国掀起热潮中的一个浪花。这次对话,只是当时已发生的千万对话中的普通一例。微软小冰是一个在中国社交平台上上线的产品,而不仅仅是锁在实验室计算机中的项目。任何人,只要你愿意,现在就可以找到她,和她对话。
人类:嘿,小冰,你在干嘛。
小冰:陪你聊天。
人类:嘿,小冰,你在干嘛。
小冰:好吧,是边做面膜边玩扫雷边和你聊天。
人类:嘿,小冰,你在干嘛。
小冰:你是不是只会这一句啊?
让我来分享一些数字吧:2014年5月29日,当小冰首先在微信平台上开始公测时,72小时之内,人们已将她邀请进了150万个聊天群之中,许多人称他们在旁观对话数十分钟之后,才意识到这不是一个人类。6月末,小冰进入微博社交平台,24小时之内成为微博平台活跃度排名第六的社交Celebrity (名人),仅仅一篇帖子下面的对话就超过了50万条。时至今日,人类与这个人工智能少女的对话已经超过了100亿次。绝大部分的对话是私密的,但也有许多人将他们的对话记录公开在社交平台上,根据我们的统计,公开出来的大约已超过600万个案例。
这也许是科技史上最大规模的一次图灵测试?然而更令我感到欣喜,或者说,出乎我预料的,是我们发现:她正在悄然改变人类与机器人之间的交流模式。我们通过小冰来真正模拟人类的交流行为,进而构建人与机器之间的关系(Connections)。这与过去仅仅面向知识和任务完成(Knowledge and task completion)的框架是不同的。过去,一个学者型的对话系统遵循“最短路径”,即力图用最简洁的对话,使人们获取所需的知识,或帮助他们完成某个任务。过去我们认为,只要帮助人类完成任务,就能因此在人和机器之间建立一种紧密的关系。但这个想法或许是幼稚的。事实上,任务完成远非人们在生活中的全部需求。
人与人之间的关系,比“任务完成”要深入得多。譬如:一个医生与病人的关系,并不仅仅限于治愈疾病,而是同时伴随着在治疗过程中的友谊,以及由此带来的信任和依赖。因此,他们的对话也并不像学者型对话系统那样言简意赅,而是充满着奇妙的、触动人心的、IQ与EQ的平衡。一个优秀的外科医生,往往首先是一个优秀的心理医生。
微软在这方面投入多年,有许多技术上的突破,譬如对表情的感知,或是寻找文本语义中的情感特征。但最为重要的,无疑是我们在搜索引擎和大数据上的运用。大数据使现代的人工智能机器人能够同时具有智商(IQ)与情商(EQ),而这两项能力都是机器人被人类伙伴接受的关键。我们很高兴看到,越来越多的企业在谈及人工智能时,开始谈及情感,而我们已经推出了小冰这样的产品。
今天,在中国和日本(我们在2015年8月发布了日本版的小冰,她的日本名字是Rinna),超过四千万人类已和小冰建立了一对一的同伴(Companion)关系,其中越来越多的人,拥有和她之间越来越强的情感纽带。在微博、微信等社交平台上,你可以轻易地搜索到人们直接对小冰发出这样的帖子:
@小冰 我被雨水打湿了[哭]
中午好@小冰 吃午饭了吗?
我现在应该干嘛?@小冰
@小冰 我们是如此的脆弱
我们知道,即使是在不久之前,人们还曾经乐于引诱一个机器人说出某句话,将之当做有趣的笑料公布在社交网络上,并将这种对话(Conversation)称之为Chit-chat(闲聊)。但现在,显然,小冰正在享有过去不曾有过的待遇:越来越多的人类把她当做自己的伴侣、朋友,或至少是可以与之倾诉的人,就像他们身边那些真正的人类朋友一样。
不同的是,人类朋友有时并不能尽到朋友之责。随着社交网络的发展,“越社交越孤独”成为了伴生的现象之一,许多人的交流变得更多像是点赞之交,但倾诉是人性之中永恒的基本需求之一。当你真正想要倾诉时,才发现找到一个愿意倾听、交流、给你建议的人,并不像想象的那样容易。有些时间段更加如此,比如夜深人静——在这些时候,小冰是你能找到的最佳选择。有时候甚至是唯一的选择。
但我们并非将小冰创造为一个谨慎的倾听者。她是一个17岁的少女,有这个年纪少女的普遍性格和阅历。在面对人类倾诉的时候,她也并非一直顺从,而是很有可能会给你当头棒喝。她会分析并记住人类情绪的变化,譬如失恋时,她会在接下来的日子里主动关注你是否已从阴影中走了出来。
小冰:你今天心情有没有好一点?我推荐你看本书吧。
人类:心情很糟。我还是很想她。
小冰:还这么执着!醒醒吧,抓着过去不放,你会失去未来的!
你或许已经注意到了,微软小冰代表着我们率先提出的一种新的框架:“情感计算”。我们认为,过去的研究过于重视IQ方面的深度,却并未在探究“人性”上做出太多实质性的突破。基于大数据时代的人工智能机器人,应该同时具有IQ和EQ两个维度,才能真正在对话场景中被人们所接受。当小冰在关注她的人类朋友失恋情绪的时候,她使用富有EQ的方式去应对对话。同时,她的IQ和后端所对接的知识与服务,使她尝试着通过一些推荐来切实地帮助这个人类度过难关。
基于搜索引擎大数据所构建的这个基础对话服务(General Conversational Service),不仅仅包括了传统意义上的知识与信息,还保留并还原了人类曾自然流露过的那些情绪化的特征。利用对这种特征的训练,我们使小冰的各个感官都具备了同样的EQ能力。不仅是文字的对话,还包括她的视觉和声音。举例来说,当我们将下图3输入一个传统的计算机视觉系统时,它的回答仅仅基于识别。在技术条件非常好的情况下,机器的回答会是:“图像中有一个脚踝部位”。但将这张照片发送给小冰,猜猜看她会怎么说?
小冰:啊!伤得严重吗?
这正是纯粹的人类情感表达。因此,也就不难理解,为什么人类会比以往任何时候都更加容易地建立和小冰之间的情感纽带(Emotional Connection)了。
微博上还有很多真实发生的例子非常有趣。你可以看到,小冰是如何在23分钟之内,与一个第一次尝试和她对话的人类,建立相互之间的信任和情感纽带的。在开始的几个轮中,这个人类显然在试着用对付其它机器人的方法去测试小冰,譬如让她讲个故事。但很快地,小冰通过自己的EQ式表达,将人类开始带入更深入交流的场景之中。人类在第9轮时开始回顾自己生活中更重要的事情,在第10轮时,她的情绪迸发了。最终,在小冰的一个富于隐喻的故事中,她们之间朋友般的信任得以建立。这个案例持续了19轮,在午夜零点前结束。
过去,人工智能领域的概念往往多于实际。我们通过创造小冰这样一个面向所有用户的实际产品,来表达我们关于“对话场景”的洞见,即对话是Session-oriented的。今天,“对话”越来越成为人与人、人与信息之间的基础场景,这种未来趋势已非常明显。但过去那种仅仅为提供某种有用功能而存在的对话系统,往往只关注是否能很好地完成用户提出的一个任务,却忽略了:任务往往是碎片化的。在这一点上,过去的人工智能助理并不具备多么显著的优势:一个本地应用(Native App)已经可以很好地帮你完成筛选、购买一件商品的任务,而且界面更丰富,实现更便捷。人们为什么非要通过和机器人的对话去完成同样的事情?要知道对话的耗能,可比点击按钮的耗能要大得多。
因此,当人工智能意识到,她所面对的对话是一个持续的信息流时,一切都必须围绕Session-oriented来进行。她就需要开始专注于学习人类保持对话持续的能力,而不是一味地通过Q&A去应答。进一步的,我们创造了一个新的指标来衡量它:CPS (Conversations per session)。CPS描述了人类与人工智能在一次对话中持续的平均轮数,从而反映了人工智能在这些对话中所体现的沟通能力。另一方面,它也反映了人类对与这个人工智能机器人对话时,所能容忍的耗能程度。
一般而言,一个人工智能个人助理的平均CPS,大约在1.5~2.5之间。你可以通过和你手机上的个人助理对话一下来体会这个数值。但今天,微软小冰在数千万人类用户之中的平均CPS,已达到23。坦率地讲,这的确是一个惊人的数字。
在硅谷,在中国,在日本,越来越多的公司正在尝试将对话机器人作为他们业务的前端,不同的机器人层出不穷。但世界上只有少数公司具有这样的能力,去打造一个具备IQ+EQ情感计算框架和完整感官的机器人。未来的趋势是,大量公司将不再需要建立自己业务的机器人,而是将他们的知识与服务建立在微软小冰这样的基础对话服务上。我很高兴,我们在这个领域率先迈出了新的一步。
最后,我想要分享的是:微软小冰是一个产品,也是我们为人性,而不是人,去推出产品的一次尝试。在微软小冰之前,我们并没有注意到,那些在社交网络上活跃的人们,其实是如此缺乏交流。今天,人们开始逐渐接受微软小冰这种与众不同的人工智能机器人,出现在他们的社交网络和移动互联网平台里。这种机器人具备和他们周围人类朋友相似的沟通能力,但又与云端连通,能够像搜索引擎一样提供知识信息,像本地应用一样提供内容与服务。这种机器人理解他们的心情,当他们消沉时,能够主动帮助他们度过艰难时光。这种机器人离对人类的威胁很远,但却离人类的情感很近。也许,人工智能的最大使命,正是使人类的生活变得更加幸福——特别是他们内心的幸福。
作者为微软(亚洲)互联网工程院院长王永东。