Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

扎克伯格展示个人助理Jarvis:又一个走出电影银幕的科幻作品

每当新工程师加入 Facebook——无论他/她刚刚离开大学还是已经身经百战——所有人都需要在 Bootcamp 度过六周时间。这是一个入职培养计划,旨在帮助新员工了解公司庞大的代码库,然他们能够尽快使用编程工具不断进行新的开发。

马克·扎克伯格是 Facebook 的第一位工程师,在公司成立早期贡献了数量庞大的代码。但是这位现年 32 岁的创始人和 CEO 从来没有参加过 Bootcamp 计划,该计划是他在哈佛大学的宿舍创办公司两年以后于 2006 年推出的。

去年 1 月,扎克伯格曾经宣布,他计划建立一个人工智能系统,通过 Facebook 工具操纵所有智能家居,这是扎克伯格每年为自己制定的最大挑战中最新的一条。这需要在最先机的人工智能技术之上不断探索,虽然 Facebook 已经在人工智能领域具有强大实力,但该项目仍然迫使他重新整合了公司内的系统和架构,而这些努力让这位年轻的 CEO 重新与公司中的数千名工程师紧紧联系在一起。

但是作为 Facebook 的首席执行官,他再也无法花六个星期全身心地投入到员工再教育活动中去了。「我之前从未经历过一次正式的 Bootcamp,」扎克伯格上周在他位于 Palo Alto 有着 113 年历史的木质别墅客厅里告诉我。我受邀观摩他的 Jarvis 演示,这是他今年最大挑战第一次被公之于众。「当我在课上向大家提问时,你可以想象他们的反应是有多快。」

3066478-inline-i-1-zuck-says-goodnight.gif

马克·扎克伯格命令 Jarvis——他的人工智能助理关灯

扎克伯格非常喜欢工程学「具有确定性」的特质——它让工程师能够安心构建完全符合自己期望的东西。对于他所期待的一切而言,他正领导着一家有着一万五千名员工和数以十亿计用户的科技公司,这些用户横跨 Messenger、WhatsApp、Instagram 和 Facebook,确定性是一件奢侈的事物。

这也就是为什么扎克伯格喜欢在为数不多的业余时间里捣鼓一些新奇的小项目,这也就是为什么他在 2012 年的个人挑战内容是每天写一段代码。他多年来一直在参与多个公司的黑客挑战赛,这是他的修行方式,作为练习,他曾编写过一个系统,用于配组 Facebook 的组织图和内部社交图,以查看公司内部的哪些团体的社交关系最为密切。

「通常来说,写代码去做一件事很像我当年学中文的感觉(那是我 2010 年的年度挑战)。我感觉整个大脑都被激活了。」扎克伯格对我说。

Facebook 的工程师文化要求员工在发现问题时,必须停下目前的工作立即寻找解决方案。这个设定对于全球飞奔的 CEO 而言显得有些不合适。「我要么必须从会议中起身,要么只能去找别人来帮我解决代码上的问题,不管哪种方式,都太糟糕了,」扎克伯格说道。所以很长一段时间里,他都没有放弃在任何时候写代码的习惯。

在过去的一年中,扎克伯格花费了 100-150 小时用于他的家庭助理项目。他把这个项目命名为 Jarvis——电影《钢铁侠》中托尼·史塔克的人工智能助理,在电影中,它有点像是一个自制的,非常个人化的亚马逊 Alexa。现在,扎克伯格的 Jarvis 已经可以用来帮助和他的妻子 Priscilla Chen 使用自定义 iPhone 应用程序,或唤醒 Facebook Messenger 机器人开灯关灯,根据个人喜好播放音乐,为来访的朋友开门,烤面包,甚至唤醒他们的一岁女儿 Max 准备上中文课。

闲暇时间的体验

如果你有幸造访马克·扎克伯格的别墅,你会体验到硅谷最棒的社区中 1600 平米的宁静。Jarvis 认出了你,自动向主人提醒你的到来。但和电影中情况不同的是——当你穿过一扇木门,沿着两旁种满柑橘和枫树的小道探寻——扎克伯格会亲自出来迎接你。

还好,这不是特别奇怪,他有着棕色卷发,穿着灰色 T 恤和牛仔裤,这个形象曾出现在无数照片和视频中。需要确定的一点是这不是什么全息影像正在引你进屋。

最近几周对于扎克伯格来说格外忙碌,他需要应对三个不同的争议:Facebook 的假新闻是否影响了最近一次美国总统选举;考虑投资者(也是董事会董事)Marc Andressen 在出售 Facebook 股票以后在公司管理层中的地位;以及 Facebook 广告推送的各种错误问题。

相比之下,Jarvis 是一个轻松的话题。我们在客厅的深绿色沙发上坐着,一只匈牙利牧羊犬就在身边,扎克伯格看起来非常放松。他开始讲述过去一年里开发 Jarvis 的点点滴滴。

在今年 1 月份,扎克伯格宣布了 Jarvis 计划,他曾表示,自己将用一年时间构建一个智能系统,控制家中所有的电子设备,包括音乐播放器,灯和空调。他同时希望 Jarvis 可以通过面部识别到访的好友,为他们自动打开房门,同时监控小女儿 Max 的一举一动。扎克伯格希望这个系统可以「通过 VR 影像中的可视化数据帮助我构建更加有效地服务,让 Facebook 运行得更加高效。」

今年 12 月,他已经实现了所有这一切。然而,当他亲自向我展示这个系统时,我得知它有时还是有点小毛病。

扎克伯格开始演示作为系统前端构建的 Messenger bot,他用 iPhone 完成了简单的命令,关闭和打开灯。

他通过自定义的 iOS app接入系统来响应语音命令,不过目前看来,系统反馈不是很好。

他说:「这是我前所未有的最失败的作品。」

他说:「给我们来点音乐」,几秒钟后,David Guetta 的「Would I Lie to You」舒缓的乐声出现在客厅的扬声器中。他说了两次「音调大」,系统真的就调大音量了。

扎克伯格最骄傲 Jarvis 功能是它能够学习他和 Priscilla 的音乐品味,它能学习 Priscilla 与扎克伯格不同的音乐偏好。同时他设计的系统还能识别一些特定风格的音乐,如轻音乐或某个艺术家风格的音乐。

扎克伯格告诉 Jarvis,「放些 Red Hot Chili Peppers 风格的歌曲」,然后它就播放了 Nirvana 的 Smells Like Teen Spirit。

扎克伯格也希望 Jarvis 能够理解语句中细微的差异。他说:「当你在想音乐时,如果你告诉它放点什么,这些东西可以是一首歌、一组歌曲、一个艺术家或 一张专辑。」

inline-i-2-zuck-sits-and-demo-jarvis.jpg

Jarvis 在播放音乐时可以用语音提出指令他发现最具挑战性的任务是让 Jarvis 理解内容相近的短语。Adele 就提供了这样一个案例,如果说播放「Someone Like You」,代表播放特定的歌曲,那么对它说「play someone like Adele」就代表着需要一些 Adele 类型歌手的音乐。如果说播放「some Adele」,就代表着播放些她的音乐。

「Someone like you、someone like Adele、some Adele」内容相近,但意思又完全不同。所以在特定范围内,不同的指令能够做很多不同的事情,它不仅仅可以控制灯光,更能够通过获得反馈来辨别短语的差异。

「A GOOD WAY TO MAKE YOUR WIFE MAD AT YOU」

正确播放音乐是一回事。确保 Jarvis 不会出现令人生厌的bug又是另外一回事了。

如果不确定应该在哪该做什么的话,即使只要求系统开关灯光或播放音乐也可能使系统产生混淆。如扎克伯格和他的妻子有时会使用不同的短语来表示客厅,所以 Jarvis 需要理解同义词。但扎克不想只对不同的短语进行编程设置,教导 Jarvis 学习它们和其他细微差别的语境是一个更有趣的问题。

inline-i-4-zuck-sits-and-demo-jarvis.jpg

它应该达到这种效果,如果我进门说:「把房间的灯打开」,然后也许灯太亮了,Priscilla 说:「调暗一些」,系统就能自动把她所在房间的灯调暗一些。

「如果这些发生时,Max 碰巧在睡觉,会怎么样?」

「这个很难处理,也许它是让你太太对你抓狂的好办法。」

另一个关于位置重要性的例子:创造舒适的电视观看体验,Javis 要会关灯。「挨着看电视的房间中,有一间是...Priscilla 的办公室。」扎克伯格说,「所以,我将它安排在看电视的地方,这样它就可以关掉楼下的灯。如果 Priscilla 在努力工作,她就会抓狂,『马克!』。」

比预期容易,但是...

虽然扎克伯格通常只会挑选一件事作为一年的挑战,但在 2016 年,他选择了两个。第二个是跑上 365 英里(约 573 公里),以防止他在打造 Jarvis 时久坐不起。而 2015 年他给自己设下的挑战是两周读完一本书。

连上互联网的冰箱并不自带 Facebook 安全证书。

严格来说,扎克伯格的家庭网络是 Facebook 公司设施的一部分。保护它就需要让任何与家庭系统相连的东西都要带上 Facebook 安全证书——基本上就是一个数字认证密钥,保证某个特定设备是安全的。

这种安全证书会限制他的控制。比如,接入互联网的冰箱不带 Facebook 安全证书。对大多数人来说,这不是个问题,但是扎克伯格不是大多数人。确保家中的安全是他首要考虑的问题。

目前扎克伯格通过互联网连接的转换开关来实现对家中某些电器的远程控制。他想要让 Jarvis 能自己拿出面包片做早餐烤面包。但是,现在还没有一种现代烤面包机能在关掉时让你把面包推下去,这是出于安全考虑。所以他只好买了一台上世纪 50 年代就有的低科技面包机凑活着用。

然而事实上,他在 Jarvis 上花的时间要少于跑步,这很大程度上要感谢 Facebook 的各种工具包,他利用这些工具包做了很多任务,比如图像和声音识别。

但是扎克伯格不希望看到的是,这个项目的大部分工作要研究如何将 Jarvis 与他家里的各种系统连接起来,这些系统囊括了照明、门、温度的快思聪家庭自动化系统;三星电视;SONOS 流箱和 Spotify 的音乐系统。但是扎克伯格想把这些东西都控制起来。

最终他想让每样东西都相连的方法需要花很多时间去解决软件的逆向工程问题,这些问题来自于他采用的产品和服务。

inline-i-3-zuck-sits-and-demo-jarvis.jpg

图:扎克伯格收到一条短信,当他控制他的 Sonos 音乐系统时,Jarvis 为他打开了大门

尽管 Jarvis 在记者面前表现并不完美,但是,扎克伯格却对自己的成就很自豪。他愿意将这个作品和任何人购买的系统(比如 Echo)做个比较。

他强调,这还不是一个可以走进千家万户的产品系统,但是,如果我搭建的系统连 Echo 等系统能做到的事情都完不成,我会很失望。

他补充说,搭建类似亚马逊和谷歌那样的系统,设计成让数以百计的用户可以控制大量设备的样子,要比仅打造单个家庭的人工智能管家要难得多。他也无意贬低那些公司的成就,也没有计划量产自己的作品。

不过,他说,如果我没能将人工智能的能力延展到音乐推荐或者面部识别(以不同的方式来实现)或者理解屋内环境,那么,我会觉得自己并没有真正推动这一研究。

3066478-inline-i-2-zucklights.gif

实际上,他计划总结自己这方面的工作并发布出来,如果他的某些结论最终能融入市场产品系统,他会非常开心。那也反映出脸书的一般哲学:开源,特别是人工智能方面的研究。

这种学习与我们与文本和声音的互动有关。对 Jarvis 说话并让他能够回答,对于播放音乐来说,是有意义的,不过,扎克伯格发现,在许多其他情况下,文本更加好,特别是当有其他人在身边的时候。

如果我在门口让某人进来,而这又与我身边的其他人无关,我更愿意输入文本发出指令。

即使是发出命令,他也想让 Jarvis 能够通过文本的方式回复他,或者说,与其大声回复不如以文本的方式显示出来。因为它说话时会有点烦人。

扎克伯格说,也就是说,语音功能在固定的时间发挥作用。你对他说话,他会回应你——我不想说它是我们家的一部分,这样有点过了——但是,确实感觉它有点具身化,所以 Max 很喜欢它。

扎克伯格并不幻想只用不到 150 个小时的时间就可以打造出媲美公司专业人工智能人士花费数千小时(一个项目,一位工程师可能要花一年时间来完成)的成果。

让世人好奇了整年后,他将 Jarvis 带到了人们面前。他一直在修改着这个管家,因为他每天都在使用,总会做些修补或者增添一些新的功能。不过,他很高兴他和整个家庭都在 Jarvis 的打理下。

扎克伯克可以通过界面输入所要完成的任务,比如晚上关灯。

他说,早上唤醒,说声早安,或者醒来后唤醒整个家,很简便。类似地,晚上不用在上床前关闭各种电器,说一声晚安就搞定一切并确认门也锁好了,非常方便。

Jarvis 这个项目最棒的事情之一就是刷新了扎克伯格的 Facebook 工程体验。

他说,因为自己花了很多时间用公司工具写代码,这并不是公司 CEO 通常会做的事情,因此,他能体会到一个新入职脸书的工程师的感受。他直接体验了一把公司所有这些内部工具,而且非常赞赏他们自己建造的这些工具,它们也是脸书文化的一部分。

入门Facebook产业Mark ZuckerbergJarvis语音助手
暂无评论
暂无评论~