Emotech 的起点是 2014 年 8 月庄宏斌和 Chelsea 一起获得 UCL 学生创业大赛的第二名,这是 UCL 年度针对从本科到博士在内的全体学生的创业竞赛,负责人 Timothy Barney 直接授命于现任英女皇负责提升英国高校的创业水平。最初的产品叫 Happy Cube,目的改善白领在办公室工作的情绪。
虽然当时的产品仅是拥有浅层人工智能的桌面小装置,与现在功能强大的 Olly 无法相比,但这是庄宏斌探索「改变人类与机器关系」的第一步, 也是公司被命名为 Emotech, Emotion+Technology 的原因。
近日,「机器之心」独家对话了这家来自英国的初创企业。Emotech 的 创始人庄宏斌、联合创始人 Chelsea 、Jan,以及科学家团队中的 Pawel、Zarf 和 Pedro 分别就公司团队、技术、产品以及人工智能行业等问题接受了「机器之心」的采访。
Emotech:我们目前在开发新的产品设计,今年 11 月左右会公布,到时再详细地介绍。简单来说,Olly 是世界上唯一具有独立个性的家用机器人,类人脑的情感互动是它的重要特色。
机器之心:HB 有丰富的产品管理经验,能否介绍下 Olly 的产品思路和理念?
Emotech:产品的思路源于之前做社会网络时对产品给用户带来价值的理解,2007 年人人网用户数量大爆发其中的一个关键因素是产品策略上的优化让用户找到失去联系的老同学/朋友,这里面是情感紧密联系的。当时一直在思考如何衡量产品给用户带来的价值,比如从表面的数据上,两个用户在吵架,带来的「UGC」要远比一句「我喜欢你」多得多,但显然价值和体验恰恰相反。
当然这只是一个简单的例子说明情感的重要性,深入下去会发现这其实在多方面有情感的理论根基,包括认知心理学和神经科学等等。所以我坚信下一代的交互模式情感是不可或缺的。技术上人工智能的发展和产品上情感设计的升级,让个人机器人成为可能。
等产品公布时可以比较系统和详细的讲。
Emotech:我们对于竞争的的理解:
第一,数据固然重要,但算法和模型也尤其关键,我们专注的领域和用户群比大公司要窄,而且我们同样拥有在这些领域的顶级科学家(语音识别、类人脑、增强式机器学习);
第二,边际效益递减,数据并非越多越好;
第三,Data-efficient Learning 也是我们的强项之一。
Emotech:语音信息的特征可以被学习和迁移到不同语言,这已经被很多研究验证了;另外有些数据(比如文字)可以通过很多线上资源低成本地获取,而有些数据(比如用户交互模型)是可以被抽象,与具体语言分离的。
Emotech:产品设计理念上,我们参考了很多家里宠物尤其是狗和不同家人之间的关系和互动;技术上,声音、样子等等都可以成为角色区分的方法。
机器之心:预计语音助手技术何时成熟,迎来市场爆发?有进入汉语市场时间表吗?
Emotech:从技术方面,硬件上 MEMS 麦克风发展非常迅速,虽然还需要提高,但 1-2 年内质量和成本上都要大大优于现在;而目前随着深度学习的发展,我们已经看到很多可以通过算法方面来降低硬件要求的例子。
当然不同领域会有不同,比如车载的语音助手和家居语音助手的要求是不一样的。市场方面语音交互是和 GUI、触屏交互同一个量级的概念,但我们相信市场成熟需要的时间应该比智能手机花的时间短。
明年年底左右中文的 Olly 就会开始售卖。
Emotech:一方面实体机器人有多方面优势,包括数据收集和情感互动等, 我们尤其在 Olly 的动作方面做了很多吸引人的有趣设计;另一方面我们团队很多人都有创造一个实体机器人的梦想。最后就像滑雪一样,高级道的缆车排队的人远比低级道少得多。
Emotech:我们的产品和 chatbot 还是有很多不同点。但就 chatbot 来说,基本的挑战主要集中在
理解语义;
确定内容;
确定如何表达。
对于我们而言,在场景理解,情感和数据有效性等方面有很多优势,这对 Olly 和用户互动上有很大的帮助。
Emotech:第一,我们做的事情和 chatbot 有一些共同点,但还是很不一样的;
第二,仅从难度方面探讨,难度小的事情没什么意思;
第三,相比起「开放域」或「通用」,我们更倾向于认为我们是找到了一个简洁优美,并且高度可扩展的方向。
Emotech:Olly 的核心 AI 引擎本质上就是多重模态的;我们通过低层算法处理各种输入,然后用高层算法合并。举个例子不同算法处理音频和视频信息,而提取出来是什么人正在说话。
机器之心:要实现深层次的个性化需求需要来源广泛的各类数据,请问作为作为创业公司你们如何获得?或者是如何与其他公司合作?
Emotech:做一个令人兴奋的产品是关键,大家会觉得一起合作有前景,有意思。这里面既有我们寻求的合作伙伴,也有一些是看到我们的报道后,主动找到我们的。
Emotech:我们的 AI 引擎是一个高度可扩展的层级结构,这个架构有一个很大的好处就是支持我们对不同类型数据进行处理。
Emotech:我们对用户的隐私极度重视。首先我们只收集经过用户同意的数据,而且用户拥有对自己所有数据的完全控制;其次我们尽量进行本地化实时处理,如果需要通过云端,则尽量只传输提取后的特征数据,而且本地和云端都会经过严格的加密。
Emotech:并不一样,比如飞机并不需要像鸟一样扇动翅膀,具备理解能力的算法并不需要像大脑一样。深度+一些特定的增强式学习方法会被用到。
Emotech:目前 15 名全职员工,会继续扩中到 25-30 名左右,其中 80% 为技术人员科学家。英国和美国是全球人工智能储备最多的国家,Emotech 会继续以伦敦为核心研发中心,同时开始向硅谷发展,吸收优秀的人工智能专家及市场领域的资深人员,为明年的年产与销售做准备,努力让 OLLY 成为世界上最有趣的个人机器人。
Emotech:角色多重,在各跨界中都有专业水准并不是我们的用人标准,但似乎公司充满创造力,勇于改变和冒险的气氛吸引了这样的团队成员。创始人庄宏斌除了产品设计外,也是单板滑雪的狂热爱好者,在创业的巨大压力和紧迫时间下,还是会在冬季每个月去瑞士 Zermatt 峰报道;Chelsea 是科班出身的当代艺术投资专家,至今还在最大的艺术杂志《hiart》撰写专栏;Pedro 是乐队的贝斯手,还出过专辑;Pawel 热衷钢琴作曲等等
Emotech:吃吃喝喝是团队的重要娱乐之一,尤其是在伦敦美食地图 Szu 博士的领导下,这个拥有 14 国母语的超级国际化团队善于在伦敦的东区和 central 寻找各国美食,并在肉食动物和素食者之间找到平衡;宏斌、Jan、Pawel 都是单板迷,在计划冬天的集体滑雪;音乐和艺术也是团队的共同爱好,2 个钢琴,1 个古筝,1 个萨克斯风,1 个贝斯,等等。
娱乐之外,充电也是重要内容。公司支持团队成员相关或者不相关的学习,比如参与心理学互动研究、摄影、人工智能垮领域交流等。始终相信,没有不相关的学习,只有不断开拓未知领域,勇敢冒险,才能真正创造世界上最好的人工智能创业团队。
Emotech:首先很多美国的创业公司也被收购,另外很多英国人工智能公司被大公司类似 Google,Amazon 和 Apple 收购也从一个侧面反映了英国 AI 的技术积累和先进性。在去年 TechCrunch 获奖之后,我们已经收到不少来自产业基金的投资意向,但是为了最大程度的保持独立,按照我们的规划打造世界上最好的人工智能团队,生产最有趣的机器人,我们选择了现在的投资人。
但是,我们并不拒绝各种形式的跨界合作,开放平台与各种智能设备整合,或者 Olly 主体的特殊定制,还是人工智能软件与其他硬件厂商的合作,我们都非常乐意尝试,只要不违背我们向用户提供最好的「hands free 的人工智能体验,让用户体验更好的生活方式的原则」。
Emotech:我们非常惊喜地看到很多进展其实是硬件端带来的发展,很多解决方案是在相对简单但是通过大规模数据训练出来的模型。当然在理论方面的进展也是惊人的,比如对联结式模型机制的更深入理解所带来更优的方式优化和参数使用(例如注意力机制);另一方面是对多模式数据的联合处理,比如结合语言和视觉数据。
Emotech:大家应该比较熟悉图片分类的算法,这类算法需要判断每给定一张图片中是否有一只猫或者房子等,这样的任务是一张张图片完成但相互间不会影响。与这类算法不同,经典增强式学习的问题的例子包括让一个机器人走出迷宫或者下围棋,在这类问题里,机器人当前的每一步(左转或右转,下哪一格等)都会影响到后面的步骤,这就是增强式学习最基本的特点:解决有连续性相互影响的问题,过程中机器需要在连续性的很多步中选择正确的答案(却不知道最终结果是什么)。
Emotech:绝大部分当前机器学习应用的挑战在于很多模型在特定的任务/领域可以取得非常出色的表现,但却很难应用到更广义的领域。对话,自然语言处理和语音识别也有这样的问题。当然具体来讲有很多难点需要更多的投入,比如说当多个用户用同一个设备时,需要特定的处理,再比如说,经常是即便语音识别已经达到非常高的水平,系统并不理解用户的意图或者失去对话中的当前状态;另外自然语言生成也是很有挑战的领域。
Emotech:更全面地说,人工智能带来全新的产品形态,人工智能是这整个星球的趋势,而且我们坚信会是一个比移动互联网要更大的市场,因为它不光可以变革移动互联网上绝大部分的应用,还产生新的交互方式以及有物联网等基础;学术界已经积累了好几十年,工业界刚刚开始。技术难点方面前面的问题已经有提到了。
Emotech:我们可以看到很多人工智能上的进展是得到神经科学方面的启发,包括深度学习和一些关键计算机视觉方面的突破;人类拥有这个星球上最高级的智能系统,显然有很多方面值得研究,比如小孩的学习能力远比目前的计算机系统要先进;Olly 的核心是一个类脑人工智能引擎,使其情感化及高效学习;当然,如以上提到的:飞机并不需要像鸟一样扇动翅膀。
人工智能技术的成熟可能会带来一种全新的产品开发思路,而产品是一个综合学科,显然人工智能相关的产品其科研性会更突出,但依然是建立在满足用户需求的基础上。这部分等我们的产品出来后我们会比较系统地讲一次,这样能更形象一些。