Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

李泽南作者

让环境适应人类:百度展示AI时代的交互设计

在越来越先进的技术之外,AI 时代的设计应该是什么样的? 7 月 5 日下午,在百度 AI 开发者大会上,举办了一场 AI 设计论坛,从交互的角度向我们解读了 AI 时代的环境、用户行为变化以及用户体验的新特点。在会上,百度还发布了机器人自然情感人机交互模型 NIRO。

百度自 2010 年开始布局 AI 技术,先后开展了自然语言处理计算机视觉机器学习数据挖掘知识图谱等 AI 技术的研发,随后开始探讨 AI 可能对人们生活产生的影响。百度认为,AI 的发展和人类的进化非常相似,而「重构」是伴随 AI 发展最重要的事。

「AI 在大多人看来,这个 I 是 intelligence(智能),」百度设计体验委员会主席、百度人工智能交互设计院院长、百度用户体验中心(UXC)总经理关岱松表示,「但在设计师看来,这个 I 是小写的 i,是 individual(独特)、是 inspiration (灵感)、是 innovation(创新)。科技赋予 AI 以能力,设计赋予 AI 以灵魂。」就像 iPhone 推动手机使用电容屏一样,在人工智能领域,一些技术本身已经满足应用需求了,但仍缺乏足够的场景。而 AI 设计,就是能从体验角度出发定义场景,从而让技术落地,实现价值最大化。

「2017 年 11 月,百度就成立了行业内首家人工智能交互设计院,对社会学、心理学等感知科学进行持续研究,」关岱松介绍道,「目前,百度 AI 交互设计的成果已经陆续应用在百度各 AI 产品中了。」

百度目前在人工智能上有三大「套件」:百度大脑、对话式人工智能系统 DuerOS,以及自动驾驶平台 Apollo。在发展新技术的同时,AI 的设计也是一个新兴领域,它必须以用户体验为导向,最终回归用户本身,和其他产品的设计有所不同。

在论坛中,几位演讲嘉宾围绕百度主要人工智能方向的 AI 交互设计对我们进行了分享,同时也对 AI 设计行业的未来发展进行了展望。 

关岱松在百度 AI 开发者大会「AI 设计论坛」上进行演讲

无处不在的「人因工程」

在百度的分享中,设计者们纷纷提到「人因工程」的概念,它成为了百度在 AI 设计中思考的重点。「通俗地说,在设计中我们需要将人知道的、不知道的以工程思维精准、量化、全面地进行研究,然后运用到设计之中。这是让研究引领设计。」百度 AI 交互设计院研究员李璇介绍道。

人因工程并不是全新领域,只不过在不同的时代,对人的关注点和研究范畴有所不同。AI 技术已经可以让机器通过语音、手势、表情等自然方式来与人进行交流。人们已不再需要去适应机器,机器需要来适应人。AI 时代的人因工程将不仅关乎人的能力、行为和限制,还将关乎人的社会、文化和心理,是真正以人为中心的系统工程。

「过去我们为基础的语音交互定义标准,」李璇表示,「而现在我们正将更多精力投入到打造能够进行自然交互、语音交互的智能体上。」基于心理学对人类认知、情感、意志的构建,在更远的未来,我们甚至可以研究如何赋予机器意志,让它可以有目的地发起主动交互。 

百度 AI 交互设计院研究员李璇发表演讲

重构体验」的百度大脑

百度大脑刚刚推出了 3.0 版本,作为百度在 AI 时代的核心标识,其已拥有超过 110 种核心技术能力,其中包括自然语言处理、人脸/人体识别、AR/VR 等等方面。这些技术已经应用在百度的众多平台和产品中:如搜索、地图、视频、DuerOS、无人驾驶汽车等等。此外,百度大脑的能力、技术还延伸到了交通、金融、制造等领域。可以说百度大脑就是百度 AI 技术的集大成者。

人工智能在交互体验上需要依靠新技术开发新的场景,百度希望通过 AR 为用户带来在认知层面的增强体验。

「比如,之前我们对事物的认知需要通过很多复杂传统的方式,比如:字典、地图、 说明书等等,」百度大脑设计负责人赵慧斌介绍道,「现在我们希望通过设计简化中间过程,大幅降低人的认知成本。」在百度地图设计中,百度用 AR 技术自然、直接的方式将位置和地点信息呈现到实际场景中,以简化用户认知成本,形成连贯的体验。所以,在今天的百度地图中,AR 不仅能把你带到目的地,还能提供更多直观有用的信息。

百度大脑设计负责人赵慧斌发表演讲

更加智能的 DuerOS

景鲲曾在大会第一天分享了百度的「智能语音操作系统」DuerOS 的最新数据,截至 2018 年 6 月,DuerOS 智能设备激活量已经超过 9000 万,月活跃设备超过 2500 万。这意味着,已经有 9000 万搭载 DuerOS 的硬件产品走进用户生活中了。在 AI 设计论坛上,百度也为我们介绍了它在语音智能上的 AI 交互设计。

对于智能音箱等智能设备来说,语音并不等于对话。发出声音其实只是其中的第一步,还需要对环境场景上下文的理解,充分获取显性和隐性的表达,和对人心理互动的把握,从而才能建立起良好的对话关系。作为 DuerOS 的设计师,需要在领会对话式人机交互的深层内容后,把更真实的自然还给用户,把推理运算、归纳演绎等高级综合能力装进设备中。

这就是百度提出的智慧型人机对话基本模型。「我们可以把智能家电理解为一个 APP,」百度 DuerOS 体验架构师张丽川表示,「我们在使用中,并没有和家电产生直接的联系。AI 设备需要从用户主动设置转变为根据环境进行主动调整的形式。」百度 AI 设计师希望让人机交互的方式从由人来设置进化到环境主动去适应人,「重构」人与环境的关系。

百度 DuerOS 体验架构师张丽川(图左)和百度体验架构师周子轩(图右)发表演讲

当今的智能设备已经可以检测距离、光线、音量、人脸、动作、温度、湿度等很多参数,通过感应器采集到的信息可以让智能设备主动进行操作,实现「让环境适应人」。百度体验架构师周子轩表示,还希望能够更进一步,让机器尝试理解人的心理,进而理解他们最真实的需求和意图。

无人驾驶时代的乘车体验

汽车正从有人驾驶迈向无人驾驶的时代,在当前场景下,汽车系统的信息框架更多围绕驾驶行为而构建,例如音乐等多媒体功能、或是各种辅助行驶的应用,比如 ACC 自适应巡航、碰撞预警、并线辅助等。而在未来无人驾驶场景下,智能驾驶系统的信息架构,将更侧重于构建安全、舒适的乘坐体验。在这种人因化的设计探索下,智能驾驶系统的信息构成或许将发生巨大变化。

「当我们把车这种最重要的出行工具,抽象化或无形化,我们就看到了『连接』的本质,」百度无人驾驶体验架构师沈瑞祥表示,「它连接了我们生活中林林总总的场景点,串联出属于我们每个人的数字时空。」

百度提出的智能驾驶系统信息架构模型由信息、交互、计算三者整合而构成。其信息内容设计主要为了满足用户对于驾驶系统的可预测性诉求:通过对汽车行为预测的表达来提升人与车之间的信任感。 

百度无人驾驶体验架构师沈瑞祥发表演讲

百度正试图从人类自然的交互关系出发,探索满足用户体验需求的人车交互系统。在系统输入端构建触控+语音的交互方式,同时在输出端,试图满足除味觉以外所有的感官交互通道。得益于 AR、语音助手、环境交互以及智能屏显等技术,这种可感化的设计正在逐渐走向现实。

机器人交互系统 NIRO

在介绍了百度大脑、DuerOS、Apollo 等百度 AI 技术及产品的设计理念之后,百度在 AI 设计论坛上还推出了一个新的项目:机器人的自然情感人机交互模型 NIRO,面向最具未来感的人工智能设备——机器人

NIRO 是机器人人机交互系统,它包含三个部分:机器人自然语言交互模型、人类情绪应对模型和机器人主动交流交互模型。其可以让机器人通过摄像头、人脸检测算法和麦克风阵列多模态协同工作实现近场语音交互唤醒,感知对话人的情绪,自动改变交互策略,并识别情景,在不同的环境中采用不同的主动对话方式。

百度体验架构师李士岩发表演讲

百度表示,NIRO 的三个模型将逐步对外开放体验,用户和开发者们现在就可以预约体验,并在未来将它们应用到自己的产品中。NIRO 是由百度人工智能交互设计院开放输出的 SDK,百度也是行业内首家基于 AI 交互设计提供开发输出 SDK 的公司。

「NIRO 的三个部分可以带来令人惊喜的体验,」百度体验架构师李士岩表示,「机器人的自然语言交互模型使得人类可以与机器顺畅地进行自然语言的沟通,人类情绪应对模型使得机器有了情商,机器人主动交流模型赋予了机器人吸引力,它会主动撩你。」

在论坛的最后,百度还宣布正式与湖南大学达成战略合作,双方将通过共同建设实验室、设立博士后基地等方式,在 AI 交互设计领域开展广泛研究,共同探索 AI 时代的交互设计方式。百度高级副总裁、AI 技术平台体系 (AIG) 总负责人王海峰和湖南大学党委副书记陈伟见签;百度设计体验委员会主席、百度人工智能交互设计院院长、百度用户体验中心 (UXC) 总经理关岱松和湖南大学设计艺术学院院长何人可代表双方在战略合作协议上签字。

百度高级副总裁、AI 技术平台体系 (AIG) 总负责人王海峰 (后排左) 及湖南大学党委副书记陈伟 (后排右) 出席百度与湖南大学战略合作签约仪式

AI 设计有点像科幻小说的创作,设计可以为未来提供大胆想象,而其中的一部分会在数年之后得到验证。从某个角度来看,AI 设计可以推动新产品的落地和形成。

百度大脑、DuerOS、无人驾驶汽车和机器人,在不同的领域构建着全新的产品形态。而贯穿始终的,是百度在 AI 时代设计领域的思考。在过去一年,百度设计团队在 AI 领域获得了 337 个外观和发明专利。或许在不远的未来,人工智能最为流行的交互形态就将在这些研究中出现。

产业百度开发者大会智能设计
1
相关数据
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~