随着人机交互概念带来的多模态交互的探索和自然语言理解技术的成熟,CGUI(CUI+GUI,对话图形用户界面)逐渐成为未来的交互趋势,也成为智能助手的发展方向。CGUI是一种高级多模态的交互方式。在CGUI的交互模式中,CUI交互和GUI交互的优点将被混合叠加,用户可以自由使用自然语言或图像输出命令,机器则根据命令的不同,给出语音、图形或菜单形式的反馈。
由奇点机智独立研发的智能对话平台【对话流】,是一个典型的CGUI产品,采用了高级多模态交互方式。企业和开发者可以不借助代码在该平台上定义智能对话,用文字、语音、卡片、wap页等形式为用户提供服务。
这一系列的文章,我们将会阐释,图形用户界面和单纯的语音交互大行其道的现在,我们为什么要打造一款CGUI产品。
CUI、GUI、CGUI都是什么
GUI(Graphical User Interface,图形化交互界面)
CUI(Conversational User Interface,对话用户界面)
CGUI(Conversational Graphical User Interface,对话图形用户界面)
“对话流”产品本质上是基于NLU(自然语言理解)技术,为企业建造CGUI(对话式图形交互界面)交互平台的工具。CUI、GUI、CGUI听起来都是玄而又玄的技术概念,但它们所代表的交互形式早已渗透在日常生活中。在下文中,我们将会为您阐释,这些概念都意味着什么,以及对话流采用CGUI交互形式的原因。
GUI(Graphical User Interface,图形化交互界面)是60年代“人机交互”的奇才道格·恩格尔巴特提出的概念,它使计算机更容易被用户接受,自从80年代苹果推出第一款搭载GUI的电脑后,至今为止GUI一直是人机交互的代表。目前市面上的互联网产品,基本采用了GUI的交互形式,行业经历了多年的发展,基于GUI的用户体验已经有了相对成熟的方法论与规范。如手机淘宝app,就是一个典型的层层嵌套的GUI交互范本:
与GUI不同的是,CUI(Conversational User Interface,对话用户界面)指的是人通过自然语言而非特定的指令(如点击鼠标,操作键盘,触摸屏幕等),与机器进行交互。这并不是一个新概念,CUI交互产品已经在广泛应用在智能助手中了,比如谷歌的Google Assistant,苹果的Siri,亚马逊的Echo等。用户通过自然语言对智能助手下达命令,智能助手则通过语音给用户进行反馈。
以上两种交互方式都各有优缺点。随着人机交互概念带来的多模态交互的探索和自然语言理解技术的成熟,CGUI(CUI+GUI,对话图形用户界面)逐渐成为未来的交互趋势,也成为智能助手的发展方向。CGUI是一种高级多模态在CGUI的交互模式中,CUI交互和GUI交互的优点将被混合叠加,用户可以自由使用自然语言或图像输出命令,机器则根据命令的不同,给出语音、图形或菜单形式的反馈。
CGUI是不是有声版的GUI
目前的智能助手总体给人一种鸡肋感:很多场景下,如果用户想要得到某种服务,往往用自然语言表达出来是行不通的,而是需要把“操作”用语言表达出来,还不如直接通过图形界面点击。贺宽,很大几率下,机器并不能准确明白用户的意图。
这是因为在类似“搜一搜”产品的语音模块中,只应用了原有交互模式的“有声版本”,这种简单粗暴的转换不会使用户体验得到提升,称不上是真正的CGUI产品。
真正的CGUI产品中,有一项重要的特质,便是“能够深度理解用户意图”,当接收到用户指令时,CGUI交互的产品会对用户意图进行推理。从企业的角度来说,CGUI交互模型会对现有的意图进行泛化,无论用户用哪种方式提出指令,机器都能够通过意图推理,为用户提供服务。
也就是说,CGUI比起有声版的GUI,更有用,更智能,更懂用户。而这种智能,带来的是用户体验的飞跃。