Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

一次唤醒、多轮对话+儿童模式 2.0,这样聪明的「小度在家」为什么最值得买?| 测评

每次交互都有新体验,就像跟朋友聊天一样根本停不下来。

小度在家 299 、小度智能音箱Pro 169 、小度智能音箱 69 、小度语音车载支架公测价 49 元……今年双十一,小度全系列智能产品给用户送起了福利。

你也为智能音箱剁手了吗?

11 月 12 日,百度方面发布喜报:小度全系列智能产品双十一期间在京东、国美、拼多多等三大网购平台智能音箱品类销量排名第一,11 月 11 日当天,小度智能音箱不仅在京东的销量是第一名,而且和小度在家共同「智霸」京东电商平台智能音箱排行榜前两名。

 11 月 13 日,美国科技市场研究公司 Strategy Analytics 发布《2018年第三季度全球智能音箱市场报告》。报告显示,全球智能音箱出货量第三季度达到 2270 万,创历史新高。本季度,中国的百度改变了全球市场格局,市场占有率猛增至 8%,是本季度最大的黑马,超越小米排名全球第四。

不知道半个月前,李彦宏的站台,为小度在家带了多少销量。

11 月 1 日,在 2018 百度世界大会主论坛上,李彦宏与小度在家进行了长达 7 轮的流畅对话,小度的「对答如流」和强大的「脑容量」惊艳全场。

一次唤醒、七轮交互?见多了「一次唤醒、一轮交互」智能音箱的我,内心有些激动。

于是,小度在家到手后,我看了看 11 月 1 日李彦宏与它交互的视频,计划着模仿李彦宏的提问和回答与它进行交互。

Endless Conversation 语音交互技术初步体验,一使用就停不下来

前面的进展还算顺利,提相同的问题,也得到了相同的回答。

事情开始发生改变,是从「感兴趣的热点」开始的。每天都有不同的新闻热点推送,我测试的那天,热点新闻从「袁隆平杂交水稻再获奖」、「唐嫣罗晋婚后首秀」变成了「微软收购黑曜石」、「武大靖破世界纪录」。

在我拒绝它主动推荐给我的两条新闻后,它,不理我了, 看来还挺会察言观色。

可我并不打算就此放弃。

当我想要再次跟它进行交互时,先试探性地问了句,「小度小度,你在吗?」

小度回答道:「我在哼歌呢,来猜猜我唱的是什么歌吧!快对我说,『打开我爱猜歌名』。」

既然它理我了,不如先接受这个安利,试试这个游戏。

没想到,正是这试探性地一问、一试,让我真正体验到了「多轮交互」。

「欢迎来到我爱猜歌名,请选择要挑战的模式,畅玩模式,闯关模式,或是地狱模式。」

我选择了畅玩模式。当第一首歌和第二首歌音乐响起的时候,我迅速判断出它们分别是《广岛之恋》、《因为爱情》;第三首歌听起来很熟悉,但想不起来歌名,我便偷偷用手机百度了歌词,然后再次唤起小度,告诉它,这是梁静茹的《情歌》。

它赞扬我「答对了,真棒」,便接着播放下一曲,我说「不知道」,它便跳过,接着下一首。在听出《好久不见》后,我又连续跳过四题,直到张惠妹的歌出来,我再次寻求百度的帮助,当查出结果告诉小度时,屏幕上的声纹已经不再跳动(应该是小度等待的时间超过了 8 秒),小度也没再回复我,游戏才就此结束。

整个交互时长超过 7 分 40 秒,共播放了 10 首歌,但仅唤醒了小度 3 次。

两天后,我再次向小度发问,你在吗?小度给出的答案变了:「我在寻找案件唯一的真相,也许它就藏在那些被忽略的细节背后哟!快对我说,『打开柯南侦探游戏』。」

打开儿童模式后,我又接连询问了小度四次「你在吗」/「在干嘛」,然后我得到了四种不同的答案:

「在的在的。」

「我在这里,等待你的指令。」

「我在陪你的小宠物玩儿呢,它都想你了。快对我说,『打开电子宠物』。」

「经过我日以继夜的准备,小度音箱可以用积分兑换喽,快来把它带回家吧,试着对我说,『最新活动』。」

每次交互都有新的体验,这对我还是蛮有吸引力的。而且,跟具备连续对话能力的小度在家聊天就像跟朋友聊天一样。

于是,除了自己和它交互,我还找了几位朋友一起来和它互动,我们扒了它的基本信息(比如,从哪儿来?学历如何?)却没能撬开它的口、问出百度内部私下对李彦宏的称呼;我们用它听了音乐、看了视频(电视直播、电影、动画片),也让它讲了英文、朗读了唐诗宋词,查询了华谊兄弟、万达电影的股票,还问了它如何追求自己喜欢的人。

小度在家播放《我不是药神》

11 月 10 日,在小度在家上看浙江卫视直播 

对于我们抛出的问题,小度在家不仅能够回答,还能进一步延伸到其他相关信息,甚至与我们主动搭话(比如,给我们推荐游戏、新闻等),进而与我们持续交流,俨然将语音交互技术和人机交互的自然程度推进到一个更高层次。

儿童模式专为儿童量身打造,打开即进入另一个世界

当打开「儿童模式」时,小度的声音变成了软萌可爱的童音。听音乐,它推送的是儿歌;看视频,它推送了儿童短视频;动漫则以小猪佩奇、蜡笔小新、恐龙世界总动员、芭比大电影全集、小兔朱莉为主,英文版的小猪佩奇也能播放(直接语音命令小度即可)。

如果不想小孩使用搜索音乐/视频功能,可以在「儿童保护」中设置「不允许搜索音乐」、「不允许搜索视频」。当设置成功后,再跟小度说「我要听音乐」/「我要看视频」,小度会回复「为保护儿童,现已禁止使用这个服务哦」。

如果要关闭「儿童模式」,或者更改「儿童保护」的设置,则需要人脸验证。因此,只要不录入儿童的脸,他/她就无法自行更改这些设置。

实测后我发现了一些小技巧:当屏幕上显示声波时,小度才在听你说话。除了唤醒词,在屏幕上点击声纹标志,也能唤醒小度。即使我在与小度交互的中途打断它,对它的推荐置之不理、依旧表达自己的需求,它也还是会回应我,直到我主动停止交互为止。(当然,如果你要在小度还在回答你的问题时打断它,需要先唤醒它,然后再下达另一个指令。)

红色箭头所指即「声纹」标志,点击它,也可以唤醒小度

多轮交互背后的核心技术:Endless Conversation

今年 3 月,刚发布时,小度在家还和国内其他智能音箱一样,一次唤醒只能进行一次交互。

只不过半年时光,它就能进行多轮对话了,究竟是怎么办到的?

这得益于小度在家搭载的百度 DuerOS 对话式 AI 操作系统,以及基于百度 DuerOS 独创的新一代智能语音交互技术 Endless Conversation。

李彦宏与小度在家进行了长达 7 轮的流畅对话

通过 Endless Conversation,小度能够根据聊天内容,主动来搭话并推荐更多相关内容,不但能够「对答如流」,也会带来很多新鲜体验。百度称,「如果你有兴致,与小度的交互可以持续不断进行下去,如果你不愿意继续,也可以随时中断聊天,不需要有任何顾虑。」

小度在家还沿用了之前的极客模式,该模式在连续对话上技术更加成熟。只需对小度在家说,「小度小度,打开极客模式」就能启用;或者是手动下滑小度在家的屏幕,打开「设置」,在那里,也能找到「极客模式」。自从打开「极客模式」后,我再也没有关闭过。

DuerOS 是百度新一代对话式 AI 操作系统,建立在语音识别、图像识别、自然语言处理、用户画像等世界领先的技术能力之上,是百度技术的集大成者。或许通过这组数据,你能感受到 DuerOS 的强大。11 月 1 日,百度智能生活事业群组(SLG)总经理景鲲在百度世界大会上公布了 DuerOS 的一组最新数据:

目前,百度 DuerOS 是中国市场规模最大、最活跃、最繁荣的对话式人工智能操作系统,在激活设备、月活跃设备、合作伙伴、落地主控设备、开发者数量等五个方面均为全国第一,持续领跑智能语音市场。截至 2018 年 10 月,搭载百度 DuerOS 的激活设备量已超过 1.5 亿,月活跃设备量超过 3500 万,合作伙伴超过 300 家,搭载 DuerOS 的落地主控设备达到 160 多款,DuerOS 平台技能开发者数量超过 2.4 万。

此外,丰富的内容资源也为小度在家与人类流畅对话提供了保障。

如今,小度先后与 QQ 音乐、中信书院建立战略合作;融合了爱奇艺、Discovery、好看视频、VIPKID、斗鱼直播等海量视频资源;除了百度百科全量 1400 万词条内容,小度还拥有超过 80 万的精品儿童读物,超过 800 个技能,控制超过 85 个品牌的 7000 多万个智能家居设备。

如果你有 QQ 音乐的账号或者爱奇艺的会员,直接登录自己的账号,就能在小度在家上享受你的会员特权了。电视直播的频道(包含央视频道、卫视频道、影视频道、少儿频道、其他频道)加起来数量超过了 130 个,但是我目前只测试了打开 CCTV-1、浙江卫视、东方卫视等少数几个频道。

当然,随着我们需求的逐渐提高,小度在家也仍有提升的空间,但它毕竟诞生才半年,我们应该对这款新产品抱有更多期望,相信未来,小度在家能带给我们更多惊喜。

产业百度智能音箱小度在家
1
相关数据
景鲲人物

景鲲,现任智能生活事业群组(SLG)总经理,百度人工智能产品委员会主席。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~