撰文 | 王艺
目前,使用科大讯飞的人次超过 40 亿次,其中 20% 是用于教育学习,其余与社交、生活等相关。科大讯飞董事长刘庆峰在作主旨演讲时表示。
11 月 9 日,2017 年科大讯飞年度发布会在国家会议中心举行。在这场主题为「顶天立地、AI 赋能」的发布会上,我们看到了以语音技术起家的讯飞,正进一步加强 AI 在教育、医疗、车载、家居等领域的落地。在人工智能技术基础上,讯飞针对产品做了大量设计和工程化处理,直击用户痛点,努力实现普惠和赋能。
2016 年成立的消费者 BG,被视作集团最高权重的业务单元,当前该业务尚无营收权重,但它承载了讯飞所有的美誉度和「愿景」。从今年前三季度的表现看,C 端业务占讯飞总业务量的 20%,毛利占 30%,刘庆峰表示,预计在未来,C 端业务将和 B 端与 G 端(比如司法)各占半壁江山。
本次发布会上,我们看到 C 端产品的迭代与创新。
去年发布的晓译翻译机 1.0 已经开售便被抢购一空。通过对已经售出的 20 万台翻译机的超 1 亿次请求进行分析,讯飞发现了晓译翻译机存在的以下三个痛点。
在外出游时,经常会遇到网络不佳的问题,讯飞为此新增离线翻译功能;除英语外,日语、法语、西班牙语的需求非常高,总和大于 80%,为此在新版本中,讯飞进丰富了语种覆盖;在国际局势不稳定的情况下,在外出游或许会需要紧急求救,讯飞在新一代的晓译翻译机背部新增 SOS 按钮,用户按下按钮便可与讯飞本部的救援中心进行连线,中心将根据具体情形帮助用户联络当地大使馆或紧急联络人。
车载语音系统「飞鱼」在常规功能之外,与汽车总线联通,可以控制车辆相关部件,例如车窗、空调。这与阿里巴巴和上汽的合资公司「斑马」语音系统相近,该系统搭载到汽荣威的车辆系统,可直接语音控制车体。不过,区别在于,讯飞还设计了一个「小飞鱼」系统,用户不用换车也能使用讯飞的车载语音技术,「斑马」目前还处在与车辆绑定的阶段。
除此之外,「飞鱼」还与家居智能系统联通,借助声纹识别功能,该助手能够对不同的家庭成员提供定制化的一贯制服务。
智能家居场景下,除了常规的开关窗帘等,讯飞巧妙地将远讲功能运用到了电视视频通话功能中。用户能够在客厅的任何地方通过电视与家人朋友视频,不用对手机麦克讲话。
另外,智能家居还加入了手势控制功能。比如,在电视场景下,选择想要看的电影时,可用手势进行翻页;将食指放在嘴前摆出安静的手势,即可让电视静音。
发布会现场,还出现了「魔幻」的一幕。负责讲解的产品经理身着特定的服装与头盔,演示用脑电波控制家电的开关,展示代表未来的家居场景技术。
不过,目前该技术还不成熟,不能进行广泛的商业化。据刘庆峰介绍,主要有三个方面的原因。施令者必须全神贯注才能完成脑电波指令的发送;仅限于家居场景如「打开空调」、「关闭窗帘」等几十条指令;指令并非实时传送,延迟超过 3 秒。
就在发布会召开的 3 天前,也就是 11 月 6 日,讯飞的「智医助理」在「2017 年国家执业医师考试临床综合笔试」取得了 456 分的成绩,超临床执业医师合格线(360 分)96 分,在安徽省两万多名考生中位列前 100 名。
这在董事长刘庆峰眼中,是「可以载入人工智能史册的事件」。发布会一开始,刘庆峰就兴高采烈地宣布这件事。「有些人认为这个考试全是选择题,简单得不得了。但其实不是这样的,事实上非常难。」刘庆峰会后答记者问说道。「IBM 的 Watson 在医学领域是很有名气的,他们在 2012 年就开始参加美国的医考,到现在也没及格。」
据悉,让「智医助理」参加考试,主要需过两大关。
海量的医学知识在计算机中如何表示,是一大挑战。传统上基于搜索的方案,和构建结构化知识库的方案,面对纷繁复杂的医学知识都明显能力不足。近几年来发展迅速的知识图谱技术,也不足以满足描述医学知识的需要; 以三元组为基础的半结构化知识图谱优点是比较符合人的直观、容易理解,但是知识图谱在描述能力上存在不足,其构建需要专家耗费大量的时间,扩展更新维护都非常困难,所以并不适合执业医师考试这样的大规模复杂任务。
为此,研究团队提出了一整套「语义张量」方法,针对医考需求,利用「多语义深度学习」方法通过学习人民卫生出版社五年制医学本科的全部教材、临床指南和经典病例等资料,获得医学领域张量化的的概念表示和关系表示,让机器拥有了庞大的医学知识库。
运用医学知识去分析和解决问题是第二个挑战,这也是系统能否做对考题的关键。团队提出了包「关键点语义推理」,「上下文语义推理」,「证据链语义推理」在内的多尺度融合推理算法,让机器具备了词汇、句子、段落间的多层次推理能力。
答题时,「智医助理」通过自主思考首先对题干和选项进行全面分析,在拥有的医学知识库中为每个选项寻找成为正确答案的可能证据,衡量评估题干、选项和证据三者之间的相关性和可信度,最终对各个选项证据得分进行综合决策,得出考题的答案。
发布会上,讯飞展示了其三款医疗相关工具,包括大家最熟知的「语音电子病历系统」,解放了医生的双手;能够帮助医生排查肿瘤与结节的「医学影像辅助诊断系统」;以及基于医学知识图谱技术与大数据,能够针对患者病情答疑解惑的医疗对话机器人「智医助理」。三款产品将分别于 11 月、12 月、以及明年 3 月面世。
今年,发布会上亮相的十款产品,五款与教育行业相关。这也再次表明教育 B 端在讯飞业务所占权重。
如何让孩子减少无效的学习时间,进而有时间发展体育特长和业余爱好,事关下一代人。对此,讯飞的「AI+教育」解决方案能够实现「精准教学、因材施教」。
基于人工智能技术,讯飞升级了一系列教育产品。包括帮助任课教师实现自助式课程录制的「智慧微课」;让学生在保留纸笔学习习惯的同时,又能利用人工智能技术进行作业批改的「智慧纸笔课堂」;只要通过拍照,就能实现纸笔作业实时修改反馈的「智慧作业平台」;帮助老师设计考卷的「智慧组卷工具」;以及基于知识图谱技术,为考生指明当下需要解决的知识点并能对知识点掌握情况进行动态跟踪的「智学 2.0」。
目前,这些教育产品已覆盖全国一万所学校、1500 多万师生,在使用过程中产生了 350 万份课件和 800 多万道试题,以及多达 350 亿条全过程数据。
更重要的是,数字化的课程与教学资源能够从一定程度上解决教育分配不公的问题,让山区的孩子也能听到省重点教师的课程。
这一年,讯飞继续进行语音技术上的探索。
2017 年,公司语音技术屡获国际比赛的认可。例如,在感知技术最重要的、国际最权威的语音合成比赛「暴风雪竞赛中」,讯飞已 12 年蝉联冠军。与往年不同的是,随着人工智能技术的进步,今年的比赛中加入了使用无监督学习的规则,也就是在无标记的情况下,让机器自己学习。结果表明,讯飞在蝉联第一的同时,与第二名也拉开了较大的差距。
目前,讯飞语音识别技术已经覆盖 2012 种方言,且准确率超过 90% 方言已接近 10 种。为了让老人、偏远地区人民、以及更多社会人群使用人工智能技术,自成立以来,讯飞不断地投入大量金钱、人力、时间成本录制方言音频。
教育、司法领域大量需要手写识别及机器阅卷技术,目前讯飞的技术也已经超过一般教师评卷水平。今年 8 月,科大讯飞刷新了全球肺结节测试的世界纪录,准确率达到 94.1%。在安徽省立医院等三甲医院的测试结果表明,其对肺结节的判断已经达到了三甲医院平均医生水平。