近年来,国内客服机器人行业发展非常快。特别是随着深度学习技术的崛起,NLP领域有了极大的突破。智能客服机器人作为NLP最具潜力的应用场景之一,近年来有大批新玩家积极涌入这一领域。其实,造成这一现状的根本原因却是市场对客服机器人产品的刚性需求。由于客服人员招人难、培训成本高、流动性大,不易管理,而客服机器人可以全天24小时工作,还能通过实时数据反馈不断学习,企业有足够的动力用客服机器人取代一部分人工客服。
并且根据最新的调查数据显示,中国大约有500万全职客服,以年平均工资6万计算,再加上硬件设备和基础设施,整体规模约4000亿人民币。按照40-50%的替代比例,并排除场地、设备等基础设施以及甲方预算缩减,大概会有200-300亿规模留给客服机器人公司。面对如此大的蛋糕,市面上短期内出现近百家客服机器人公司就不难理解了,并且智能语音开放平台还提供了看似成熟的解决方案,让这个行业的门槛变得貌似非常低,所以行业整体上才呈现出大干快上的发展节奏。
其实做好客服机器人的门槛相当高。仅就语音识别来说,虽然智能语音开放平台,比如科大讯飞、百度、阿里、腾讯这些,都提供了解决方案,并且准确率都很高,但这个准确率都是在手机里面测试的结果,技术人士应该清楚,手机声音采样一般是16K Hz以上,双麦克风采集,语音质量非常高,所以才可以达到95%以上普通话识别准确率。但是在电话场景里采集的音频通常是8K Hz的,音频质量较差,所以直接调用开放平台的语音识别接口,准确率就会急剧下降,效果就不会太理想。因此,要做好客服机器人的语音识别率,就应该对语音识别(ASR)的算法进行深入的研究,针对8KHz在语音识别算法上做出针对性的参数调整,才能建立优秀的电话语音识别引擎,没有这些作为基础,就不会有让客户满意的语音识别率,更别妄想打造一个优秀的客服机器人产品。
成立于15年的意能通,刚刚完成2450万A轮融资,被估值2亿。旗下核心产品——小意机器人,就没有采用任何一个智能语音开放平台的方案,而是全情投入自研语音识别引擎,耗费巨资,从底层去解决电话语音识别准确率的问题。还自研了自然语言处理引擎,并把两个引擎进行了深度整合,实现语义库与语音识别引擎同步训练,在语音上就能进行适应和纠错,无需先做语音识别转文字,再做语义理解,避免了准确率经过逐级传递最后导致非常差的现象,让小意机器人智能语音识别准确率达到业内领先水平。
意能通能达到如此成就与其创始人刘雨松博士的理念密不可分,在15年意能通创立之初,就计划将其打造成客服机器人行业的大疆。笃信技术,崇尚创新能力,坚韧不拔,用具备在全球都领先的核心竞争力,为客户提供最优秀的客户体验,这即是刘雨松博士对大疆成功的总结,也是意能通最信奉的价值观。
在践行价值观的路上,刘雨松博士带领几十人的技术团队,创新性的判断只有大批量高质量的电话语音数据,对自研的算法模型进行针对性训练,才能打造出最好的客服机器人,由此,他们采集了长达数万小时的电话语音数据,进行标注和训练。如今,这些数据已成为小意机器人横行市场的硬核武器。
据了解,也正是看到了这些技术优势,多个行业近百家头部企业都成为了意能通的客户,比如中国电信、中国联通、人保财险、同程旅游等等。为了更好的服务这些客户,意能通为他们提供了完全私有云部署和离线部署方案,解决了客户对数据遗失、盗取的顾虑。同时在私有化部署上,意能通现在可以做到一个CPU 10并发,每个并发在一秒钟之内可以得到回复,双CPU共32核的话,极限可以做到500个并发,形成了强大的竞争优势。