首先,为学术研究而生的大规模预训练模型,往往以人工收集构造的相对通用化的数据集作为基准,以较理想化的设定来进行实验(比如类别均衡的多分类问题),这些都跟模型最终的实际落地应用有明显出入。因此,我们必须从开始打造它的第一天起,就考虑大模型将来怎么在企业级应用中落地。其次,以单纯学术研究为目标的大模型,到了刷新榜单最好成绩这一步,就拿了研究项目的高光时刻,并不需要参与后面漫漫无期的落地应用过程。但对我们而言,只能高兴一天时间。还是同一批人,不是把孩子生出来就行了,还要负责养大,培养孩子做出最大的贡献。余承东发布由循环智能和华为云联合开发的盘古NLP模型循环智能(Recurrent AI)联合创始人杨植麟是“大模型”的布道者,也是深入业务前线的公司产品负责人,因此非常关注前沿AI技术的落地策略。他认为,“超大规模模型是价值最大化的基础,但刷新CLUE榜单成绩只是模型能力的初步验证,盘古NLP大模型更大的价值是带来AI落地的效率革命和应用场景扩展。”
三大技术创新,专攻大模型落地难题
在盘古NLP大模型研发过程中,循环智能的 NLP Moonshot 团队拆解了GPT-3等大模型很难在商业场景中得到应用的三大原因:1)大模型在应对复杂商用场景的小样本学习能力弱;2)难以结合微调扩展业务场景;3)难以融入不同领域的知识。然后,一一进行击破。第一,盘古NLP大模型在小样本学习任务上超越GPT-3,解决后者难应对复杂商用场景的少样本学习问题。比如在企业客户的心声分析和员工执行力分析应用场景中,使用盘古NLP大模型生产语义标签时,实测得到目标结果所需的样本量仅为GPT-3模型的十分之一,即AI生产效率可提升十倍。第二,盘古团队在预训练阶段加入了基于 prompt 的任务,大幅降低微调难度,解决以往大模型难为不同行业场景进行微调的问题。在下游数据充足时,微调难度的降低使得模型可以随着数据变多而持续优化;在下游数据稀缺时,微调难度的降低使得模型的少样本学习效果得到显著提升。比如,在企业借助沟通内容判断客户购买意向,以找出更多目标客户从而提升转化率的场景中,实测盘古NLP大模型相比GPT-3可提升 27% 的成单转化率。第三,除了能像GPT-3等仅基于端到端生成的方式以外,盘古NLP大模型还可以通过少样本学习对意图进行识别,转化为知识库和数据库查询,解决以往大模型难融入行业知识和数据的问题。比如在金融服务场景中,盘古NLP大模型能更好地为实时沟通辅助系统提供底层能力,帮助服务人员更快掌握专业知识和沟通经,更快提升业务水平。三种企业应用,增强“人”的能力
在高附加值的产品销售与服务过程中,如保险、房产、教育、财富管理等行业,企业需要借助人与人之间的沟通过程,让销售人员与客户建立更紧密的联结,提供更专业的服务。但由于销售人员的素质和能力提升缓慢,同时企业缺乏对目标客户的了解,导致客户体验不佳,业绩也难获增长。“企业的员工在与消费者沟通交流时,代表的是企业自身形象。因此,提升员工的业务水平和表现,是企业重塑消费者体验的重要环节。”循环智能CEO陈麒聪表示。
基于盘古NLP大模型等核心技术,企业可以获得更强的人员产能提升、精准销售和新一代合规质检解决方案,从而更快地提升销售人员能力、更快地找到目标客户以及降低合规风险。
人员产能提升 Expert↑:借助深入业务流程的优秀实践挖掘、沟通实时辅助和执行监督报表产品组合,帮助企业将优秀销售人员的实践经验传递给每一名普通销售。在与客户沟通中实时辅助销售人员,提升他们的表现,将他们为企业创造的价值最大化。精准销售 Target↑:循环智能开创了基于沟通对话数据与成单结果的意向预测模型,通过算法模型,可筛选存量线索中的高意向线索,或筛选对某产品更感兴趣的客户名单,帮助销售人员更精准地找到目标客户,提升销售和服务效率。新一代合规质检 Compliance↑:不同于基于“关键词+正则”的传统方案,循环智能提供高准确率和召回率的AI语义质检方案,配合独家的“违规率排序”功能,可助力质检员多找出数倍违规对话,帮助企业大幅降低合规风险,提升服务质量。超大规模语言模型是前沿NLP技术与落地应用的交汇点,随着下一步通用API的开放,企业可以解锁更多应用场景。