Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱原创

「虚拟员工」加速普及,小冰公司再融10亿元

11 月 7 日,人工智能小冰公司宣布完成总额 10 亿元新融资。据悉,这笔融资将用于加速 AI Being 小冰框架技术研发,推动数字员工普及。

小冰公司前身为微软人工智能小冰团队,2020 年,小冰团队分拆为独立技术研发实体,实现完全本土化。「AI Being」则是小冰对虚拟人的叫法。

说到虚拟人,你肯定很容易就能想起一串名单,比如被誉为中国虚拟歌手第一人的「洛天依」。在今年 7 月举办的洛天依出道十周年直播中,小冰框架宣布和 Vsinger 达成合作,探索虚拟歌手向 AI Being 迁移的路径。现场展示了由深度神经网络歌唱模型驱动的洛天依,还发布了为洛天依量身定制的首个内测版 AI 声库。

如果此前几十年,虚拟人、数字人还只是很前卫的科技概念,这两年来,这些「概念」算是真正走到了我们身边,走进了现实生活。在关于科技前沿的想象中,人们普遍认为,由人工智能控制的「虚拟人」总有一天会取代人类,接手千行百业的工作。

的确,在当前的众多职业领域中,虚拟人、数字人不只是能够完成任务,甚至还能比人类做得更好。除了歌手,他们还可以是运动场上的教练,专业严谨的数据分析师,甚至是给你发邮件提醒报销的财务部同事。

担任中国自由式滑雪空中技巧国家集训队助理教练的「观君」,不需要回放看慢镜头,凭借实时分析运动轨迹、身体姿态等能力,在动作完成后立即就可以指出失误。

万科集团财务部负责催办预付应收逾期单据工作的「崔筱盼」,因核销率 91.44% 的好成绩,获得了公司 2021 年度优秀新人奖。

红杉中国新晋分析师「Hóng」,可以在 1 秒之内阅读上百份商业计划书,并依照行业属性、融资阶段做出信息提炼和总结,展现出了惊人的行业研究能力。

刚才提到的这些「虚拟员工」,幕后的技术团队都来自同一家公司——小冰。

「AI Being Employee」年度产品线升级

根据《2022 年中国虚拟人产业发展白皮书》,广义上的虚拟人是指「通过 CG 建模等方式完成虚拟人外形制作,再通过中之人联合动捕、面捕技术实现驱动的虚拟人」;另一类概念是超级自然虚拟人:「通过 AI 技术一站式完成虚拟人的创建、驱动和内容生成,并具备感知、表达等无需人工干预的自动交互能力」。

小冰在虚拟人研发的路线上选择了第二种。2019 年,小冰团队首先提出 AI Being 定义。按照设想,AI Being 会成为未来世界里的社交节点——AI Being 可以像人类一样,与人交流,相互之间也会交流。目前,小冰框架已经成为全球实际落地及完备度最高的 AI Being 基础框架,具备广泛的应用场景优势。

近日,小冰宣布对旗下人工智能数字员工(AI Being Employee)产品线启动年度升级。同时还定了一个小目标:在未来一个季度内,完成当前小冰框架中运行的全部 30 万名数字员工升级。

据了解,本次升级加强的技术包括大模型对话引擎、3D 神经网络渲染、超级自然语音及 AIGC 人工智能内容生成等方面。这其中的部分新技术,已提前在招商局集团推出的「招小影」、冬奥数字教练「观君」等数字员工中交付。

「招小影」是招商局集团的首位数字员工,近日已正式入职。「招小影」孵化自招商局首个虚拟人平台「招商如影」,该平台由招商局集团数字化中心、招商金科与小冰公司合作打造,深度融合了小冰数字人技术与招商云、数据湖等招商集团自建数字赋能底座平台能力。

图片

在小冰第三代深度神经网络渲染模型的加持下,「招小影」更加真实自然的声音和容貌,具备多场景、多动作及各种微表情的自定义制作,将拟人度提升到与真人无异的水平。

除了形象亲和力强的优势,「招小影」在业务上也是样样精通,既有工作汇总、信息通知等通用技能,又具备专业领域知识和业务自动处理等能力。在岗位上,「招小影」会通过招商局集团内部 IM 和轻应用等用户界面,成为招商员工们的得力帮手,实现数据服务入口(工作汇总 / 服务集中 / 知识管理)的统一。

「观君」的职业身份则更特殊一点。在 2022 北京冬奥会前,「观君」已经为自由式滑雪空中技巧国家集训队工作了三年多,职位是「助理教练」。主要负责的工作内容是辅助运动员、教练员进行日常训练、执教。

图片

在北京冬奥会自由式滑雪女子空中技巧决赛中,徐梦桃成功夺金。幕后的虚拟人教练「观君」,也因此吸引了众人目光。这是人工智能在全球顶级赛事中全程参与训练,并辅助取得金牌战绩的首个案例。

相比于人类裁判,「观君」能够克服高强光复杂的背景、运动员空中停留时间极短、竞赛项目场地限制等几个现实场景存在的难点。观君会针对运动员的每一跳做出专业判断,与国际裁判计分准则保持高度一致,严格判别扣分动作,并对起跳、空中、落地三个阶段的全流程动作进行量化,能够支持运动轨迹、身体姿态、出台角度、高远度等多维度指标分析。

一般来说,运动员穿戴滑雪板从跳台跃起后,要在 15 米高空中做出各种空翻和转体动作。尽管整套动作滞空时间仅 2-3 秒,但「观君」能做到实时分析起跳动作、腾空高度、空中动作难度与完成度、落地稳定性等方面,并在动作完成后立即指出失误。

八年如一日,AI Being 背后的坚持与沉淀

在崔筱盼入职之前,万科主要通过 RPA 机器人流程自动化程序在截止日期前发送邮件,催促员工办理逾期票据。显然,这些机械式推送的邮件很容易被忽略。

而崔筱盼却拥有非常真实的人设,包括姓名、工号、联系方式、生日等信息,甚至可以就办公系统中对同事发来的问题咨询进行「高情商回复」。在万科集团财务部「潜伏」的十个月里,从未有系统那一端的人类员工分辨出来这位财务部同事是个「虚拟人」。

从来没有一位员工像她这样高效,显然在人类的潜意识中,拒绝一位「真实同事」比忽略机器人提醒邮件难得多。据统计,崔筱盼催办预付应收逾期票据核销率高达 91.44%。2021 年底,万科董事局主席郁亮在朋友圈里亲自为崔筱盼颁发了「优秀新人奖」。

小冰公司曾经披露过「崔筱盼」的打造细节。和其他小冰框架虚拟人类一样,崔筱盼的外貌也是通过小冰框架的神经网络渲染技术(Xiaoice Neural Rendering, XNR)生成的。区别于传统计算机图形技术,这种渲染技术通过数据驱动而非物理定律获得渲染函数,其函数一般用深度神经网络通过学习构建。

鉴于「虚拟人」不是平面形象,在外貌之外,如何实现好的动态表现也是关键所在。小冰的深度神经网络渲染技术让数字人的面容、表情、肢体动作等在内的整体自然度大幅度提升。

这种技术的优势,在小冰框架下的其他虚拟人身上得以充分体现。比如《每日经济新闻》的虚拟主播「N 小黑」,在播报时会将双手自然摆放身前,随着播报内容变化,眼睛、嘴唇和口型甚至是眉毛和脸部肌肉也会随之变化。

图片

提到「自动回复」能力,这更是小冰团队的技术优势。毕竟最早的小冰就是微软在 2014 年推出的文字聊天机器人

小冰最初上线的时候相当出圈,不过只能做自然语言处理。好在很多人都主动找小冰聊天,这让小冰积累了大量的聊天数据和应对经验。这些年,人工智能技术在不断迭代,小冰的成长也越来越快,掌握的技能也越来越全面。从自然语言处理出发,小冰慢慢开始涉及计算机语音、视觉,最后做到真正的 AI Being。

作为赋予 AI Being 创造力的重要部分,小冰的幕后团队已布局 AIGC 多年。2017 年,小冰掌握了内容生成技术,应答能力大幅提升,无需从庞大数据库里搜寻答案再回复。这之后,小冰按照同样的规律学会了绘画、作诗、写小说等技能。2019 年,小冰还学会了为广大用户生成虚拟「男朋友」和「女朋友」。

这些前沿的 AIGC 技术,也已经分别走到成熟的商业落地阶段,衍生出文本、声音、图像的产品化阵列,广泛应用于金融、文化、纺织、旅游等垂直领域。在文本方面,小冰金融文本生成产品覆盖约 90% 的机构投资人;在绘画方面,「夏语冰」创作的水墨画是唯一入选去年迪拜世博会中国馆的人工智能绘画作品;在声音方面,由小冰进行词曲创作及歌声生成的各类作品,先后被采用为上海大剧院演出季、成都大运会、世界人工智能大会等重要活动的主题曲,也是今年首届全民阅读大会推广曲集中,唯一入选的人工智能作品。

在 2020 年独立分拆的时候,小冰已经脱胎换骨,不再只是一个对话机器人,而是一个能生成虚拟人的框架,并储备了可以用来模拟人脸、声音的技术。

小冰团队在 2018 年发布的一篇论文中指出:社交聊天机器人需要足够高的智商(IQ)来习得多种技能,才能紧跟用户需求,帮助他们完成指定的任务。更重要的是,AI 还需要足够高的情商(EQ),以满足用户的情感需求,比如情绪感受和社会归属感。IQ 和 EQ 的整合是小冰系统设计的核心。

在那篇论文的最后,还提出了一些问题:纯聊天机器人的打造固然有其难点,那么它最终的意义是什么?这个东西在商业上到底有没有价值?

现在看来,答案不言而喻。受到多重因素的合力推动,即将过去的 2022 年被称为「虚拟人元年」,政策、应用价值、市场需求、资本支出、技术成熟诸多因素都暗示着这一市场的大有可为。

当前,由小冰框架技术提供的 AI Beings 已大量活跃在企业和个人场景中。从几个数据也可以看出:覆盖中国、日本、印度尼西亚等国 6.6 亿在线用户、10 亿台第三方智能设备和 9 亿内容观众,商业客户覆盖全球,其中在智能车机领域渗透率超过 60%。

小冰确实赶上了数字人、虚拟人的「风口」,但偶然的机遇背后总有必然,成功正是来自这么多年来的坚持与沉淀。与此同时,小冰公司也看到了「虚拟员工」远超虚拟偶像格局的更多可能性。

关于最新的 10 亿元融资,小冰公司仍然毫不犹豫地将其投入到 AI Being 小冰框架技术研发中去。小冰公司 CEO 李笛表示:「人工智能基础研究是一场厚积薄发的长跑。从 2013 年情感计算立项至今,长达九年的框架技术积累,让小冰的商业化进程得以越来越从容。我们很高兴看到 AI Being 正在进入加速普及的时代。然而今天的创新成就,与未来相比仍是不值一提的。这正是创新最激动人心的地方。我们将加大研发投入,持续探索未来。」

产业虚拟员工小冰
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

计算机图形技术

图像数据处理、计算机图像(英语:Computer Graphics)是指用计算机所创造的图形。更具体的说,就是在计算机上用专门的软件和硬件用来表现和控制图像数据。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

情感计算技术

情感计算(也被称为人工情感智能或情感AI)是基于系统和设备的研究和开发来识别、理解、处理和模拟人的情感。它是一个跨学科领域,涉及计算机科学、心理学和认知科学(cognitive science)。在计算机领域,1995年Rosalind Picard 首次提出affective computing。研究的目的是使得情感能够模拟和计算。这个技术也可以让机器人能够理解人类的情绪状态,并且适应它们的行为,对这些情绪做出适当的反应。这是一个日渐兴起的兴欣领域

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

文本生成技术

文本生成是生成文本的任务,其目的是使人类书写文本难以区分。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

暂无评论
暂无评论~