“在未来的世界里,真实世界里的每个东西都会有一个芯片,整个世界都将被数字化,一切都将在虚拟数字世界里有一个复制品,像是现实世界的一面镜子。” 这是《失控》作者凯文·凯利对互联网之后未来三十年科技发展趋势的预测。也许人类暂时还无法体会这样一个充满科幻色彩的“镜像世界”,但2021年以来“虚拟人”呈现出的火热态势,似乎宣告着“镜像的人”、甚至“另一个你”正在到来。
最近,韩国人工智能公司Pulse 9推出了一个完全由AI打造的韩国流行音乐女团Eternity,共包含11位AI成员,由该公司研发的“Deep Real”技术打造。虽然网友纷纷吐槽“效果一般”“抠图感爆表”,但这个特殊的“虚拟女团”还是引起了大家的热捧,其单曲MV“I’m Real”在YouTube上的播放量达到67万。
“虚拟人女团”Eternity
今年6月,由清华大学计算机系、北京智源研究院、智谱AI和小冰公司联合“培养”的国内首个原创“虚拟学生”华智冰入学清华,该事件引发社会热议。其背后依托的是全球最大的超大规模智能模型“悟道2.0”和人工智能小冰框架。
华智冰形象。她的脸部、声音都通过人工智能模型生成。
时间再往前推,2019年央视网络春晚舞台上,撒贝宁虚拟孪生兄弟“小小撒”登台,拿起话筒掌控现场,妙语连珠,以至于一旁的小撒“委屈”插话:“能给我说一句吗?”据介绍,在AI技术的基础上打造这样一个小小撒,只需撒贝宁等主持人的面部扫描和半小时的录音数据,即可生成形象和声音模型。
事实上,近些年,虚拟歌手、虚拟主播、虚拟老师、虚拟客服、虚拟导游……各种虚拟角色层出不穷地出现在社会大众生活中,腾讯、搜狗、三星……国内外科技巨头纷纷入局“造人”。2021年初,百度研究院发布了2021年十大科技趋势预测,提到虚拟人将大批量出现,业界认为2021年是“虚拟人”元年。面对强劲而来的“虚拟人”,我们不禁疑惑,“虚拟人”从何而来?距离我们的生活到底有多远?又将带领人类生活去往何地?
“虚拟人”不同于“虚拟偶像”和“数字人”,是人工智能的前沿表现
如今层出不穷的“虚拟人”总是与人工智能密不可分,那些“炙手可热”的“虚拟人”背后也总是离不开人工智能技术的加持。但很多人不知道,“虚拟人”在诞生之初并不是人工智能的“代言人”,而是适应影视娱乐需求、基于动画和3D技术而产生。
80年代,日本动画《超时空要塞》出现了虚拟歌姬林明美,同时代由英国人创作的虚拟人Max Headroom也拍摄了多部电影和广告片。此后,在影视娱乐业,“虚拟人”的发展分化为两条路径,二次元“虚拟偶像”和 “数字人”。
“虚拟偶像”中最成功、最具代表性的要属“初音未来”。2007年,被称为“虚拟偶像帝国开创者”的初音未来随着一款音乐软件诞生,她穿着短裙,有着两条葱绿色马尾,是一个形象软萌的“二次元少女”。这款音乐软件仅仅两周就卖出了3500多份,一年后更是卖到了4.2万份。2009年,初音未来迎来了人生巅峰,在东京举办了2周年演唱会,成为世界上第一个使用全息投影技术举办演唱会的虚拟偶像。
初音未来之后,更多“虚拟偶像”在全球不同地方纷纷崛起。2012年,上海禾念采用与初音未来类似的运营手法推出了虚拟歌手洛天依,成为中国最早实现盈利的“虚拟偶像”。
不同于以语音合成程序和全息投影技术为基础的“虚拟偶像”,“数字人”主要用于影视特效,简单来说,“数字人”就是逼真的3D人体模型。3D模型可以理解为游戏或电影中经常看到的数字木偶假人,“数字人”则是一个复杂的3D人体模型,它利用最新开发的高端功能在外观(皮肤着色或毛发梳理上)和运动(准确的绑定和动画)方面产生逼真的效果。
“虚拟人”由“虚拟偶像”和“数字人”发展而来,但 “虚拟偶像”与“数字人”却并不等同于“虚拟人”。近几年,得益于深度学习算法的突破,“虚拟人”逐渐与其他相近概念区分开来,步入自己的发展轨道。根据中国人工智能产业发展联盟和中关村数智人工智能产业联盟数字人工作委员会发布的《2020年虚拟数字人发展白皮书》,人工智能成为“虚拟人”不可分割的工具,智能驱动成为“虚拟人”最显著的特点。
腾讯AI Lab推出的唱作人“艾灵”
从初音未来、洛天依与“艾灵”的对比中能够更直观地理解智能驱动的“虚拟人”。初音未来等“虚拟偶像”实质上并不是人工智能的产物,而是依托于“机器合成+人工调教”模式,如果缺乏了人工调教的过程,虚拟歌姬的演唱只是一堆电子音的集合,不会有富有感情的歌唱技巧。在贴吧中,也曾有网友吐槽“洛天依很难调教,因为需要一个音一个音去修改”。对比之下,腾讯AI Lab在2020年推出基于DurIAN声学模型的唱作人“艾灵”,以AI取代人工调教的艰难过程,让“艾灵”直接学会人类的歌唱技巧。
人工智能驱动了“虚拟人”的发展,“虚拟人”也成为了人工智能技术的前沿表现形式。正如产业时评人张书乐所说,“虚拟人”将人工智能人格化,是一种形象生动、易被大众感知且具备话题性的表现形式,这对于人工智能公司来说,是展现自己技术实力的优质工具。同时,“虚拟人”也可以作为品牌形象展示,并且人设会随着技术迭代而不断丰满,其可能展示的技术实力也比单纯的营销路数更强,比如小冰创作诗歌、小说,参与一系列人机互动之类,让人感受到深度学习的进步,也标志着人工智能从工业化层面进阶到“虚拟人”.
“虚拟人”的影视造梦路越走越窄
但受困于技术发展与应用场景的局限,现阶段“虚拟人”的生存之道仍在探索中。由于“虚拟人”由早期影视娱乐业的“虚拟偶像”、“数字人”叠加人工智能技术而诞生,在致力于为观众“造梦”的目标上,影视行业和“虚拟人”也颇为一致,因此最先对“虚拟人”敞开怀抱的是影视娱乐业。
2015年,台北小巨蛋举办《如果能许一个愿望·邓丽君20周年虚拟人纪念演唱会》,虚拟“邓丽君”在台上唱着《甜蜜蜜》,台下7000名真实世界中的歌迷听得如痴如醉,作为表演嘉宾的费玉清还与邓丽君“同台”对唱。这场给舆论带来极大震动的演唱会,依靠的是数字王国的虚拟人像技术。
数字王国推出虚拟“邓丽君”演唱会
自此以后,娱乐、特效、人工智能行业都盯上了“虚拟人”的 “偶像生意”。2019年网络春晚,虚拟主持人“小小撒”的出场让观众高呼“最时髦的网络春晚”,“小小撒”原名叫做湃(PAI),是美国AI公司偶邦(ObEN)研发的一款新型人工智能主持人。根据偶邦创始人介绍,虚拟主持人可以通过视觉和声音两方面来进行自我学习,更立体、更真实地还原主持人。
2020年11月,韩国最大的娱乐公司SM娱乐推出女团Aespa,这是韩国首个以真实和虚拟偶像为主角的流行组合。组合包括四个人类成员和他们相应的AI化身。SM公司发言人宣称计划开发这样的人工智能技术,旨在用于能与粉丝进行更加个性化的互动,而这些互动人类可能无法完成。他举了一个例子,虚拟偶像可以拜访粉丝的家,在他们工作时陪伴他们,甚至成为粉丝的“朋友”。
魔珐科技推出国风虚拟KOL –翎
与韩国的造星模式不同,中国试图为“虚拟人”注入更多文化因素。2021年1月,国风虚拟KOL –翎登上央视综艺《上线吧!华彩少年》, 并现场表演了一首经典京剧选段《天女散花》, 翎的声音来自京剧梅派第三代传人,在与众多评委的互动中,翎阐述了自己对于国粹以及中国传统文化的深度理解。翎由魔珐科技与次世文化联手打造,结合了魔珐科技原创人工智能技术在虚拟人和虚拟内容智能化制作方面的优势,以及次世文化在跨次元内容开发及运营领域的精准把控。出道以来,翎以独特的形象和极具风格化的内容吸引了众多用户的喜爱,并与众多知名品牌如特斯拉、奈雪的茶等进行了跨界合作。
“虚拟人”在影视娱乐行业中看似拥有巨大流量,但大多数虚拟偶像的发展也仅止步于“出道”一瞬间的吸睛,譬如女团Aespa出道之后的4个月中,虚拟分身们只在出道MV中出现过,距离成为陪伴粉丝的“朋友”,似乎还有很长的路要走。
这条路也是虚拟偶像的商业变现之路,成为困扰行业发展的难题,例如上海禾念旗下众多的虚拟人IP中仅有洛天依等少数几个能够保持盈利。即便是虚拟“邓丽君”演唱会取得万人空巷的成功,但持续变现能力依然困扰着数字王国,究其原因,“虚拟人”尚未迎来底层技术的真正质变。
“虚拟人”进入各行各业,技术突破路径越发清晰
虽然技术尚未突破,但整个市场对于“虚拟人”的期待与日俱增,商业落地并未受到实质性影响,各行各业都在寻求更加丰富的落地场景。在传统的娱乐场景中,“虚拟人”已经不再固守演唱会等变现思路,转而主动寻求与旅游、文创等其他场景深度融合,虚拟“邓丽君”与重庆洪崖洞景区合作,推出的全息MR互动音乐秀《寻找邓丽君》,成为源源不断吸引旅游者和提升游客好感度的地标式节目。
在金融领域,“虚拟人”似乎也找到了用武之地。2019年7月,百度智能云与浦发银行联合打造虚拟员工“小浦”,表现为屏幕中的3D形态,其外形,表情、动作形态逼真,语调、语气、说话风格自然流畅,还能通过多感官实时关注和识别用户的情绪、表情、语气,根据对话内容及时作出反应,并通过深度学习技术具备各行业专业知识。 作为实习生,“小浦”跟从多年荣获浦发最佳理财经理的师傅们学习,5个月后成为浦发银行正式员工,在浦发银行的部分网点进行轮岗。
2019百度AI开发者大会现场,李彦宏与数字人“小浦”互动
中国信通院云计算与大数据研究所工程师颜媚指出,“虚拟人”是新型的人机交互应用,目前产业界各方都在积极探索相关的应用场景,突出的代表包括金融领域的智能客服、电商领域的直播带货、电信领域的视频问答、教育领域的虚拟教师,以及传媒领域的虚拟主播等。总体来看,具有两个应用方向:一是降本增效,一是提升用户感知与体验。
但要实现这一目标,“虚拟人”必须实现技术突破,接近甚至超越人类智能水平,针对这一目标,业内在技术发展路径方面已经有了统一的方向。人工智能的核心之一是学习,当前普通机器学习模型的训练过程将大量数据通过算法进行训练,训练成的模型无法改变,如果应用场景稍有变化的话,就会表现的“不够智能”。而人学习基础知识之后,在各种场景下应用,再接受新的反馈,形成不断学习的过程,基于此方向预训练大模型“悟道”正在试图给出答案。
今年6月,依托“悟道2.0”诞生的中国首个原创虚拟学生“华智冰”发布,华智冰导师、清华大学计算机系教授唐杰表示,“悟道2.0”是“数据”和“知识”双轮驱动,旨在让机器能够像人一样思考,实现超越图灵测试的机器认知能力。
“悟道”在打造数据驱动的大模型时仿照人的学习过程,以大量的自然语言、图片等多模态数据用来训练,其参数规模达到1.75万亿,是目前中国首个、全球最大的万亿级模型;之后通过以知识图谱技术为核心的知识驱动系统,以及逻辑推理计算引擎以任务为导向让“华智冰”的能力发挥出来,让它像人一样有思考的能力。
从1.0进阶到2.0,“悟道”的升级表现为知识的融入、数据的增加、模型的规模扩大、能力的提升、应用的场景拓展,之后的3.0版本会再上一个台阶,最终将“华智冰”打造成为一款不仅可以作诗作曲,生成图画,还将具有一定的推理和情感交互能力,同时拥有持续学习能力的“虚拟人”。
可以预见,“虚拟人”的成长路径即凭借超大规模的多模态数据,配合更加完整的知识驱动系统与逻辑推理计算引擎,“真正虚拟人”即将到来。
“虚拟人”是对人类能力的全方位延伸
关于“虚拟人”对人类生活的价值,奇点大学校长、谷歌工程总监、畅销书《人工智能的未来》作者雷·库兹韦尔曾在一篇文章中写道:数千年前,人类无法摘到高处树枝上的水果,因此发明出了能够延伸人类所及范围的工具;后来,人类又创造出了能够增强肌肉力量的工具;今天,人类只需要敲几下键盘,便可以访问人类所有的现有知识。当代人工智能不再只是属于少数几个富有公司或政府组织的特权,而是数十亿普通人的权利,人类延伸了其身体和精神的所及范围,这种延伸将继续发展,直到人类级别的人工智能成为现实。
当“虚拟人”成为现实时,人类的生产力将跨越到一个新的阶段。人类借助工具对自身力量的延伸,将从肢体所及范围、肌肉力量等物理层面跨越到精神层面。因此,从这个角度出发,“虚拟人”的诞生和发展或许具有“划技术时代”的重要价值。这听起来很遥远,其实现实中已经出现一些案例,能够让我们一窥由“虚拟人”揭开的未来。
NEON不会每次微笑模样都一模一样。
在CES 2020上,韩国三星STAR Labs正式展出了人工智人(Artificial Human)项目NEON,与以往“虚拟人”不同的是,它能够像真人一样快速响应对话,做出真实的表情神态。例如微笑这样的表情,NEON不会每次微笑模样都一模一样,因为它可以构建机器学习模型,在对人物原始声音、表情等数据进行捕捉并学习之后,形成像人脑一样的长期记忆......
想象一下,未来的某一天,早上8点起床,虚拟助理已经帮你搭配好了早餐,并在你享用早餐时向你介绍今日安排和社交信息;9点,你来到办公室,将制定好的方案交给虚拟同事,模拟执行,预估方案的可行性和效果;中午12点,你走进餐厅,虚拟服务员为你提供点餐服务;晚上8点,在虚拟教练的指导下,你足不出户就完成了一套专业健身训练。更不可思议的是,你也可以拥有自己的虚拟分身,出差时,你的虚拟分身会帮你照顾好家庭,为孩子准备一如三餐、辅导家庭作业……
这样的“虚拟人”未来世界,你期待吗?
(撰稿:宋佳)
(注:本文图片均来自于互联网,如涉侵权,立即删除。)