百度大脑升级至 7.0,以融合创新、降低门槛为显著特点,通过百度智能云加速产业落地爆发。
百度首席技术官王海峰只用一句:「百度大脑,请帮我生成一个像主持人一样的数字人」,一个 AI 智能体就这样被定义完成了。
在今天上午百度世界大会的现场,百度不仅推出了新一代人工智能芯片昆仑芯 2、Aopllo「汽车机器人」,介绍了百度为中国跳水队打造的「3D+AI」跳水辅助训练系统、百度智能云加速产业智能化的四大案例,还宣布与中国航天进行合作。这些 AI 应用背后的核心技术底座——百度大脑也实现了全面升级。「我们看到、感受到的这些变化,背后的技术都来源于百度大脑,」王海峰说道。「以人工智能等为代表的新一代信息技术正在驱动新一轮科技革命和产业变革。在新的发展阶段,AI 技术越来越复杂,融合创新正在成为新常态;同时,随着人工智能技术在各行业的渗透,面向不同应用场景,降低门槛也变得越来越重要。」在今天的大会上,王海峰正式发布全新升级的百度大脑 7.0,具备「融合创新」和「降低门槛」两大显著特点,融合创新使 AI 能力越来越强,降低门槛让应用 AI 技术越来越容易。怎样理解融合创新?百度认为,这其中包括知识与深度学习技术融合、跨模态多技术融合、技术与场景融合、软硬一体融合四个方面。其实早在几年前,王海峰就曾提出过融合创新这样的观点,如今这一思想体现在了最新的百度大脑 7.0 上。会上,祝融号数字人与主持人流畅对话,不仅准确回答了「火星上能否种土豆」的问题,还以「登火星」为题作了一首诗。随后,王海峰又用一句话生成了一个数字人形象,并为他换上了航天服,让他跟祝融号数字人做朋友。这离不开「知识与深度学习的融合创新」,最典型的就是百度发布「知识增强大模型」, 把大规模知识图谱和海量的数据同时给到模型,进行联合训练。7 月,百度刚刚升级的「知识增强大模型」 ERNIE 3.0 首次在百亿级参数预训练模型中引入大规模知识图谱,成为了 AI 领域的一次重要事件。以 GPT-3、XLNet 为代表的预训练模型是人工智能技术最近的发展方向,其强大的通用性和卓越的迁移能力掀起了预训练模型向大规模参数化发展的浪潮。然而,此前的大规模预训练模型主要依赖纯文本学习,缺乏大规模知识指导的能力学习,模型能力存在一定局限。ERNIE 3.0 进一步挖掘了大规模预训练模型的潜力,基于深度学习平台飞桨的分布式训练优势,首次在百亿级预训练模型中引入大规模知识图谱,提出了海量无监督文本与大规模知识图谱的平行预训练方法,大幅提升了对于知识的记忆和推理能力。新版 ERNIE 一举刷新了 54 个中文 NLP 任务基准, 还同时具备超强的语言理解能力以及写小说、写歌词、生成诗歌、对联等文学创作能力,也能完成情感分析、阅读理解、数学运算、机器翻译等任务,做得都比原来业内最佳水平还要好。祝融号数字人能够完成多种任务,应用了知识与深度学习的融合。数字人的形象和生成,则需要跨模态多技术的融合。在世界大会现场,王海峰展示了一句话生成数字人能力,打造了一个懂你的 3D 形象设计师。这种方法融合了百度大脑在语音识别、自然语言处理、知识图谱和增强现实等领域的能力,又做到了易于使用。由于虚拟智能助手已经登陆百度 Apollo 系统,一句话生成形象的能力正在让汽车虚拟助手的生成变得更加高效,也更加个性化。从应用角度来看,不同领域存在不同挑战,AI 技术需要深入到实际应用场景中,与场景融合创新。百度智能云在水务、电力、城市管理、制造等领域的产业应用,是技术与场景融合创新的成果。在百度世界大会上,王海峰展示的同声传译系统,是机器翻译、语音技术与同声传译场景融合,实现了高质量、低延迟的同传效果。百度大脑 7.0 的融合创新中,还有一项非常重要的 「软硬一体融合创新」。百度自主研制的 AI 芯片百度昆仑,使得 AI 模型计算效率更高、应用效果更好;针对远场语音交互研制的百度鸿鹄芯片,让人与汽车、智能家居等设备的语音交互更便捷、更流畅;同时百度也与合作伙伴一起构建硬件生态,比如飞桨平台目前已经适配 30 多款芯片。这就很考验造芯能力了,百度同样给出了自己的答卷。这一波的 AI 浪潮是由 GPU 算力提升引发的,所有 AI 能力的底层都有芯片的功劳,在人工智能芯片方面,百度也实现了新的突破。在百度世界大会上,百度创始人、董事长兼 CEO 李彦宏宣布第二代自研 AI 芯片「昆仑芯 2」正式量产。百度昆仑是百度自研的云端全功能 AI 芯片,2018 年发布第一代产品,至今在百度业务中已部署超过 2 万片,并服务于超过 50 家客户。到 2021 年 6 月,昆仑芯片又实现了独立融资,估值达到 130 亿元。昆仑芯 2 性能、通用性、易用性较 1 代产品都有显著增强,证明了百度在芯片设计和软硬件整合方面的能力。该芯片采用 7nm 制程,搭载了自研的第二代 XPU 架构,相比一代性能提升 2-3 倍,整数精度(INT8)算力达到 256 TeraOPS,最大功耗 120W。昆仑芯 2 的设计使产品可以适用云、端、边等多场景,可应用于互联网核心算法、智慧城市、智慧工业等领域。更重要的是,昆仑芯 AI 芯片除了拥有自研 XPU 架构及多项自主设计,针对语音、自然语言处理、图像等 AI 技术专门优化,支持飞桨等深度学习框架,可以让 AI 模型计算效率更高。昆仑还与飞腾等多款国产通用处理器,麒麟等多款国产操作系统以及百度自研的飞桨深度学习框架完成了端到端的适配,实现了软硬一体的全栈国产 AI 能力。百度的造芯历程,实际上是从 2011 年年开始的,昆仑芯 2 的十年磨一剑,意味着百度从芯片到深度学习框架、核心算法、平台、生态的 AI 全栈技术布局实现了更高程度的整合。AI 平台不仅要包含最先进技术的实现,还要能让人们以最简便的方式应用。百度大脑 7.0 升级的另一个重点是降低门槛。飞桨是百度自研的深度学习开源开放平台,也是百度大脑的核心基座。通过飞桨,数百万开发者不再需要从头开始编写 AI 算法的代码,即可高效进行技术创新并应用于业务。机器学习门槛大幅降低,正在加快人工智能应用的多样化和规模化。今年 5 月,飞桨升级到了 2.1 版,在训练速度、动态图功能、自定义算子、模型推理部署等方面有了全面升级。面对各行业众多场景需求,飞桨企业版采用了双平台的形式——EasyDL 零门槛 AI 开发平台和 BML 全功能 AI 开发平台,让不够精通人工智能算法的企业开发者能够像使用家电一样简单上手,专注于业务场景和创新。EasyDL 让开发过程进一步简化,实现了端到端全流程的自动化,让开发者们在极简的用户体验下就能获得高精度的模型效果。根据 IDC 今年上半年的报告,百度已成为国内深度学习平台市场综合份额第一。在世界大会上,百度公布了一组数字:目前,飞桨已累计拥有 360 多万开发者,他们来自于各行各业,通过飞桨平台,人们已经开发了超过 40 万个 AI 模型,累计服务了 13 万企事业单位,在各行各业都有飞桨在发挥作用。百度还宣布,这款深度学习框架最近已进入传统农业。今天的世界大会上,百度还带来了很多智能化转型的成功案例。百度的智慧工厂解决方案和智能云服务,已经为很多企业的智能化转型打开了道路:为做好智能化治理水务工作,泉州水务集团与百度智能云达成战略合作实现了水处理厂的自动化和精简化,改善了居民的用水流程,覆盖当地 800 万人。在智能交通云服务领域,百度 ACE 智能交通解决方案在场景及落地城市上不断扩展。2021 年 6 月,百度 ACE 智能交通签署千万订单的覆盖城市增加至 20 个,是去年同期的 4 倍。百度智能云还与吉利控股签署战略了合作伙伴协议,开始提供私有云解决方案等云应用。虽然成果已经显现,但产业智能化的过程还需要更多 AI 人才。应用百度飞桨的 360 万开发者们,既有企业中的工程师,也有高校学生和老师。王海峰表示:「人才培养是一件需要长期投入的事,我们希望通过百度松果学堂为我国 AI 人才培养做出一点贡献。」在提出「五年培养 500 万 AI 人才」计划之后,百度本次宣布正式成立百度松果学堂,这是一个面向产业实践的 AI 人才培养平台,将通过基础课程、技术竞赛、产业实训、科研基金等资源让人们更便捷地获取 AI 知识。一边是降低门槛,一边是培养人才,百度正通过智能云加速 AI 技术落地爆发。2006 年,百度办了第一届世界大会,到今天已是第十五年。不同于前沿研究「大力出奇迹」的方法论,AI 技术的落地需要更高的效率,更符合实际的定位。在这方面,长期在 AI 赛道前行,同时拥有先进技术的百度处在领先位置。「让每一个人都感受到它带来的改变,这就是技术的价值。」李彦宏说道。从图像分辨超越人类水平,打开深度学习视觉处理应用大门的 ResNet,到登上自然杂志,深远影响生物信息学领域的 AlphaFold,再到推动大规模预训练模型风潮,引领通用 AI 模型发展的 GPT-3…… 人工智能应用的方向越来越广,一面又正在面临空前复杂的问题。这需要 AI 平台既能帮助前沿技术突破,又能降低开发者应用门槛。