Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

ScienceAI发展前瞻:AI与科学计算的双向影响

「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI技术」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。

本文为华为昇腾开源生态总监黄之鹏于「驱动未来的AI技术」系列主题,「AI for Science」专场的分享内容节选。点击进入「机器之心Pro」,查看更多优质内容。

ScienceAI发展前瞻--AI与科学计算的双向影响

黄之鹏先从工程角度分享了AI与科学计算或者神经科学发展双向影响。他表示,随着AI+科学计算的紧密结合,很多典型应用领域取得了突破,随之涌现出AlphaFold2、Google MetNet、DeepLabV3等关键词。

从工程实现的角度来看,为什么会出现 AI 与科学计算结合呢?我们发现,在传统的科学计算数值方法中,有一定的瓶颈,比如我们会遇到很多的高维微分方程求解,计算量大;复杂度非常高,而且它的边界条件非常复杂。AI出现后,用AI可以突破之前的很多瓶颈,比如非线性拟合,不需要求解高维方程;我们用神经网络模拟,也不需要处理边界条件。但是,AI对科学计算也带来了很多挑战,如:

• 高阶微分:编程表达困难;计算量大(计算量随阶数指数增长)

• 分布式计算:超大集群分布式计算,编程难度大,问题定位困难

• 高精度计算:传统深度学习计算中的FP16计算导致数值溢出,需要支持FP32/64

为什么AlphaFold2破解蛋白质分子折叠取得超过 90 分的成绩如此重要?黄之鹏谈道,蛋白质结构的预测长期以来是一个非常困难的问题。蛋白质主要有由氨基酸构成,氨基酸是所有的生物最基础的一个组成部分。蛋白质实际上就是一个氨基酸链。它折叠成的3D 结构,表征了某一类的蛋白质。之前,我们能做的蛋白质折叠预测,数量级非常非常小。做蛋白质折叠,从整体上来说,是一个从序列到3D 结构的预测。从序列到 3D 结构支持有一个唯一性存假说。通常来说,一定的蛋白质的序列能够映射到一定的3D 结构上面。科学家发现,通过预测一个氨基酸序列形成的3D 结构,可以预测出来很多的相关蛋白质特性,尤其是误折叠,就是我们说的疾病。

图片

 AlphaFold2主要针对的是同源的蛋白质数量,如果蛋白质数量足够多的话,基于晶体衍射形成的数据集所进行处理的结果非常好。当然,我们在相关的研究中也会发现,比如说我们通过核磁共振或者说通过冷冻电镜,我们可以发现氨基酸序列并不是总是 1 比 1 很严格的能映射到3D结构上。所以说AlphaFold2也是在一定的限制条件下的产物。但即便如此,它仍然是我们 AI 和科技计算结合的一个非常历史性的突破。

谈及对科学计算的影响,黄之鹏表示,其实AlphaFold2的影响其实是非常大的。比如 state of AI 的报告里面提到,除了 DeepMind团队之外,Baker lab 基本上也达到了AlphaFold2能够预测的这个精度。我也是从一篇论文里面看到 AlphaForl2 带来的启示,它彰显的是一个对深度学习或者说深度学习里面更核心的深度学习框架的能力的一个需求。比如attention机制带来的是对 launange dependency 的能力;另外,端到端也是我们现在发现所有的 AI +科学计算,实际在工程落地的时候,很多专家都会提到一个能力。

随后,黄之鹏分享了MindSpore的一系列进展。他表示,MindSpore是华为在去年开源的全新全场景 AI 框架。我们也在去年的 1.5 版本发布了非常多的科学计算套件,包括电磁仿真、分子模拟套件,MindSpore同我们的前辈,像 tensorflow PyTorch 这些相比,MindSpore一个最大的特点就是它强调大规模集群的自动化并行能力,全场景的接送,而且支持科学计算。同时,我们在短短的两年时间内成为了国内热度非常高的一个社区。我们与科研结合,产出了很多非常有特色的案例,包括鹏程盘古的大模型,以及我们跟深圳湾实验室合作分子动力学的相关的研究。

当谈到“Transformer是否会成为以后深度学习的统一架构”这一近期比较火热的话题。黄之鹏表示:对于这个问题,支持的一方,会提出这样的观点:language或者说语言表征会最终成为整个神经网络的统一的一种表达形式。但是我们也看到也有一种可能:随着我们对哺乳动物和人类的神经系统本身的深入研究,也有可能给我们带来一些颠覆现有神经网络架构的 AI 未来发展的可能。因为我们现有的神经网络其实还是基于几十年,数十年前我们尝试对人类的神经网络模拟进行计算模拟。但其实最近很多对神经系统研究,都发现人类的神经系统其实并不是一个大一统的架构。神经科学的进一步发展有可能反过来影响AI 对于神经网络的构造,并且有可能会给AI带来一些新的发展。所以我认为 AI 和科学计算是一个双向影响的过程。


入门
暂无评论
暂无评论~