2021/12/28 14:53

萝卜皮报道

达摩院2022十大科技趋势发布：人工智能将催生科研新范式

阿里达摩院发布了 2022 十大科技趋势，其中 AI for Science 占据了卷首位置。

一个世纪以来，数字科技的演进推动了人类的技术进步与产业发展。我们当前正在经历数字科技最快发展的阶段，数字化、网络化、智能化让数字世界与物理世界的融合与协同更加紧密。

近日，阿里达摩院发布了 2022 十大科技趋势，其中 AI for Science 占据了卷首位置。

实验科学和理论科学是数百年来科学界的两大基础范式，而人工智能正在催生新的科研范式。机器学习能够处理多维、多模态的海量数据，解决复杂场景下的科学难题，带领科学探索抵达过去无法触及的新领域。人工智能不仅将加速科研流程，还将帮助发现新的科学规律。

预计未来三年，人工智能将在应用科学中得到普遍应用，在部分基础科学中开始成为科学家的生产工具。

趋势解读

科学研究是在星辰大海里探索未知，科学发现漫长而偶然，重大突破仰赖大科学家的贡献，如牛顿、爱因斯坦、杨振宁等，尽管众多科学家不懈投入，科学发展的速度仍受到一定限制。

计算机科学改变科研的路径是从下游逐渐走向上游。起初计算机主要用来做实验数据的分析与归纳。后来科学计算改变了科学实验的方式，人工智能结合高性能计算，在实验成本与难度较高的领域开始用计算机进行实验的模拟，验证科学家的假设，加速科研成果的产出，如核能实验的数字反应堆，能够降低实验成本、提高安全性、减少核废料产生。

近年，人工智能被证明能做科学规律发现，不仅在应用科学领域，也能在基础科学领域发挥作用，如 DeepMind 使用人工智能来帮助证明或提出新的数学定理，辅助数学家形成对复杂数学的直觉。

人工智能将成为科学家继计算机之后的新生产工具，一是带来效率的显著提升，人工智能将伴随科研的全流程，从假设、实验到归纳总结，让科学家不需要像过去一样十年寒窗才能产出科学成果，而是能在一生中保持高产；二是让科学不再依赖少数天才，人工智能对科学研究产生猜想，让科学家就其中有意义有价值的部分进行实验与证明，让更多人能够参与到科学研究中。

人工智能在各科研领域中的应用节奏将有所区别，在数字化程度高、数据积累好、问题已经被清晰定义的领域中将推进地更快，如生命科学领域，AlphaFold2 运用生命科学积累的大量数据，通过基因序列预测蛋白质结构，对泛生命科学领域产生了深远的影响。

另一方面，在复杂性高、变量因子多的领域，人脑难以归纳总结，机器学习可发挥优势在海量多维的数据中找到科学规律，如流体力学等。

人工智能与科研深度结合仍然需要解决三个挑战，一是人机交互问题，人工智能与科学家在科研流程上的协作机制与分工需要更加明确，形成紧密的互动关系；二是人工智能的可解释性，科学家需要明确的因果关系来形成科学理论，人工智能需要更容易被理解，以建立科学与人工智能之间的信任关系；三是交叉学科人才，专业领域科学家与人工智能专家的相互理解程度低，彼此互相促进的障碍仍然较高。

达摩院预测在未来的三年内，人工智能技术在应用科学中将得到普遍应用，在部分基础科学中开始成为研究工具。

专家观点

AI 领域内的相关专家分别就此事发表了各自的观点。

中国科学院院士北京大学、普林斯顿大学教授鄂维南表示：

数百年来，以数据驱动的开普勒范式和以第一性原理驱动的牛顿范式是科学研究的两大基本范式。当下正在蓬勃兴起的 AI for Science 有可能促使两种既有范式的深度融合，激发一场新的科学革命。《达摩院2022十大科技趋势》将AI for Science列为重要趋势，无疑是看到了人工智能和传统科研结合带来的巨大潜能。我希望它能帮助推动更多科研工作者投身其中，加速这场科学革命的进程。

AI for Science 带来的不仅仅是几个点上的突破，而是科研方法的全面改变。要适应这样一个新的环境，科学家们需要更深入地了解 AI，才有可能用好 AI。企业积累了大量AI研发能力和资源。它们不仅可以提供学界所急缺的计算资源，还能够帮助打造基础科研工具。无疑，学界和业界需要更多协作，秉持开源开放的精神，消除门户之见，打造 AI for Science 的科研共同体。

达摩院十大科技趋势或许就是这种努力之一。我期待达摩院牵头的这种努力，能够加快信息科学和传统科学的深度融合。也期待 AI for Science 不只是一个新的浪潮，而是一个全新的科学时代。

浙江大学人工智能研究所所长吴飞表示：

我认为人工智能一定会成为科学家的工具，但我希望还不要局限于此。

我们正处于一个数据密集型计算范式的年代。我们有海量的数据，科学家们可以从海量的这个数据里面，应用自己方法论，进行科学探索。而运用方法论来进行科学发现和科学探索，一定是基于人工智能，所以说人工智能一定会成为科学家的工具。

为什么我又说不希望仅只局限于此呢？工具背后是人工智能的一种可计算思维的一种渗透，所以我希望科学家在使用工具的过程里，能够形成以一个以设计构造、计算为核心的计算思维。

比如说像 AlphaFold，这个伟大研究成果的产生，不仅仅只是利用了深度神经网络作为工具，而是不同学科的科学家汇聚在一起。它先去设计了一条明确的可计算的思路，来解决从氨基酸序列到蛋白质三维空间结构预测。

所以说，我们需要形成计算思维来进行科学探索，同时恰到好处地应用人工智能这个工具，就能开创科学更加崭新的未来。AI for Science是一个充满着光辉前途的人工智能的趋势。

阿里达摩院城市大脑实验室负责人华先胜表示：

目前 AI for Science 这个方向已经有可圈点的突破，但主要还是比较点状的一些结果，包括分子生物学、量子力学等，还没有形成大面积的成果，仍然有很大的突破空间。

用 AI 去助力科研是基于两点，一个是基于数据、一个是基于计算。因为我们要在数据和算力的基础上形成AI能力。所以如果这个学科有比较好的数据、比较多的数据、比较丰富的数据，以及它的问题是需要大规模计算相关的一些问题，可能是比较快地容易取得突破的地方。比如像分子生物学，还有天文学、地理科学、大气科学，这些都有大量数据，问题又非常复杂，需要强大的计算。这里可能能够利用一些AI的能力，能够更快取得一些突破。

从本质上来讲，AI for Science 和 AI for Industry 差别不大，AI 也是作为推动领域发展的一个工具。只是这个领域有点不一样，它的门槛比较高，因为是科学家要做的事情，不是一个普通人、一般的技术工作人可以做的事情。但是从本质上来讲，也是这个领域因为有了数据，可以设计算法去挖掘数据中的“玄机”，去解决这个领域的问题。

今天人工智能技术又往前走了一大步，可以让计算助力科研走向智能助力科研，智能会使科学研究的方法带来一些变化。其带来的效果应该和产业界的是可以类比的，就是能够让科研的效率提升，成果的产出能够更多，甚至能从手工作坊的方式变成批量生产。当然这个很不容易，但是可能有这样的一个趋势。

对于科学研究而言，从这种小概率事件有可能能够变成一个概率比较大一点的事件，变得更科学，而不是随机性特别大的，能够有更多确定性。这是 AI for Science 的意义所在，当然 still a long way to go。

我们AI在其他领域已经磨合了近十年的时间，在 Science 是刚刚开始，有一些点状的技术，不外乎两件事情。

第一件是 AI 专家要去了解科学问题，这个门槛比较高。

第二件是科学家要去了解 AI 的原理，知道它什么是能的，什么是不能的，它有什么样的优势。

这个倒不是说一定我们只用已有的 AI 的能力去解决这个科研问题，也有可能是在 AI 专家和科学家协作的过程当中去研发出更好的 AI 的能力，去解决对应的科学问题，这个跟 AI for Industry 也是一样的进程。我们很多的 AI 技术也是在解决对应的产业的问题过程当中产生出来的。所以两方面要合在一起去解问题。只是它有不同的地方，科学的门槛本相对比较高。

AI 在 forIndustry 的时候，其实是从单点的技术逐渐地走向了平台化，AI for Science 的未来，我想也会逐步地走向平台化。这个时候就是 AI 专家结合某个领域、某个学科，甚至是某个学科的某一类问题和科学家们一起去建造一个科研的平台。这个时候科学家们可能有更大的自由度、更强大的工具，能够更批量地去做科学研究，实现更加丰富、更加重要的科学突破。

再往下走的话，我想再借鉴一下 AI for Industry 的进程。AI for Industry 从单点技术到平台以后，再往下我判断是走向系统，或者叫进化系统或者叫协同进化系统。因为平台解决的是能够规模化地去产生能力和落地应用，系统化解决的是能够长久地、持续地、深入地解决行业的问题，产生核心价值。对于科研来讲也是，如果说每一个领域能够建造出这样一个AI系统，那么科学的发现有可能实现自动或者半自动的模式，它可以持续、持久、深入、广泛地做出一些科学的发现，这个可能是更长远的一个未来。当然，自动模式能解决的是相对简单一些的科学发现、科学论证，并不是最前沿、最尖端、最复杂的问题——这一部分是要科学家利用强大的AI系统和科学专业能力去发现、去解决。

阿里达摩院决策智能实验室负责人印卧涛表示：

DeepMind 与合作者最近在 Nature 发表论文，AI 帮助解决了数学难题，引起很多人的关注。大家关心得不是结果，而是 AI 在数学研究中如何发挥作用。

先介绍下背景，这篇文章是关于低维拓扑，里面有十几个数学量，其中关键量是通过神经网络拟合在做分析得到。作者猜测低位拓扑中存在未知的非线性关系，作者产生了很多数据并用神经网络拟合了近似函数，发现其中三个量在拟合过程中起到了很重要的作用，并且只用这三个量也拟合得非常好。通过反正做拟合实验，产生新的数据，得到新的观察模型，最终数学家利用智慧猜出了一个不等式结构，并进一步给了严格的证明。

大家关心的是人机互动的过程，大量神经网络实验和两个数学家之间多轮的互动，Nature 描述了互动过程。自古以来，比如开普勒和其他应用科学家反复地做实验观察，从中寻找规律，现在AI算法和AI专家扮演了这个角色。这次创新主要用了神经网络的技术，包括多元非线性函数进行递进的技术和黑盒解释的技术。

总结来说，这个成功案例会激发纯数学家和AI合作证明一些新的猜想或者发现新结构。

延伸到 AI for Science，我的看法是，AI 的确可以加速科学实验。除了做计算机模拟之外，AI 还可以告诉大家实验的方向。在最近的天体物理中，AI优化太空望远镜的指向，同时搜集更多更有趣的数据，有点像自动驾驶，用AI做自动驾驶望远镜，加快规律的发现速度。

其次，AI 推动人机结合。当然说起来简单，具体操作要复杂得多，科学家和 AI 专家必须紧密互动，比如数据生成、作图、构建神经网络和训练、利用神经网络进行结果验证等解决问题高度相关。

最后非常重要的一点是发展可解释的 AI 工具。AI 产生的结论需要易于理解、能够溯源，这样才能建立与科学之间的桥梁，获得科学家的信任。

阿里达摩院语言技术实验室研究员黄非表示：

我的工作主要是做自然语言的理解、对话，包括 AI 模型。AI for Science 是一个很新的方向，我们团队在这方面的工作起步不久，我们基于预训练模型体系 AliceMind，利用有限的监督数据，再结合强化学习，目前能够证明近 400 项定理。

面向工业的人工智能和面向科学的人工智能一些不同。前者主要是解决工业中实际问题，根据真实世界中的数据寻找模式（pattern）。对于面向科学的人工智能，目的不仅要找到数据中的模式，而且要找到产生这些的模式的底层规律，来解释不同的现象。面向科学研究的人工智能，常见的预测方式比如从数据到标签的映射，给定疾病图片预测疾病等传统的分类学习的方法能够被使用，但模型更注重与对于数学问题、物理问题等底层的理解，对于可解释性的洞察，以及对于研究问题中的数据更合适的表述分析。我们需要在源数据的基础上寻找更好的表示，对于该领域的问题有更好的理解。

目前的 AI 主要应用于工业场景，基于大量数据。如果 AI 在科研中也需要大量的科研数据，比如对于生物的蛋白质或者某些特定领域，AI 也许在这里可以发挥比较大的作用。但对于特定领域的知识表述和应用，涉及到符号逻辑，包括知识图谱，甚至人的经验、文本知识，如何对于领域知识进行表示和应用，目前AI在这方面工作相对比较有限。

另一个问题是跨团队合作。目前模式是物理学家、数学家提出问题和需求，由 AI 专家来辅助解决。更有效的工作是双方往前各迈一步，AI 专家深入地了解相关学科知识，这样对于利用计算机建模有更好的方式。物理学家，数学家，化学家和生物学家如果能够更好地了解计算机和 AI 的趋势，也会给出非常重要的建议，对于 AI 模型的建模和整个 AI 系统的建设会有非常好的帮助。

结语

在未来，人工智能将催生科研新范式。人工智能将成为科研领域的发展高效催化剂。这也需要各类跨学科领域团队的不断合作创新。

达摩院所公布的《2022 十大科技趋势》除了这里介绍的 AI for Science，还包括大小模型协同进化、硅光芯片、绿色能源 AI、柔性感知机器人、高精度医疗导航、全域隐私计算、星地计算、云网端融合、XR 互联网领域。

阿里达摩院《2022 十大科技趋势》完整版可点击下方链接获取。

链接：https://pan.baidu.com/s/1Va_8mCI6L9GvNaNWLuf56w

提取码：1234

产业AI for Science2022十大科技趋势阿里达摩院

相关数据

DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年，最初名称是DeepMind科技（DeepMind Technologies Limited），在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯，谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后，Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏，例如即时战略游戏《星际争霸II》（StarCraft II）。深度AI如果能直接使用在其他各种不同领域，除了未来能玩不同的游戏外，例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作，基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/

机器学习技术

机器学习是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。算法设计方面，机器学习理论关注可以实现的，行之有效的学习算法。

来源：Mitchell, T. (1997). Machine Learning. McGraw Hill.

感知技术

知觉或感知是外界刺激作用于感官时，脑对外界的整体的看法和理解，为我们对外界的感官信息进行组织和解释。在认知科学中，也可看作一组程序，包括获取信息、理解信息、筛选信息、组织信息。与感觉不同，知觉反映的是由对象的各样属性及关系构成的整体。

来源：维基百科

人工智能技术

在学术研究领域，人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体（intelligent agent）

来源：Russell, S., & Norvig, P. (2003). Artificial Intelligence: A Modern Approach.

知识图谱技术

知识图谱本质上是语义网络，是一种基于图的数据结构，由节点(Point)和边(Edge)组成。在知识图谱里，每个节点表示现实世界中存在的“实体”，每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲，知识图谱就是把所有不同种类的信息（Heterogeneous Information）连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。知识图谱这个概念最早由Google提出，主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎，知识图谱可用来更好地查询复杂的关联信息，从语义层面理解用户意图，改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候，搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月，家庭情况等等。

来源：机器之心

神经网络技术

（人工）神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型，那时候研究者构想了「感知器（perceptron）」的想法。这一领域的研究者通常被称为「联结主义者（Connectionist）」，因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型，它们都是前馈神经网络：卷积神经网络（CNN）和循环神经网络（RNN），其中 RNN 又包含长短期记忆（LSTM）、门控循环单元（GRU）等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习，但也有一些为无监督学习设计的变体，比如自动编码器和生成对抗网络（GAN）。

来源：机器之心

映射技术

映射指的是具有某种特殊结构的函数，或泛指类函数思想的范畴论中的态射。逻辑和图论中也有一些不太常规的用法。其数学定义为：两个非空集合A与B间存在着对应关系f，而且对于A中的每一个元素x，B中总有有唯一的一个元素y与它对应，就这种对应为从A到B的映射，记作f：A→B。其中，y称为元素x在映射f下的象，记作：y=f(x)。x称为y关于映射f的原象*。*集合A中所有元素的象的集合称为映射f的值域，记作f(A)。同样的，在机器学习中，映射就是输入与输出之间的对应关系。

来源：Wikipedia

逻辑技术

人工智能领域用逻辑来理解智能推理问题；它可以提供用于分析编程语言的技术，也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑（Propositional Logic ）以及一阶逻辑（FOL）等谓词逻辑。

来源：机器之心

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统，是DeepMind在2017-2018年中一直在研究的项目，它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多，在生物学的核心挑战之一上取得了重大进展。

来源：机器之心 DeepMind博客

强化学习技术

强化学习是一种试错方法，其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划（Dynamic Programming）。流行的强化学习方法包括自适应动态规划（ADP）、时间差分（TD）学习、状态-动作-回报-状态-动作（SARSA）算法、Q 学习、深度强化学习（DQN）；其应用包括下棋类游戏、机器人控制和工作调度等。

来源：机器之心

人机交互技术

人机交互，是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器，也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流，并进行操作。小如收音机的播放按键，大至飞机上的仪表板、或是发电厂的控制室。

来源：维基百科

深度神经网络技术

深度神经网络（DNN）是深度学习的一种框架，它是一种具备至少一个隐层的神经网络。与浅层神经网络类似，深度神经网络也能够为复杂非线性系统提供建模，但多出的层次为模型提供了更高的抽象层次，因而提高了模型的能力。

来源：机器之心 Techopedia

量子力学技术

量子力学（Quantum Mechanics），为物理学理论，是研究物质世界微观粒子运动规律的物理学分支，主要研究原子、分子、凝聚态物质，以及原子核和基本粒子的结构、性质的基础理论。

来源：百度百科

达摩院机构

阿里巴巴达摩院（The Academy for Discovery, Adventure, Momentum and Outlook，Alibaba DAMO Academy）成立于2017年10月11日，是一家致力于探索科技未知，以人类愿景为驱动力的研究院，是阿里在全球多点设立的科研机构，立足基础科学、颠覆性技术和应用技术的研究。阿里巴巴达摩院由三大主体组成，一是在全球建设的自主研究中心；二是与高校和研究机构建立的联合实验室；三是全球开放研究项目-阿里巴巴创新研究计划（AIR计划）。

https://damo.alibaba.com/

城市大脑机构

http://eyunhan.com/index.htm

北京大学机构

北京大学创办于1898年，初名京师大学堂，是中国第一所国立综合性大学，也是当时中国最高教育行政机关。辛亥革命后，于1912年改为现名。2000年4月3日，北京大学与原北京医科大学合并，组建了新的北京大学。原北京医科大学的前身是国立北京医学专门学校，创建于1912年10月26日。20世纪三、四十年代，学校一度名为北平大学医学院，并于1946年7月并入北京大学。1952年在全国高校院系调整中，北京大学医学院脱离北京大学，独立为北京医学院。1985年更名为北京医科大学，1996年成为国家首批“211工程”重点支持的医科大学。两校合并进一步拓宽了北京大学的学科结构，为促进医学与人文社会科学及理科的结合，改革医学教育奠定了基础。

官网，http://www.pku.edu.cn/