Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

AlphaFold 3 重磅问世,全面预测蛋白质与所有生命分子相互作用及结构,准确性远超以往水平

编辑 | 萝卜皮

自 2021 年发布强大的人工智能 (AI) 工具 AlphaFold2 以来,科学家们一直在使用蛋白质结构预测模型来绘制细胞内各种蛋白质结构的图谱、发现药物,并绘制每种已知蛋白质相互作用的「宇宙图」。

就在刚刚,Google DeepMind 发布了 AlphaFold3 模型,该模型能够对包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物进行联合结构预测。

AlphaFold3 的准确性对比过去许多专用工具(蛋白质-配体相互作用、蛋白质-核酸相互作用、抗体-抗原预测)有显著提高。这表明,在单个统一的深度学习框架内,可以实现跨生物分子空间的高精度建模。

同时,该团队新推出了 AlphaFold Server,一种易于使用的研究工具,可以免费访问 AlphaFold3 的大部分功能。

伦敦弗朗西斯·克里克研究所的生物化学家 Frank Uhlmann 很早就接触到了 AlphaFold3,他对其功能印象深刻。「这简直是革命性的。」他说,「这将使结构生物学研究大众化。」

该研究以「Accurate structure prediction of biomolecular interactions with AlphaFold 3」为题,于 2024 年 5 月 8 日发布在《Nature》。

图片

每个植物、动物和人类细胞内都有数十亿个分子机器。它们由蛋白质、核酸、糖类等分子组成,但没有一个单独的部分可以单独发挥作用。只有了解它们如何在数百万种组合中相互作用,科学家才能开始真正理解生命的过程。

Google DeepMind 发布的 AlphaFold3 无疑是一种革命性的模型,能够以前所未有的精度,预测所有生命分子的结构和相互作用。

对于蛋白质与其他分子类型的相互作用,AlphaFold3 与现有的预测方法相比,至少有 50% 的改进,对于一些重要的相互作用类别,该模型的预测精度提高了一倍。

为了创建 AlphaFold3,DeepMind 对其前身进行了重大更改:例如,最新版本更少依赖于与目标序列相关的蛋白质信息。

AlphaFold3 还使用一种称为扩散模型的机器学习网络,Midjourney 等图像生成人工智能使用该网络。「这是一个相当大的变化。」领导 AlphaFold 项目的 John Jumper说。

图片

图示:AlphaFold 3 概述。(来源:论文)

AlphaFold3 如何揭示生命分子

视频链接:https://mp.weixin.qq.com/s/IcKOIAqEM4B2fdOsE5cfVA

给定分子的输入列表,AlphaFold3 会生成它们的联合 3D 结构,揭示它们如何组合在一起。它可以模拟蛋白质、DNA 和 RNA 等大型生物分子,以及小分子(也称为配体)——这一类别涵盖许多药物。

此外,AlphaFold3 可以模拟这些分子的化学修饰,这些分子控制着细胞的健康功能,如果受到破坏,就会引起疾病。

AlphaFold3 的功能来自其下一代架构和训练,现已涵盖所有生命分子。该模型的核心是 Evoformer 模块的改进版本——一种支撑 AlphaFold2 令人难以置信的性能的深度学习架构。

处理输入后,AlphaFold3 使用扩散网络组装其预测,类似于人工智能图像生成器中的网络。扩散过程从原子云开始,经过许多步骤汇聚成最终的、最准确的分子结构。

AlphaFold3 对分子相互作用的预测超过了所有现有系统的准确性。作为以整体方式计算整个分子复合物的单一模型,它具有独特的能力来统一科学见解。

AlphaFold3 的结构预测性能非常令人印象深刻。」图华盛顿大学的计算生物物理学家 David Baker 说道,并表示这比他的团队开发的 RoseTTAFold All-Atom 更好。

领先的药物发现

AlphaFold3 创造了药物设计能力,可以预测药物中常用的分子,例如配体和抗体,这些分子与蛋白质结合,改变它们在人类健康和疾病中相互作用的方式。

AlphaFold3 在预测类药物相互作用方面实现了前所未有的准确性,包括蛋白质与配体的结合以及抗体与其目标蛋白质的结合。

AlphaFold3 比 PoseBusters 基准测试中最好的传统方法准确率高 50%,无需输入任何结构信息,这使得 AlphaFold3 成为第一个超越基于物理的生物分子结构预测工具的人工智能系统。预测抗体-蛋白质结合的能力对于理解人类免疫反应的各个方面和新抗体(一类不断增长的治疗方法)的设计至关重要。

Isomorphic Labs 是 DeepMind 的衍生公司,它正在将 AlphaFold3 与一套互补的内部 AI 模型相结合,致力于内部项目以及与制药合作伙伴的药物设计。

Isomorphic Labs 正在使用 AlphaFold3 来加速和提高药物设计的成功率——帮助了解如何接近新的疾病目标,并开发新的方法来追求以前无法实现的现有目标。

「我们必须在确保其可获取并在科学界产生影响以及不损害 Isomorphic 追求商业药物发现的能力之间取得平衡」DeepMind 人工智能科学主管兼研究合著者 Pushmeet Kohli 说道。

图片

NVIDIA 高级研究经理兼 Embodied AI(GEAR 实验室)负责人 Jim Fan 发推文评论道:

AlphaFold3 已经问世,这是生物学领域人工智能最伟大突破的最新版本。新颖之处在于 AlphaFold3 使用扩散来「渲染」分子结构。它从模糊的原子云开始,然后通过去噪逐渐具体化分子。」

「在我们生活的时间线上,Llama 和 Sora 的学习可以为生命科学提供信息并加速发展。我发现这种普遍性绝对令人难以置信。生成精美像素的相同transformer+diffusion backbone 也可以想象蛋白质,只要你相应地将数据转换为浮点序列。」

「我们还没有达到单一 AGI 模型的水平,但我们已经成功构建了一个通用 AI 配方菜单,可以跨领域传输训练、数据和神经架构。这不应该起作用,但感谢上帝它起作用了!」

当然,也有不同的声音,由于对蛋白质与可能的药物相互作用建模的限制,加州大学旧金山分校的药物化学家 Brian Shoichet 表示:「我看不出它能产生 AlphaFold2 那样的影响。」他一直在使用 AlphaFold 结构来寻找候选药物。

一款免费且易于使用的研究工具

与 RoseTTAFold 和 AlphaFold2 不同,科学家将无法运行他们自己版本的 AlphaFold3,AlphaFold3 底层的代码等信息目前不会被公开。相反,研究人员将可以访问 DeepMind 新推出的「AlphaFold Server」 来使用 AlphaFold3 的功能。

AlphaFold Server 是一个免费平台,世界各地的科学家可以使用它进行非商业研究。只需点击几下,生物学家就可以利用 AlphaFold 3 的强大功能来模拟由蛋白质、DNA、RNA 以及一系列配体、离子和化学修饰组成的结构。

AlphaFold Server 帮助科学家提出新颖的假设并在实验室进行测试,加快工作流程并实现进一步的创新。该平台为研究人员提供了一种生成预测的便捷方式,无论他们是否拥有计算资源或机器学习方面的专业知识。

Uhlmann 很喜欢他迄今为止所看到的服务器,比他之前使用的 AlphaFold2 版本更简单、更快。「你上传它,10 分钟后,你就得到了结构。」他说。

但是,目前用户对 AlphaFold Server 的访问次数是有限的。当前,科学家每天只能进行 10 次预测,这不太可能获得与可能的药物结合的蛋白质结构。

以下视频来源于X Omics

AlphaFold Server:https://golgi.sandbox.google.com/about

负责任地使用 AlphaFold3 的力量

对于每个 AlphaFold 版本,DeepMind 都与研究社区和安全社区合作,试图了解该技术的广泛影响。他们采取以科学为主导的方法,并进行了广泛的评估,从而减轻潜在风险并分享对生物学和人类的广泛利益。

DeepMindAlphaFold2 进行的外部咨询的基础上,除了生物安全、研究和行业领域的专业第三方之外,他们现在还与 50 多名领域专家进行了接触,从而了解后续 AlphaFold 模型的功能和任何潜在风险。在 AlphaFold3 发布之前,DeepMind 还参加了社区范围的论坛和讨论。

AlphaFold Server 体现了 DeepMind 对分享 AlphaFold 优势的持续承诺,包括含有 2 亿个蛋白质结构的免费数据库

他们还将与 EMBL-EBI 以及与南半球组织的合作,扩大免费 AlphaFold 教育在线课程,为科学家提供加速采用和研究所需的工具,包括在被忽视的疾病和粮食安全等资金不足的领域。DeepMind 将继续与科学界和政策制定者合作,负责任地开发和部署人工智能技术。

开启AI驱动的细胞生物学的未来

AlphaFold3 将生物世界带入高清。它使科学家能够了解细胞系统的所有复杂性、结构、相互作用和修饰。

这个关于生命分子的新窗口,揭示了它们是如何相互联系的,并有助于理解这些联系如何影响生物功能——例如药物的作用、激素的产生以及 DNA 修复的健康保护过程。

AlphaFold3 的潜力才刚刚开始挖掘,生命科学的未来会怎样呢?

论文链接:https://www.nature.com/articles/s41586-024-07487-w

相关内容:https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/

产业DeepMind深度学习AlphaFold 3
1
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

图像生成技术

图像生成(合成)是从现有数据集生成新图像的任务。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

药物发现技术

在医学,生物技术和药理学领域,药物发现是发现新候选药物的过程。

推荐文章
暂无评论
暂无评论~