编辑 | 萝卜皮
自 2021 年发布强大的人工智能 (AI) 工具 AlphaFold2 以来,科学家们一直在使用蛋白质结构预测模型来绘制细胞内各种蛋白质结构的图谱、发现药物,并绘制每种已知蛋白质相互作用的「宇宙图」。
就在刚刚,Google DeepMind 发布了 AlphaFold3 模型,该模型能够对包括蛋白质、核酸、小分子、离子和修饰残基在内的复合物进行联合结构预测。
AlphaFold3 的准确性对比过去许多专用工具(蛋白质-配体相互作用、蛋白质-核酸相互作用、抗体-抗原预测)有显著提高。这表明,在单个统一的深度学习框架内,可以实现跨生物分子空间的高精度建模。
同时,该团队新推出了 AlphaFold Server,一种易于使用的研究工具,可以免费访问 AlphaFold3 的大部分功能。
伦敦弗朗西斯·克里克研究所的生物化学家 Frank Uhlmann 很早就接触到了 AlphaFold3,他对其功能印象深刻。「这简直是革命性的。」他说,「这将使结构生物学研究大众化。」
该研究以「Accurate structure prediction of biomolecular interactions with AlphaFold 3」为题,于 2024 年 5 月 8 日发布在《Nature》。
每个植物、动物和人类细胞内都有数十亿个分子机器。它们由蛋白质、核酸、糖类等分子组成,但没有一个单独的部分可以单独发挥作用。只有了解它们如何在数百万种组合中相互作用,科学家才能开始真正理解生命的过程。
Google DeepMind 发布的 AlphaFold3 无疑是一种革命性的模型,能够以前所未有的精度,预测所有生命分子的结构和相互作用。
对于蛋白质与其他分子类型的相互作用,AlphaFold3 与现有的预测方法相比,至少有 50% 的改进,对于一些重要的相互作用类别,该模型的预测精度提高了一倍。
为了创建 AlphaFold3,DeepMind 对其前身进行了重大更改:例如,最新版本更少依赖于与目标序列相关的蛋白质信息。
AlphaFold3 还使用一种称为扩散模型的机器学习网络,Midjourney 等图像生成人工智能使用该网络。「这是一个相当大的变化。」领导 AlphaFold 项目的 John Jumper说。
图示:AlphaFold 3 概述。(来源:论文)
AlphaFold3 如何揭示生命分子
视频链接:https://mp.weixin.qq.com/s/IcKOIAqEM4B2fdOsE5cfVA
给定分子的输入列表,AlphaFold3 会生成它们的联合 3D 结构,揭示它们如何组合在一起。它可以模拟蛋白质、DNA 和 RNA 等大型生物分子,以及小分子(也称为配体)——这一类别涵盖许多药物。
此外,AlphaFold3 可以模拟这些分子的化学修饰,这些分子控制着细胞的健康功能,如果受到破坏,就会引起疾病。
AlphaFold3 的功能来自其下一代架构和训练,现已涵盖所有生命分子。该模型的核心是 Evoformer 模块的改进版本——一种支撑 AlphaFold2 令人难以置信的性能的深度学习架构。
处理输入后,AlphaFold3 使用扩散网络组装其预测,类似于人工智能图像生成器中的网络。扩散过程从原子云开始,经过许多步骤汇聚成最终的、最准确的分子结构。
AlphaFold3 对分子相互作用的预测超过了所有现有系统的准确性。作为以整体方式计算整个分子复合物的单一模型,它具有独特的能力来统一科学见解。
「AlphaFold3 的结构预测性能非常令人印象深刻。」图华盛顿大学的计算生物物理学家 David Baker 说道,并表示这比他的团队开发的 RoseTTAFold All-Atom 更好。
领先的药物发现
AlphaFold3 创造了药物设计能力,可以预测药物中常用的分子,例如配体和抗体,这些分子与蛋白质结合,改变它们在人类健康和疾病中相互作用的方式。
AlphaFold3 在预测类药物相互作用方面实现了前所未有的准确性,包括蛋白质与配体的结合以及抗体与其目标蛋白质的结合。
AlphaFold3 比 PoseBusters 基准测试中最好的传统方法准确率高 50%,无需输入任何结构信息,这使得 AlphaFold3 成为第一个超越基于物理的生物分子结构预测工具的人工智能系统。预测抗体-蛋白质结合的能力对于理解人类免疫反应的各个方面和新抗体(一类不断增长的治疗方法)的设计至关重要。
Isomorphic Labs 是 DeepMind 的衍生公司,它正在将 AlphaFold3 与一套互补的内部 AI 模型相结合,致力于内部项目以及与制药合作伙伴的药物设计。
Isomorphic Labs 正在使用 AlphaFold3 来加速和提高药物设计的成功率——帮助了解如何接近新的疾病目标,并开发新的方法来追求以前无法实现的现有目标。
「我们必须在确保其可获取并在科学界产生影响以及不损害 Isomorphic 追求商业药物发现的能力之间取得平衡」DeepMind 人工智能科学主管兼研究合著者 Pushmeet Kohli 说道。
NVIDIA 高级研究经理兼 Embodied AI(GEAR 实验室)负责人 Jim Fan 发推文评论道:
「AlphaFold3 已经问世,这是生物学领域人工智能最伟大突破的最新版本。新颖之处在于 AlphaFold3 使用扩散来「渲染」分子结构。它从模糊的原子云开始,然后通过去噪逐渐具体化分子。」
「在我们生活的时间线上,Llama 和 Sora 的学习可以为生命科学提供信息并加速发展。我发现这种普遍性绝对令人难以置信。生成精美像素的相同transformer+diffusion backbone 也可以想象蛋白质,只要你相应地将数据转换为浮点序列。」
「我们还没有达到单一 AGI 模型的水平,但我们已经成功构建了一个通用 AI 配方菜单,可以跨领域传输训练、数据和神经架构。这不应该起作用,但感谢上帝它起作用了!」
当然,也有不同的声音,由于对蛋白质与可能的药物相互作用建模的限制,加州大学旧金山分校的药物化学家 Brian Shoichet 表示:「我看不出它能产生 AlphaFold2 那样的影响。」他一直在使用 AlphaFold 结构来寻找候选药物。
一款免费且易于使用的研究工具
与 RoseTTAFold 和 AlphaFold2 不同,科学家将无法运行他们自己版本的 AlphaFold3,AlphaFold3 底层的代码等信息目前不会被公开。相反,研究人员将可以访问 DeepMind 新推出的「AlphaFold Server」 来使用 AlphaFold3 的功能。
AlphaFold Server 是一个免费平台,世界各地的科学家可以使用它进行非商业研究。只需点击几下,生物学家就可以利用 AlphaFold 3 的强大功能来模拟由蛋白质、DNA、RNA 以及一系列配体、离子和化学修饰组成的结构。
AlphaFold Server 帮助科学家提出新颖的假设并在实验室进行测试,加快工作流程并实现进一步的创新。该平台为研究人员提供了一种生成预测的便捷方式,无论他们是否拥有计算资源或机器学习方面的专业知识。
Uhlmann 很喜欢他迄今为止所看到的服务器,比他之前使用的 AlphaFold2 版本更简单、更快。「你上传它,10 分钟后,你就得到了结构。」他说。
但是,目前用户对 AlphaFold Server 的访问次数是有限的。当前,科学家每天只能进行 10 次预测,这不太可能获得与可能的药物结合的蛋白质结构。
AlphaFold Server:https://golgi.sandbox.google.com/about
负责任地使用 AlphaFold3 的力量
对于每个 AlphaFold 版本,DeepMind 都与研究社区和安全社区合作,试图了解该技术的广泛影响。他们采取以科学为主导的方法,并进行了广泛的评估,从而减轻潜在风险并分享对生物学和人类的广泛利益。
在 DeepMind 为 AlphaFold2 进行的外部咨询的基础上,除了生物安全、研究和行业领域的专业第三方之外,他们现在还与 50 多名领域专家进行了接触,从而了解后续 AlphaFold 模型的功能和任何潜在风险。在 AlphaFold3 发布之前,DeepMind 还参加了社区范围的论坛和讨论。
AlphaFold Server 体现了 DeepMind 对分享 AlphaFold 优势的持续承诺,包括含有 2 亿个蛋白质结构的免费数据库。
他们还将与 EMBL-EBI 以及与南半球组织的合作,扩大免费 AlphaFold 教育在线课程,为科学家提供加速采用和研究所需的工具,包括在被忽视的疾病和粮食安全等资金不足的领域。DeepMind 将继续与科学界和政策制定者合作,负责任地开发和部署人工智能技术。
开启AI驱动的细胞生物学的未来
AlphaFold3 将生物世界带入高清。它使科学家能够了解细胞系统的所有复杂性、结构、相互作用和修饰。
这个关于生命分子的新窗口,揭示了它们是如何相互联系的,并有助于理解这些联系如何影响生物功能——例如药物的作用、激素的产生以及 DNA 修复的健康保护过程。
AlphaFold3 的潜力才刚刚开始挖掘,生命科学的未来会怎样呢?
论文链接:https://www.nature.com/articles/s41586-024-07487-w
相关内容:https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/