Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

病毒从何而来?AlphaFold等AI正在寻找答案

图片
图示:登革热病毒蛋白的结构。(来源:Spyros Lytras 和 Joe Grove)

编译 | 白菜叶

人工智能 (AI) 正在帮助重新绘制病毒家族树。AlphaFold 生成的预测蛋白质结构和受聊天机器人启发的「蛋白质语言模型」揭示了病毒家族中的一些令人惊讶的联系,其中包括感染人类的病原体以及新出现的威胁。

科学家对病毒进化的理解大多基于基因组比较。但病毒(尤其是那些基因组以 RNA 编写的病毒)的闪电般快速进化以及它们从其他生物体获取遗传物质的倾向意味着基因序列可以隐藏病毒之间深远的关系,而这种关系也可能因所检查的基因而异。

相比之下,病毒基因编码的蛋白质的形状或结构往往变化缓慢,这使得找出这些隐藏的进化联系成为可能。但英国格拉斯哥大学分子病毒学家 Joe Grove 表示,在 AlphaFold 等可以大规模预测蛋白质结构的工具出现之前,我们无法比较整个病毒家族的蛋白质结构。

在 9 月发表在《Nature》杂志上的一篇论文中,Grove 团队展示了基于结构的方法在研究牛黄病毒中的作用。黄病毒包括丙型肝炎病毒、登革热病毒和寨卡病毒,以及一些可能对人类健康构成新威胁的主要动物病原体和物种。

图片

论文链接:https://www.nature.com/articles/s41586-024-07899-8

病毒如何进入

研究人员对黄病毒进化的大部分理解都是基于复制其遗传物质的缓慢进化的酶序列。然而,研究人员对黄病毒用来入侵细胞的「病毒入侵」蛋白的起源知之甚少,而这些蛋白决定了它们可以感染的宿主范围。Grove认为,这一差距减缓了有效丙型肝炎疫苗的研发,而丙型肝炎每年导致数十万人死亡。

「在序列层面上,事物是如此不同,以至于我们无法判断它们是否相关。」他说,「蛋白质结构预测的出现解开了整个问题,我们可以非常清楚地看到事物。」

研究人员利用 DeepMindAlphaFold2 模型和科技巨头 Meta 开发的结构预测工具 ESMFold,为 458 种黄病毒物种的蛋白质生成了超过 33,000 个预测结构。ESMFold 基于经过数千万个蛋白质序列训练的语言模型

AlphaFold 不同,它只需要单个输入序列,而不是依赖于来自类似蛋白质的多个序列,因此它可能对于研究最神秘的病毒特别有用。

图片

图示:丙型肝炎病毒糖蛋白结构预测。(来源:Spyros Lytras 和 Joe Grove)

预测的结构使作者能够识别出与已知黄病毒序列截然不同的病毒入侵蛋白。他们发现了一些意想不到的联系。例如,包括丙型肝炎病毒在内的病毒亚群使用与他们在猪瘟病毒中发现的系统类似的系统感染细胞——猪瘟病毒包括引起猪出血热的经典猪瘟病毒和其他动物病原体。

比较后显示,该病毒的入侵系统与许多其他黄病毒的入侵系统不同。「对于丙型肝炎病毒及其近亲,我们不知道其入侵系统来自何处。它可能是由这些病毒在很久以前『发明』的。」Grove 说。

从细菌中窃取

预测的结构还表明,寨卡病毒和登革热病毒中研究透彻的入侵蛋白与 Grove 所说的基因组巨大的「奇怪而又奇妙」的黄病毒(包括可导致人类发烧的 Haseki 蜱病毒)具有相同的来源。另一个令人意外的是,一些黄病毒中似乎有一种从细菌中偷来的酶。

澳大利亚悉尼大学的病毒学家 Mary Petrone 表示:「这将是史无前例的。」要不是她的团队今年在一种特别奇怪而又奇妙的黄病毒物种中发现了类似的盗窃行为,情况就更是如此。她补充道:「基因盗窃在塑造黄病毒进化方面发挥的作用可能比之前认为的更大。」

图片

论文链接:https://www.pnas.org/doi/10.1073/pnas.2403805121

瑞士洛桑大学计算生物学家 David Moi 表示,黄病毒研究只是冰山一角,其他病毒甚至一些细胞生物的进化史很可能会被人工智能改写。「我们将用新一代工具重新讲述它们的故事。」他说,「现在我们可以看得更远一些,所有这些事情都必须进行一些更新。」

相关报道:https://www.nature.com/articles/d41586-024-02970-w  

理论
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

AlphaFold技术

DeepMind 提出的深度神经网络蛋白质形态预测方法。AlphaFold系统,是DeepMind在2017-2018年中一直在研究的项目,它建立在多年以前使用大量基因组数据来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多,在生物学的核心挑战之一上取得了重大进展。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

暂无评论
暂无评论~