Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

同济团队开发用于 T 细胞受体-抗原结合识别的泛肽元学习

编辑 | 萝卜皮

确定 T 细胞受体 (TCR) 与人类抗原相互作用的机制,为开发新疫苗、诊断方法和免疫疗法提供了重要机会。然而,TCR-抗原配对的准确预测和识别代表了免疫学中的重大计算挑战。

现有工具只能从许多已知的 TCR 结合库中学习抗原的结合模式,而无法识别从未呈递给免疫系统或仅了解少数 TCR 结合库的抗原。然而,新抗原或外源肽的结合特异性对于免疫研究和免疫治疗至关重要。

因此,同济大学的研究团队通过结合元学习和神经图灵机的概念,开发了泛肽元学习(PanPep),这是一个通用且稳健的框架,用于识别 TCR-抗原结合。神经图灵机增加了外部记忆以避免忘记以前学过的任务,这里使用它来准确预测 TCR 与任何肽的结合特异性,尤其是看不见的肽。

研究人员将 PanPep 应用于各种具有挑战性的临床任务,经过综合测试表明,PanPep 优于现有工具。PanPep 还提供可解释性,揭示 3D 晶体结构中肽和 TCR 相互作用的性质。未来,也许 PanPep 可以成为破译 TCR-抗原相互作用的有用工具,并且广泛应用到临床。

该研究以「Pan-Peptide Meta Learning for T-cell receptor–antigen binding recognition」为题,于 2023 年 3 月 6 日发布在《Nature Machine Intelligence》。

新抗原和病毒肽由主要组织相容性复合体 I(MHC-I)呈递,它通过被携带 CD8 抗原(CD8+)的 T 细胞表面的 T 细胞受体识别而引发免疫反应。免疫原性肽或克隆扩增的反应性 T 细胞的鉴定为开发新疫苗、诊断方法和免疫疗法提供了很好的机会。

因此,学界已经开发了许多实验方法,例如四聚体分析、四聚体相关 T 细胞受体测序和 T 扫描,以检测 TCR 与 MHC 分子(pMHC)呈递的肽之间的相互作用。然而,这些实验方法耗时长、技术难度高且成本高。因此,对 TCR-抗原配对的准确预测和识别有很高的需求,并且代表了现代免疫学中最具计算挑战性的问题之一。

存在多种计算工具来分析不同的 TCR 模式并预测肽-TCR 结合特异性。这些工具主要分为三类:

(1)定义定量相似性测量以聚类 TCR 并破译其抗原特异性结合模式,包括 TCRdist、DeepTCR、GIANA、iSMART、GLIPH 和 ELATE;

(2)开发肽特异性TCR结合预测模型,包括TCRGP、TCRex和NetTCR-2;

(3)开发不限于特定肽的肽-TCR 结合预测模型,同时需要可用的已知结合 TCR 进行模型训练,包括 pMTnet8、DLpTCR、ERGO2 和 TITAN。

显然,第一类工具不能直接应用于肽-TCR 结合识别,第二类工具仅限于特定的肽,效用有限。第三类努力开发通用的肽-TCR 结合预测模型,其中嵌入了肽和 TCR。

然而,这些方法仅显示出相对稳健的 TCR 识别准确性,以学习具有大量已知 TCR 结合库的肽的结合模式。由于相互作用空间的多样性,他们无法识别具有很少已知结合 TCR 的肽或训练数据中不存在的肽。换句话说,这些模型不能推广到学习训练数据集中不可用的肽(unseen)或外源肽与免疫系统的肽-TCR 结合模式,而识别新抗原或外源肽的结合特异性对于免疫研究和免疫治疗至关重要。

准确识别以泛肽方式结合任何肽的 TCR 具有挑战性,因为这种方法需要创造性的策略:

(1)充分利用来自记录的仅结合少数 TCR 的肽的信息;

(2)充分概括以识别 TCR 与免疫系统先前未发现的肽的结合;

(3)清楚地揭示 TCR 的哪一部分在结合和识别中起着至关重要的作用。

开发这种通用且稳健的肽-TCR 结合识别方法仍然是免疫学研究中最具挑战性的问题之一,并且有望促进对抗原和 TCR 之间相互作用的生物学过程的研究以及个性化免疫疗法的发展。

因此,同济大学的研究人员引入 PanPep 用于 TCR-抗原结合识别,这是一个通用且稳健的框架,其灵感来自集成元学习与神经图灵机(NTM),用于准确预测 TCR 与任何肽(尤其是新抗原或外源肽)的结合特异性。

图示:PanPep 框架概述。(来源:论文)

具体来说,PanPep 将肽-TCR 识别制定为元学习框架中的一组肽特异性 TCR 结合识别任务,可以以泛肽方式推广到任何新的肽特异性任务。研究人员在三种不同的设置中应用 PanPep:多数、少量和零次学习,它们可以很好地推广到任何类型的肽-TCR 对识别。

这三个设置对应于肽结合模式的三个识别设置:(1) 具有大量已知的结合 TCR,(2) 具有很少的已知结合 TCR,或 (3) 具有训练数据中不存在的肽,模仿免疫系统可能完全看不到的那些肽。

图示:PanPep 与其他现有工具的性能比较。(来源:论文)

综合测试结果表明,PanPep 在所有三种设置下显著优于现有的任何类型肽的 TCR 识别方法,最重要的是,除了 PanPep 之外,现有工具都不能准确识别与免疫系统结合的外源或新肽的 TCR。

该团队进一步证明了 PanPep 在零注射设置下的几个临床应用中的效用,包括(1)定性测量 T 细胞的克隆扩增;(2)高效分选肿瘤新抗原治疗中的反应性T细胞;(3) 从 COVID-19 研究中准确识别大型队列中的免疫反应性 TCR。

图示:使用 COVID-19 数据集验证 PanPep。(来源:论文)

研究人员认为 PanPep 的可解释性揭示了肽和 TCR 在 3D 晶体结构中相互作用的性质,有助于发现不同 TCR 氨基酸对肽与其互补决定区 3 (CDR3) 环之间相互作用的影响。

图示:验证 PanPep 在 3D 晶体结构中识别关键位点。(来源:论文)

尽管 PanPep 的性能明显优于其他方法,但当有更多训练数据可用时,性能可以得到改善,尤其是对于少镜头和零镜头设置。

预计未来会更新 PanPep:

(1)PanPep 的性能受到可用于构建肽片段的可用肽数量的限制。增加实验验证数据的可用性将进一步提高 PanPep 的性能,并且还可以开发精心设计的模型用于具有置信度分数的输出评估。

(2)目前PanPep只考虑了 TCR 的 CDR3 beta 链与肽的相互作用。近期的研究表明,其他链中的捕捉键可能在新抗原的 TCR 识别中发挥重要作用,因此预计未来建模会考虑更多信息,例如 HLA 类型和 alpha/beta 链。

(3)随着未来更多的 3D 晶体结构数据可用,直接使用 3D 数据构建模型将进一步提高肽-TCR 结合识别。

(4)预计未来会有更多的直接应用来说明 PanPep 的优越性和实用性。

论文链接:https://www.nature.com/articles/s42256-023-00619-3

产业
暂无评论
暂无评论~