Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

剑桥大学团队用深度学习工具评估纳米抗体的天然性,助力抗体药开发

编辑 | 萝卜皮

单克隆抗体已成为关键的治疗方法。特别是,纳米抗体(一种在骆驼科动物中自然表达的小型单域抗体)在 2019 年第一个纳米抗体药物获得批准后迅速获得发展势头。虽然如此,这些生物制剂作为治疗剂的开发仍然是一个挑战。

尽管已有成熟的体外定向进化技术,部署起来相对较快且成本低廉,但产生治疗性抗体的黄金标准仍然是来自动物免疫或患者的发现。免疫系统衍生的抗体往往在体内具有良好的特性,包括半衰期长、与自身抗原的反应性低和毒性低。

在最新的研究中,剑桥大学的研究人员推出了 AbNatiV,一种深度学习工具,用于评估抗体和纳米抗体的天然性,即它们属于免疫系统衍生的人类抗体或骆驼纳米抗体分布的可能性。

AbNatiV 是一种多用途工具,可以准确预测任何来源(包括合成文库和计算设计)的 Fv 序列的天然性。它提供了一个可解释的分数,可以预测免疫原性的可能性,以及一个残基水平的概况,可以指导抗体和纳米抗体的工程设计,与免疫系统衍生的抗体和纳米抗体无法区分。

该团队进一步引入了自动化人源化流程,并将其应用于两种纳米抗体。实验室实验表明,与使用传统结构和残基频率分析进行人源化的纳米抗体不同,AbNatiV 人源化纳米抗体保留了与野生型相当甚至更好的结合和稳定性。

该研究以「Assessing antibody and nanobody nativeness for hit selection and humanization with AbNatiV」为题,于 2024 年 1 月 15 日发布在《Nature Machine Intelligence》。

图片

抗体是一类生物分子,具有选择性、紧密结合分子靶标的卓越能力。因此,它们在生物研究和医学中找到了关键应用,广泛用作诊断剂和治疗剂。

纳米抗体 (Nb) 是骆驼科动物中天然表达的单域抗体 (VHH)。它们由于其独特的结构特征而越来越受重视,其中包括尺寸小、稳定性和溶解性好、第三互补决定区(CDR3)长、可与难以接近的表位结合,以及与全长抗体相当的亲和力和特异性。

此外,自 2019 年第一个纳米抗体药物 Caplacizumab 获得批准以来,它们作为治疗药物的潜力得到了越来越多的认可。

计算抗体设计仍处于起步阶段。然而,在针对预定感兴趣表位的抗体设计以及支持可开发性的生物物理特性的预测和设计方面,已经取得了重要进展,而基于实验室的方法仍然极其费力。

总体而言,计算设计为抗体的发现和优化提供了一种更便宜、更快速的途径,同时原则上比体内和体外技术对稳定性和溶解度等其他关键生物物理特性提供了更好的控制。

但是,体内特性的计算预测仍然存在很大问题。这些特性包括长半衰期、低免疫原性和无毒性,很难准确且高通量地测量,并且它们的分子决定因素仍然知之甚少。

在最新的研究中,剑桥大学的研究人员引入了一种新的深度学习方法,通过使抗体和纳米抗体序列的计算工程与从免疫系统获得的序列无法区分,来绕过这些挑战。

图片

图示:AbNatiV模型。(来源:论文)

该方法称为 AbNatiV,它提供了给定序列属于源自人类或骆驼免疫系统的天然可变域 (Fv) 序列分布的可能性的准确量化。研究人员认为这种可能性抗体具有天然性,因为它反映了与天然抗体的相似性。因此,具有高天然性的 Fv 序列有望具有与免疫系统衍生抗体相当的体内特性。

AbNatiV 由矢量量化变分自动编码器 (VQ-VAE) 组成,旨在处理对齐的 Fv 序列,并通过对来自策划的天然免疫库的序列进行屏蔽无监督学习进行训练。针对人类重链 (VH)、κ 轻链 (Vκ)、lambda 轻链 (Vλ) 和骆驼重链单域 (VHH) 的 Fv 序列训练四种不同的模型。

AbNatiV 可以分别评估给定 Fv 序列的人源性和 VHH 天然性程度。它提供了可解释的整体原生性评分和 Fv 序列的残基水平原生性概况,这可以通过突出显示包含缺陷的序列区域来指导工程设计。因此,AbNatiV 可用于计算抗体设计,还可用于对任何来源(包括体外发现的)Fv 序列进行排序。

AbNatiV 在评估人源性方面的准确性在多个基准测试中得到了证明。特别是,AbNatiV 在对抗体疗法进行分类时优于其他方法。此外,研究人员发现 AbNatiV 学习了捕获位置之间高阶关系的天然抗体的表示,这对于 CDR 移植很有价值。

该团队进一步引入了依赖 AbNatiV 的抗体和纳米抗体的自动化人源化管线。对于纳米抗体,这种方法同时监测序列的人源性和 VHH 天然性。对两种纳米抗体与不同靶标结合的实验室实验表明,AbNatiV 人源化纳米抗体保留了与野生型 (WT) 相当或更好的结合和稳定性,这与通过传统结构和残基频率分析进行人源化的纳米抗体不同。

总而言之,评估结果凸显了 AbNatiV 在推进抗体和纳米抗体工程方面的潜力,可作为对不同来源(包括体外发现和合成文库)的 Fv 序列进行计算设计和排序的宝贵工具。

论文链接:https://www.nature.com/articles/s42256-023-00778-3 

理论剑桥
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

矢量量化技术

矢量量化是70年代后期发展起来的一种数据压缩技术基本思想:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。它是一种数据压缩技=术,指从N维实空间RN到RN中L个离散矢量的映射,也可称为分组量化,标量量化是矢量量化在维数为1时的特例。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~