编辑 | 萝卜皮
通过系统性改造来优化有前途的候选药物的化学结构,以提高药效和物理化学性质,这是药物发现过程中至关重要的一步。与成熟的从头生成方案相比,专门针对先导化合物优化的计算方法仍未得到充分探索。
先前的模型通常仅限于解决特定的子任务,例如生成二维分子结构,而忽略了三维空间中至关重要的蛋白质-配体相互作用。
为了克服这些挑战,浙江大学的研究人员提出了 Delete(Deep lead optimization enveloped in protein pocket),这是一种结合生成人工智能和基于结构的方法的一站式先导优化解决方案。
Delete 模型通过统一的掩蔽策略和等变网络设计,能够高效处理先导化合物优化任务,并生成具有优异结合能和药物相似性的分子。
实验验证表明,Delete 设计的 LTK 蛋白抑制剂 CA-B-1 在体外和体内均表现出高效性和选择性。这展示了其在快速、可控药物设计中的强大潜力。
该研究以「Deep lead optimization enveloped in protein pocket and its application in designing potent and selective ligands targeting LTK protein」为题,于 2025 年 2 月 20 日发布在《Nature Machine Intelligence》。

论文链接:https://www.nature.com/articles/s42256-025-00997-w
背景
现代人工智能辅助药物设计(AIDD)通过加速候选药物的发现,有效缩短了药物研发的时间和成本,尤其在抗菌药物开发中已展现出显著成效。
然而,AIDD 方法主要依赖于经过充分研究的药物靶标和分子数据,以训练可靠的定量结构-活性关系(QSAR)模型。
尽管分子生成技术如 JAEJER 和 GENTRL 等在连续化学空间中探索分子,但其应用仍局限于基于配体的从头设计模型,且难以整合化学家的先验知识,限制了其在实际研发中的广泛应用。
新方法 Delete
为了应对这些挑战,浙江大学侯廷军、潘培成以及香港科技大学黄湧等组成的联合团队尝试在他们的方法中实现两个基本概念:基于结构的范式和先导化合物优化方法。
这种整合催生了一个名为 Delete 的 AI 驱动模型,该模型更准确地符合现实世界需求的复杂性。与主要侧重于通过数据记忆识别化学模式的基于配体的范式不同,基于结构的方法寻求掌握底层物理原理。

图示:Delete 是针对潜在先导化合物优化的一站式解决方案。(来源:论文)
然而,它只是在最近几年才受到关注,例如 DiffSBDD、Pkt2Mol 和 ResGen,它们将蛋白质结构视为硬条件,因为它们直接在口袋内生成分子。
受这些工作的启发,Delete 利用几何感知和等变网络作为主干来理解详细的蛋白质诱导相互作用。通过这种方式,该模型可以有效地用于研究未见靶标,因为尽管三维 (3D) 结构因情况而异,但底层基本物理保持不变。
另一个概念,即先导优化,已被广泛用于以已获批准的药物为起点开发同类药物,并通过基于片段的药物发现技术设计同类首创药物。
然而,尽管先导化合物优化具有显著的实际优势,但在 AIDD 领域,先导化合物优化获得的研究和关注度却不如从头设计方法。目前 AIDD 领域的先导化合物优化模型往往以单任务为导向,主要基于配体,例如 DeepFrag、DiffLinker、FFLOM 和 ScaffoldGVAE。这些模型的这两个特点限制了它们在现实场景中的适用性。

图示:四个子任务的模型比较。(来源:论文)
为了让 Delete 能够处理先导化合物优化中的所有这些任务,该团队提出了统一的掩蔽策略。值得注意的是,在 Delete 模型预印本发布后,学界发布了两个模型,REINVENT4 和 DrugEX v.3,它们实现了基于结构和先导化合物优化的概念。
然而,他们利用对接分数作为强化学习 (RL) 的奖励函数来指导分子生成,这仍然无法克服经验对接分数带来的假阳性问题。
基于机器学习的评分函数有可能缓解这些问题,侯廷军团队认为未来的研究将侧重于将这些方法与经典评分方法相结合,以创建利用两种技术优势的混合模型。因此,Delete 作为一种端到端结构学习模型,不依赖于嘈杂亲和力标签的训练,享有同类方法的优势。
研究人员对 Delete 的研究代表着在弥合上述差距方面向前迈出了一步,为先导化合物优化提供了一种基于结构的开创性综合解决方案。
更具体地说,该团队将先导化合物优化任务总结为四个不同的子任务:接头设计、片段加工、骨架跳跃和侧链修饰。为了确保 Delete 严格遵守物理定律,研究人员的目标是将模型与旋转等变性和不变性相结合。
换句话说,Delete 的输出几何形状与输入旋转动态对齐,同时保持恒定的原子和键合拓扑,从而无需数据增强,并且能够同时生成蛋白质 - 配体结合结构。
为了实现这一点,他们在模型设计中采用了等变标量化技术。受掩蔽图建模和图数据结构预训练策略的启发,该团队提出了一种统一的删除策略,包括三个增强掩蔽器(随机、空间和拓扑)和四个任务特定掩蔽器(连接子、片段、支架和侧链)。这些元素共同构建了一站式先导化合物优化模型 Delete。
实验评估
为了验证其有效性,研究人员进行了全面的评估,包括模型比较和回顾性分析,以快速评估其性能。此外,Delete 还用于概念化针对白细胞酪氨酸激酶 (LTK) 蛋白(之前确定的靶点)的新抑制剂。

图示:回顾性研究和迁移学习技术。(来源:论文)
具体而言,计算机模拟实验表明,Delete 在四个子任务中优于七个基线模型,以预测的结合亲和力来衡量。此外,Delete 在回顾性研究中成功完全重现了五个历史药物开发案例的结果。
在湿实验室实验中,该团队利用迁移学习技术将 Delete 扩展为基于结构和基于配体的模型的混合版本。
最终,Delete 成功设计了一系列针对 CLIP1-LTK 融合蛋白中 LTK 激酶结构域的活性配体,其中最有希望的候选配体 CA-B-1 表现出优异的纳摩尔活性(半数最大抑制浓度(IC50 = 1.36 nM)。随后对 CA-B-1 进行的体外和体内试验证实了其抗肿瘤功效及其阻碍癌细胞增殖的机制。

图示:Causal-Delete 在 LTK 目标上的应用。(来源:论文)
总之,这项研究凸显了基于结构的分子生成技术在药物发现中的变革潜力,它可以在一个半月内加速药物设计。
研究人员相信 Delete 方法将成为未来靶向治疗开发的潜在工具。