编辑 | 2049
世界卫生组织预测,到 2050 年,抗生素耐药性感染可能导致每年 1000 万人死亡,超越癌症成为人类健康的首要威胁。随着抗生素滥用导致的耐药性问题日益严重,开发新型抗菌药物已成为当务之急。
在此背景下,抗菌肽(Antimicrobial Peptides,AMPs)因其广谱抗菌活性和低耐药性特征,被视为下一代抗感染药物的希望之星。然而,传统设计方法受限于化学空间的庞杂性,难以高效探索新型 AMPs。
现有 AI 生成模型虽能加速肽序列设计,却面临两大瓶颈:生成序列多样性不足(相似度普遍高于 0.7),且抗真菌肽研究几乎空白。
针对这一挑战,山东大学药学院研究团队创新性地将潜在扩散模型(Latent Diffusion Model,LDM)与分子动力学模拟结合,开发出 AMP 设计新范式。实验显示,该方法生成的肽序列相似度低至 0.5686,其中 AMP-29 对耐药性白色念珠菌的抑制浓度(MIC)达 6.25 μM,体内疗效显著。
该研究以「Artificial intelligence using a latent diffusion model enables the generation of diverse and potent antimicrobial peptides」为题,发表于 2025 年 2 月 5 日的《Science Advances》。
![图片](https://image.jiqizhixin.com/uploads/editor/d166f745-6ae9-4d03-b6ae-12c59913ee47/640.png)
研究背景
抗菌肽通过破坏微生物细胞膜发挥杀菌作用,其多靶点机制可有效延缓耐药性产生。AI辅助设计虽能提升开发效率,现有方法却陷入两难:基于筛选的模型需遍历指数级化学空间,计算成本高昂;生成式模型虽能探索更大空间,但序列相似度居高不下,且大多数研究聚焦于抗菌肽,抗真菌肽设计研究相对较少。
究其根本,传统生成对抗网络(GAN)和变分自编码器(VAE)难以捕捉 AMPs 的复杂序列特征。扩散模型(Diffusion Model)虽在图像生成中表现卓越,但其直接应用于蛋白质序列设计时,存在维度灾难和特征解耦困难。
研究团队突破性地提出:通过潜在空间降维,将序列生成与物化属性解耦,并引入条件约束机制,实现 AMPs 的定向生成。这一技术路径为突破多样性瓶颈提供了全新可能。
研究团队构建了基于 Transformer 的双阶段架构,通过变分自编码器将可变长度肽序列映射至 128 维潜在空间。核心创新在于引入蛋白质语言模型 ESM2 650M 进行特征提取,使潜在变量能够编码高阶结构信息。
扩散阶段采用 BERT 编码器构建条件约束机制。在预训练 48 万条通用肽序列后,使用 1:10 的正负样本比例进行微调,使模型能区分 AMPs 与非 AMPs。
通过调节噪声缩放因子(Scaling Factor),模型在保持多样性的同时,将序列与训练集的相似度控制在 0.5686±0.0720,较其他现有方法显著降低
图示:基于潜在扩散模型的 AMP 生成流程。(来源:论文)
筛选机制与实验验证
生成后的 60 万候选序列需经过严格筛选。第一级集成分类器(RNN-CNN-Transformer)以 91% 的准确率初筛潜在 AMPs;第二级通过 CD-HIT 聚类(阈值 0.6)提升多样性;第三级结合随机森林模型与粗粒度分子动力学模拟,预测肽-膜相互作用。
图示:生成肽的理化性质与活性验证。(来源:论文)
关键突破在于分子动力学筛选体系:通过构建 3:1 POPC/POPG 膜模型,模拟 500 ns 内肽与膜的相互作用。结果显示,活性肽(如 AMP-24)能深入嵌入膜内并引发脂质重排,而非活性肽仅吸附于膜表面。
体内实验中,2% AMP-29 凝胶处理 24 小时可显著降低小鼠皮肤真菌载量;静脉注射 AMP-24(40 mg/kg)显著减轻肺纤维化,且心脏、肝脏未见毒性损伤。
值得注意的是,AMP-24 对革兰阴性菌表现出独特的作用机制:其通过形成螺旋结构平行插入膜内,引发环形孔洞效应,该机制经全原子分子动力学模拟验证。
图示:AMP-24与 AMP-29 的机制与疗效。(来源:论文)
未来展望
本研究将潜在扩散模型应用于抗真菌肽设计,成功提高了序列多样性。通过融合语言模型特征编码与多物理场筛选,实现了「生成-验证」闭环。
然而,当前模型尚未整合二级结构等关键参数,导致部分候选肽存在溶血毒性。未来研究可引入强化学习,将毒性预测作为生成约束条件;同时拓展至其他类型的功能性肽设计。
论文链接:https://www.science.org/doi/10.1126/sciadv.adp7171