编辑 | 白菜叶
抗菌素耐药性是一个日益严重的健康问题。抗菌肽 (AMP) 通过非特异性机制破坏有害微生物,使微生物难以产生耐药性。因此,它们有望成为传统抗菌药物的替代品。
在这项研究中,韩国光州科学技术院(GIST)的研究人员开发了一种改进的 AMP 分类模型,称为 AMP-BERT。
该团队提出了一种深度学习模型,该模型具有来自 Transformers(BERT)架构的微调双向编码器表示,旨在从输入肽中提取结构/功能信息,并将每个输入识别为 AMP 或非 AMP。研究人员比较了该模型与其他基于机器学习的模型的性能。AMP-BERT 在使用研究人员精选的外部数据集评估的所有模型中产生了最佳预测结果。
另外,研究人员利用 BERT 中的注意力机制来实施可解释的特征分析,并确定已知 AMP 中有助于肽结构和抗菌功能的特定残基。结果表明,AMP-BERT 可以捕获用于模型学习的肽的结构特性,从而能够从输入序列中预测 AMP 或非 AMP。AMP-BERT 有望有助于识别用于功能验证和药物开发的候选 AMP。
该研究以「AMP-BERT: Prediction of antimicrobial peptide function based on a BERT model」为题,于 2022 年 12 月 3 日发布在《Protein Science》。
在过去的几十年里,抗菌素耐药性已成为全球主要的公共卫生问题。这导致寻找治疗微生物感染的替代方法。
其中一项创新是发现了某些肽的抗菌特性。抗菌肽 (AMP) 是存在于大多数动物、植物和微生物中的短肽,可作为抵御感染的天然防御手段。AMP 通过非特异性机制对抗有害细菌,防止它们产生抗菌素耐药性。
尽管具有这些非凡的能力,但对 AMP 的研究仍受到阻碍,因为用于识别候选 AMP 的现有系统就像一个黑匣子,输出不容易解释以供进一步分析。
现在,在蛋白质科学最近发表的一项突破中,光州科学技术学院的一组研究人员,包括 Hojung Nam 教授和 Hansol Lee 先生,提出了一种 AMP-BERT 分类系统,该系统使用来自 Transformers (BERT) 架构的基于 AI 的双向编码器表示来改进现有的 AMP 分类模型。
当被问及开发分类系统背后的动机时,Nam 教授解释说:「抗生素的滥用和过度使用导致了这些抗生素无法有效治疗的细菌的产生。这不仅增加了人类的健康风险,也增加了农业的健康风险。因此,我们希望开发一个 AMP 预筛选平台,它不是算法的黑匣子,但可以很容易地解释以进行进一步研究。」
该团队整合了一个基于自然语言处理(NLP)的深度神经网络,该网络使用数十亿个蛋白质序列进行预训练,然后使用基准 AMP 数据库中的数千个肽序列进行微调。这使得 AMP-BERT 模型不仅可以从输入的肽序列中提取结构和功能信息,还可以区分 AMP 和非 AMP。这增强了预测能力,使模型即使使用外部数据也能做出更好的分类。
该团队还设计了模型,为输入肽序列中的每个氨基酸分配单独的注意力分数。然后,注意力特征揭示了 AMP 的重要子区域,这些子区域在决定肽是否具有抗菌特性方面起着重要作用。此外,预测结果表明 AMP-BERT 模型的适用性甚至扩展到看不见的肽数据,并且它可以从这些肽中学习有意义的功能和结构信息。
新型 AMP-BERT 肽预筛选模型可以为发现和开发用于治疗耐药疾病的基于 AMP 的候选药物打开新的大门。该预测平台提供的重要肽亚区域信息也可用于优化肽的抗生素效率。
Nam 教授总结道:「随着越来越多的 AMP 得到实验验证,并使用计算方法发现新的结构信息,我们将能够制造出更有效的抗生素药物,并有可能在不久的将来阻止新的大流行病在全球蔓延。」
数据集:https://github.com/GIST-CSBL/AMP-BERT
论文链接:https://onlinelibrary.wiley.com/doi/10.1002/pro.4529
相关报道:https://phys.org/news/2023-02-ai-based-finder-antimicrobial-peptides.html