编辑 | 萝卜皮
变构药物为现代药物设计提供了一条新途径。然而,识别隐蔽的变构位点是一项艰巨的挑战。
四川大学蒲雪梅教授、邵振华研究员团队提出了一种先进的计算流程,结合残基驱动的混合机器学习模型(RHML)和分子动力学(MD)模拟,成功识别出了变构位点、变构调节剂,并揭示了它们的调控机制。
具体而言,在 β2 肾上腺素能受体(β2AR)中,团队发现了位于残基 D79^2.50、F282^6.44、N318^7.45和S319^7.46 附近的一个新的变构位点及潜在调节剂 ZINC5042。通过分子力学/广义 Born 表面积(MM/GBSA)和蛋白质结构网络(PSN)的分析,进一步揭示了变构效力及调控机制。
该研究以「Integrative residue-intuitive machine learning and MD Approach to Unveil Allosteric Site and Mechanism for β2AR」为题,于 2024 年 9 月 16 日发布在《Nature Communications》。
变构作用是一种关键的生物调控机制,涉及远程位点的结构和动态变化,广泛存在于各种生物过程中。变构药物通过非竞争性结合调节蛋白活性,具有更高的选择性和更低的毒性,已用于治疗癌症、神经精神疾病和免疫疾病。
虽然 MD 模拟可帮助识别隐匿的变构位点,但其数据量大,难以手动分析,并可能受人为偏见影响。为此,结合机器学习可提高识别变构位点的效率,并为药物开发提供新方法,尤其是针对 GPCR 类药物,如 β2AR 的变构位点识别,具有重要意义。然而,现有方法仍存在局限性,需要进一步发展无偏通用的识别方法。
在最新的研究中,四川大学蒲雪梅、邵振华团队结合无监督聚类和可解释的深度学习多分类模型,探索了一种残差直观混合机器学习(称为 RHML)框架。
通过该框架,研究人员可以解决类别标签缺失的问题,实现具有残基级可解释性的准确分类,从而识别涉及变构位点的重要残基。
图示:框架概述。(来源:论文)
具体来说,首先进行广泛的高斯加速分子动力学 (GaMD) 模拟以增强采样,从而构建足够的构象空间。利用构象空间,构建了一个残基直观混合机器学习(RHML)框架,该框架由无监督聚类和基于可解释卷积神经网络(CNN)的多分类器组成。
使用 RHML,研究人员可以确定最佳簇数(标签)和变构位点打开时的构象状态。然后,通过 FTMap 结合 RHML 的 LIME 解释器识别变构位点。根据识别的变构位点,从两个化合物数据集中筛选出潜在的变构调节剂。
通过常规 MD(cMD)、结合能分析、结构分析和调控通路分析进一步探讨变构位点/药物的调控作用及其调控通路。
最后,通过 cAMP 积累试验、β-arrestin 募集试验和定点诱变实验进行实验验证。总的来说,这项工作涉及六个系统、15 μs GaMD 模拟和 22.5 μs cMD 模拟。
在确定假定的变构位点和筛选相关的调节剂之后,研究人员进一步探究它们与正构位点和活性区域等功能域的通信。
图示:可解释的基于 CNN 的多分类模型的架构。(来源:论文)
该团队的目标是进一步预先评估作为变构位点/调节剂的潜力并揭示它们的调控机制,这对于确保预测成功率和合理设计蛋白质的变构性至关重要,但在以前的变构药物设计方法中经常被忽视。
为了验证该识别策略的有效性,研究人员选取 G 蛋白偶联受体(GPCR)家族中的β2肾上腺素受体(β2AR)作为研究对象,发现了 β2AR 的一个变构位点和一个负变构调节剂(ZINC5042),并通过细胞功能实验对其进行了验证。
图示:变构位点和药物筛选策略。(来源:论文)
得益于技术优势,RHML 揭示了 β2AR 和其他 GPCR 中以前未报道过的变构位点。额外的变构位点位于残基 D79^2.50、F282^6.44、N318^7.45 和 S319^7.46 周围,研究人员利用虚拟筛选发现了假定的变构调节剂 ZINC5042。
在大量 cMD 模拟、MM/GBSA 和 PSN 的帮助下,研究人员进一步探讨了变构位点/调节剂与正构位点/激动剂之间的通讯,这对于进一步估计变构潜力以提高变构位点/药物识别的成功率具有重要意义。
MM/GBSA 显示 ZINC5042 以负协同方式减弱正位激动剂与 β2AR 的结合。结构分析表明 ZINC5042 阻碍了钠离子结合口袋的坍塌和PIF基序向活性态的构象转变,从而驱动受体构象向非活性态转变。
PSN 表明变构调节剂 ZINC5042 结合会降低螺旋结构间的通讯,从而不利于激动剂刺激的激活信号传导。此外,还鉴定了一些重要的变构调节残基。
基于充分的计算证据,基于 Glosensor 的 cAMP 测定和定点诱变实验强有力地验证了对变构位点和负变构效应的计算预测,清楚地证实了所鉴定的关键残基 D79^2.50,F282^6.44,N318^7.45 和 S319^7.46 确实在结合变构调节剂和抑制正构激动剂诱导的活化信号传导中发挥重要作用,特别是对于 F282^6.44。
图示:ZINC5042 的效力和变构位点的实验验证。(来源:论文)
总体而言,该识别流程解决了现有 ML 模型在 MD 构象分析中的局限性,包括最佳类别数、构象表示中的信息丢失和基于残基的预测结果解释。因此,RHML 能够对任何 MD 轨迹进行准确的构象分类和识别决定不同构象类别的重要残基。
该团队还上传了一个用户友好的残基直观混合机器学习框架代码。该代码提供可自定义的输入选项,自动生成可读的输出文件,其中包括簇类别和决定分类的重要残基。
研究人员期望它将成为 MD 领域的一种有价值的工具,用于辅助变构位点识别和与构象分析相关的其他 MD 任务。
框架代码:https://github.com/chyannn06/RHML
论文链接:https://www.nature.com/articles/s41467-024-52399-y