工程酶在实际应用中的潜力常常受到表达水平、热稳定性以及催化活性的多样性和程度的限制。从头酶设计虽然令人兴奋,但也受到酶催化的复杂性的挑战。另一种有前途的方法涉及扩展现有天然酶的能力,以实现跨新底物和操作参数的功能。
无细胞酶工程公司 Enzymit 的研究人员引入 CoSaNN(使用神经网络的构象采样),这是一种酶设计的新策略,利用深度学习的进步进行结构预测和序列优化。通过控制酶的构象,研究人员可以扩展化学空间,使其超出简单诱变的范围。CoSaNN 使用上下文相关的方法,通过考虑序列和结构空间中的非线性关系来准确生成新颖的酶设计。
此外,该团队还进一步开发了 SolvIT,这是一种经过训练可预测大肠杆菌中蛋白质溶解度的图神经网络,作为生产高表达酶的额外优化层。通过这种方法,研究人员设计了具有优异表达水平的新型酶,其中 54% 的设计在大肠杆菌中表达,并提高了热稳定性,超过 30% 的设计具有比模板酶更高的 Tm。
该研究以「Context-Dependent Design of Induced-fit Enzymes using Deep Learning Generates Well Expressed, Thermally Stable and Active Enzymes」为题,于 2023 年 8 月 2 日发布在 bioRxiv 预印平台。
酶设计代表了计算蛋白质设计领域最后剩下的前沿之一,需要对表达、稳定性、构象可塑性和催化功能等多个目标进行优化。最后一个特别具有挑战性,因为它需要对量子现象进行建模,而量子现象在很大程度上仍然知之甚少。
设计新型酶的能力不仅对科学家对「蛋白质规则集」的理解提出了严格的考验,而且还提供了一项变革性技术,因为它将实现新的制造工艺,比现有的制造工艺效率提高几个数量级。
虽然完全从头设计催化机制仍然对计算蛋白质设计提出了艰巨的挑战,在这里,Enzymit 公司的研究人员提出了一种规避这一挑战的方法,并重点关注通过从进化过程中汲取灵感来扩展天然酶的催化能力,进化过程通过保留核心催化机制同时引入外围构象和序列的变化来产生多样性。
「人工酶固有的不稳定性,加上生产挑战和它们可以促进的反应范围有限,限制了它们在现实世界中的应用,而由于此类蛋白质的复杂性质,新型酶的创造已被证明具有挑战性。」Enzymit 首席执行官 Gideon Lapidoth 博士说道。「这项研究强调了人工智能在克服开发商业上可行的酶的基本挑战方面的作用。」
虽然这种工程概念本身并不新鲜,并且经常用于定向进化等实验技术中,但这些技术在探索难以想象的大结构序列空间时效率极低。自然进化以逐步的方式探索结构序列空间。这种保守的方法反映了一种生物学限制:一次向蛋白质引入太多突变会增加产生不可折叠或无功能蛋白质的风险。
像 Rosetta 这样的计算设计工具的出现使人们能够在结构序列空间中「蛙跳」,从而进行更广泛的探索。然而,这些技术也有其缺点。依赖随机移动来探索蛋白质空间,以及使用无法捕获高阶氨基酸协同性的有限评分函数,意味着许多探索蛋白质空间的设计轨迹最终会进入不可折叠区域。
在最新的研究中,Enzymit 公司的研究团队通过开发两种新的基于人工智能的专有工具 CoSaNN(使用神经网络的构象采样)和 SolvIT 来应对这些挑战。
CoSaNN 利用先进的深度学习功能,根据酶的基因序列与其三维结构之间的关系生成新的酶构象。这种重新设计酶形状的能力使得新的化学反应成为当前设计工具无法实现的。SolvIT 是一种图形神经网络工具,可用作大肠杆菌中蛋白质溶解度的预测模型,并为生产高表达酶提供额外的优化层。
具体来说,研究人员将结构序列设计过程视为两个独立的步骤。首先,研究人员利用训练有素的结构预测深度神经网络的「强制预测」功能,这意味着即使对于现实世界中「可折叠」的输入序列,这些模型仍然会产生「类似原生」的蛋白质构象。在这之后,它们很可能处于不可折叠的序列结构空间区域。为了纠正这个问题,研究人员应用反向折叠神经网络沿着序列维度移动,同时保持构象固定,将它们带回蛋白质空间的可折叠区域。最后,研究人员应用一个额外的优化层来增加生成高度可表达设计的可能性。这个过程同时显著提高了蛋白质空间采样效率,同时大大简化了它。
图示:CoSaNN 在序列结构空间里。(来源:论文)
使用这种方法,CoSaNN 能够生成新型酶,虽然在构象和序列空间上与天然同源物极为不同,但仍然保持高活性并表现出卓越的稳定性和表达性,这是任何酶的基本特性。使用这种方法,CoSaNN 能够生成新型酶,虽然在构象和序列空间上与天然同源物极为不同,但仍保持高活性并表现出卓越的稳定性和表达性,这是任何商业相关酶的基本特性。
不仅如此,他们还直接应对设计具有复杂活性机制的酶的挑战,这些酶在底物结合时经历显著的构象变化,证明了了新方法捕获复杂氨基酸相互作用的能力。这种能力对其他蛋白质设计挑战(例如变构调节)具有影响。
该方法能够显著修改酶的结构,而不会对催化活性和变构机制产生不利影响,这使研究人员能够在比单点突变更大的程度上编码新的底物特异性。
结合起来,这些工具能够创造出与替代方法相比具有显著更高的热稳定性并表现出优异表达水平的新酶。54%的酶设计在大肠杆菌中成功表达,其中30%表现出比模板酶更高的热稳定性。
通过在该方法中添加表达过滤层,研究人员可以生成具有大量突变的设计,远远超出了使用当前可用的实验技术所能实现的设计。研究人员不必依赖高通量技术来筛选酶设计,这大大降低了开发新酶所需的复杂性和时间。
「这项研究证明了人工智能在新型酶序列设计中的变革潜力,因为它能够捕获蛋白质内复杂的相互作用并维持其固有机制,即使在经过大量修改后也是如此。」Enzymit 董事会成员兼科学顾问 Joseph Jacobson 教授说道,「利用人工智能的力量,我们能够以显著更大的产量创造出更加稳定的酶,并以显著降低的成本用于广泛的商业应用。」
关于Enzymit
Enzymit 正在构建一个无细胞生产平台,该平台将使生物生产更快、更简单、更具成本效益且可持续。该公司利用复杂的计算设计和深度学习算法来创造用于现实世界环境的新型酶。这些高度稳定和强大的酶可以承受更高的温度,工作时间比以往任何时候都长,从而能够以更高效、更环保的方式生产新型分子。Enzymit 由计算蛋白质设计、生物工程和分子生物学专家于 2020 年创立。该公司总部位于以色列内斯齐奥纳。
Enzymit官网:https://enzymit.com/
论文链接:https://www.biorxiv.org/content/10.1101/2023.07.27.550799v3
相关报道:https://www.biospace.com/article/releases/new-research-demonstrates-application-of-enzymit-s-deep-learning-technology-for-novel-biocatalysis-design/?keywords=AI