摘要:结构域是蛋白质的结构和功能亚基,蛋白质结构域的人工重组已被证明是一种设计具有自然界中不存在的特性的新型蛋白质的有效方法。例如,某些细菌通过结构插入快速获得抗生素抗性,而真核生物则利用这一机制发展出复杂的信号传导网络。
结构域是蛋白质的结构和功能亚基,蛋白质结构域的人工重组已被证明是一种设计具有自然界中不存在的特性的新型蛋白质的有效方法。例如,某些细菌通过结构插入快速获得抗生素抗性,而真核生物则利用这一机制发展出复杂的信号传导网络。
受此启发,研究人员们尝试在实验室中模拟这一过程,将外源域(如光感应域或药物结合域)插入目标蛋白质,从而创造出智能生物分子。例如,将光敏域插入 CRISPR-Cas9 核酸酶,可以实现光控基因编辑;将药物感应域插入抗生素抗性蛋白,则可以设计出仅在特定条件下激活的“分子开关”。
图 | 将外源域插入目标蛋白质可获得新型功能蛋白质
然而,人工设计结构域插入面临两大难题:一是插入位点的选择——宿主蛋白质的哪些区域能够容忍外源结构域而不丧失功能?二是插入后的变构效应——如何确保外源结构域的引入能够精确调控宿主蛋白质的活性?
过去,研究人员通常采用“盲筛”策略:构建包含数百万种插入变体的文库,通过高通量实验筛选功能性组合。这种方法不仅周期长(耗时数月),而且成功率低;另一种思路是基于蛋白质结构计算能量变化,预测插入位点,但结构解析成本高,且许多蛋白质缺乏精确的三维模型。
为了突破这一瓶颈,近日,德国海德堡大学 Jan Mathony 和 Dominik Niopek 团队发表在 Nature Methods 上的一项题为的“Rational engineering of allosteric protein switches by in silico prediction of domain insertion sites”的研究中,提出了一种全新的机器学习方法。该研究团队开发了一个名为 ProDomino 的机器学习模型,能够仅凭蛋白质的氨基酸序列,预测适合插入其他结构域的精确位点,实现可切换蛋白的高效设计。研究人员在细菌和人类细胞中验证了他们的发现,并发现该模型预测的确认率非常高。此外,该工具还用于成功设计几种变构控制的蛋白质变体,包括抗生素抗性酶和光触发或药物触发的 CRISPR-Cas 核酸酶。
研究团队意识到,自然界中现存的多域蛋白质可能保留了远古结构域插入事件的“化石记录”。通过分析蛋白质数据库,他们筛选出约 17.5 万条自然发生的杂交域序列,涵盖数百种宿主域和插入域类型。这一数据集揭示了结构域插入的普遍规律——插入事件遍布所有生物类群,且倾向于避开宿主域的中部区域(这可能因为中部插入易破坏蛋白质核心结构)。更令人惊讶的是,某些结构域表现出广谱兼容性——它们能够插入多种宿主域中,而另一些则高度专一,这些发现为机器学习提供了宝贵的特征标签。
ProDomino 的算法架构融合了多项前沿技术。首先,它利用蛋白质语言模型 ESM-2 将氨基酸序列转化为数学向量,捕捉序列中的进化保守性和局部结构特征;其次,通过“位置掩码”技术模拟域插入对序列上下文的影响;最后,采用短周期训练策略避免过拟合。
由于自然界中不存在“明确失败”的插入案例(负样本稀缺),团队创新性地引入已知实验数据作为基准,逐步优化模型。这种训练方式使 ProDomino 不仅能预测耐受插入的位点,还能识别潜在的变构调控位点——即插入外源域后可能远程调控宿主蛋白质活性的关键区域。
图 | ProDomino 加速了域插入工程的工作流程
最终,ProDomino 的实用性在多项实验中都得到了验证。
在一项关键测试中,模型准确预测了抗生素抗性蛋白 TEM-1 的插入位点,研究人员据此设计出了光控变体。当用蓝光照射时,插入的光敏域(LOV2)会改变构象,从而激活 TEM-1 的酶活,使细菌获得抗药性。这一过程在大肠杆菌和人类细胞中均实现近 80% 的预测准确率,远超传统方法。
更复杂的案例是 CRISPR-Cas9 的改造。ProDomino 成功预测了化脓链球菌 Cas9 蛋白(SpCas9)的三个高评分插入位点(如 D1284 和 T1048),这些位点恰好位于已知的变构调控区域。研究人员将皮质醇结合域插入这些位点,成功创造出了“药物开关”:只有在添加激素时,Cas9 才会切割 DNA——这种精准控制对基因治疗来说至关重要,可避免脱靶效应带来的安全隐患。
总的来说,ProDomino 为蛋白质开关的设计提供了全新的思路和方法,通过机器学习和计算预测技术,实现了蛋白质结构域插入的理性设计。
随着技术的不断进步,ProDomino 有望成为蛋白质工程和生物技术研究的重要工具,帮助研究人员们在更短时间内设计出更多功能强大的可调控蛋白质。
参考文献:
1. Wolf, B., Shehu, P., Brenker, L. et al. Rational engineering of allosteric protein switches by in silico prediction of domain insertion sites. Nat Methods 22, 1698–1706 (2025). https://doi.org/10.1038/s41592-025-02741-z
免责声明:本文旨在传递合成生物学最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。
来源:生辉SciPhi