摘要:基因表达效率低、蛋白表达失败,是合成生物学和工业生物制造中常遇到的难题。传统优化方法虽能部分提升表达水平,却可能因过度使用高频密码子而导致翻译异常或蛋白错误折叠。近日,中国科学院天津工业生物技术研究所(以下简称“天津工业生物技术研究所”)新酶设计研究团队在这一
津滨海讯(记者 单毅 张惺卓 王鼎鑫 摄影报道)基因表达效率低、蛋白表达失败,是合成生物学和工业生物制造中常遇到的难题。传统优化方法虽能部分提升表达水平,却可能因过度使用高频密码子而导致翻译异常或蛋白错误折叠。近日,中国科学院天津工业生物技术研究所(以下简称“天津工业生物技术研究所”)新酶设计研究团队在这一领域取得重要进展,开发出基于深度学习的密码子优化模型DeepCodon,实现了在提升基因表达效率的同时,兼顾蛋白折叠的稳定性。
记者了解到,密码子优化是外源基因在宿主细胞中高效表达的关键步骤。传统方法多依赖于将稀有密码子替换为高频密码子,但可能破坏序列中与蛋白质正确折叠和翻译过程密切相关的关键结构,导致表达效果不理想甚至失败。
DeepCodon模型以人工智能技术为基础,通过学习大量天然蛋白质序列数据,建立起从蛋白质结构到编码序列的智能“翻译映射”。该模型不仅能够生成具有高表达潜力的密码子序列,还通过条件概率策略,优先保护进化上保守、与功能相关的稀有密码子区域,从而避免因过度优化引发翻译拥堵或蛋白错误折叠风险。
在实验验证阶段,研究团队选取20个基因,分别采用DeepCodon和传统方法进行优化,并导入大肠杆菌进行表达测试。结果显示,使用DeepCodon优化的基因中,9个表达量显著高于传统方法,10个表达水平相当,仅1个略低。这一结果充分表明DeepCodon在实际应用中的有效性和广泛适用性。目前,DeepCodon主要面向大肠杆菌表达系统,研究团队已推出免费在线服务,供科研人员和企业进行密码子优化设计与分析。
DeepCodon的推出,为合成生物学领域的基因设计提供了更加智能化、精准化的工具,有望在医药、能源、化工等工业生物制造领域发挥重要作用。据悉,该研究得到中国科学院战略性先导科技专项、国家自然科学基金等多个项目的支持,相关成果发表于国际学术期刊《BioDesign Research》。
来源:津滨海