摘要:蛋白质是生命活动的“全能选手”,从细胞结构到免疫防御,全靠它“撑场子”。虽然由 20 种氨基酸通过肽键连接形成,但排列组合方式多到“爆炸”!如果考虑所有可能的氨基酸排列方式,理论上,蛋白质的种类几乎是无限的。仅 100 个氨基酸的链条,就能拼出 20*100
蛋白质有多少种?
比宇宙原子还多!
蛋白质是生命活动的“全能选手”,从细胞结构到免疫防御,全靠它“撑场子”。虽然由 20 种氨基酸通过肽键连接形成,但排列组合方式多到“爆炸”!如果考虑所有可能的氨基酸排列方式,理论上,蛋白质的种类几乎是无限的。仅 100 个氨基酸的链条,就能拼出 20*100 种可能,比宇宙原子总数还多!虽然蛋白质的种类几乎无穷,但它们都由 20 种基本氨基酸按照不同顺序和组合方式构成。生物体内的蛋白质种类受基因编码的限制,例如人类基因组大约编码 2 万种蛋白质,而通过剪切、翻译后修饰等机制,最终可能形成几十万种功能各异的蛋白质。不同物种、不同细胞类型甚至相同细胞在不同状态下,都可能表达出不同的蛋白质组合。蛋白质设计就是利用科学方法让氨基酸以不同的排列方式“定制”蛋白质,使其具备特定的结构和功能。就像用不同的积木搭建出独特的模型,科学家根据需求排列组合氨基酸,从而创造新的蛋白质。借助计算机模拟和人工智能,我们可以更精准地预测和优化蛋白质结构,让它们更稳定、更高效地完成目标任务。最近科学家通过 AI 设计“抗蛇毒蛋白”,仅用几秒钟就可以完成人类百年抗蛇毒的问题。传统抗蛇毒血清:
“慢”!“贵”!“难”!
据 WHO 统计,全世界每年有 540 万人被蛇咬伤,约 13 万人死于蛇咬伤,因蛇咬伤截肢等造成残疾的人数大约是 39 万人。蛇毒中的毒性成分进入人体后,会迅速对人体的神经系统、心血管系统、凝血系统以及各类细胞等造成损伤。全世界每年约有 540 万人被蛇咬伤。图库版权图片,转载使用可能引发版权纠纷
正常情况下,免疫系统对于曾经接触过的病原体能快速做出反应,但绝大多数人在被蛇咬之前并没有接触过蛇毒。所以,被蛇咬后人体自身的免疫防御很难马上起效,往往需要借助外部的抗蛇毒血清等治疗手段来尽快中和蛇毒,避免蛇毒对身体造成更严重的伤害。然而,世界上许多地区都存在严重的抗蛇毒血清不足。传统血清怎么来?首先,需要从毒蛇体内提取出毒液,再将少量毒液注射到马或羊等动物的体内,诱导免疫反应的产生。经过多次免疫后,再从动物体内采集血液,分离出血清,即可获得有效的抗蛇毒血清。一套流程下来,耗时数月,成本高昂,同时不同地区的蛇种不同,毒液成分差异大,传统血清难以覆盖所有蛇毒。AI 出手,抗蛇毒血清更加有效
近年来,针对传统抗蛇毒血清制备方法的改进研究取得了显著进展,尤其是人工智能(AI)与计算机辅助设计技术的融合为抗蛇毒血清研发带来了新的突破。2025 年,美国华盛顿大学蛋白质设计研究所的 David Baker 团队在《自然》(Nature)杂志发表重磅研究。他们开发的 RFdiffusion 深度学习方法,可以模拟出对一种广泛存在于蛇毒中的小型蛋白毒素——三指毒素,具有高亲和力和高特异性的结合蛋白。另外,通过计算设计出的抗蛇毒蛋白具有高热稳定性,可通过微生物发酵策略大规模生产,和传统血清制备技术比起来,极大地降低了生成成本。数据训练:通过分析大量已知蛋白质结构,模型掌握了蛋白质形成的规律。
结构生成:从随机初始化的蛋白质状态出发,逐步调整氨基酸残基的位置,最终生成稳定的三维结构。
功能优化:通过多轮生成与优化,模型逐步调整蛋白质原子的位置,使其从最初的无序状态演化为符合生物学规律的稳定构象。
蛋白质设计的演进:
从理论奠基到 AI 革命
蛋白质设计领域经历了从理论萌芽到人工智能驱动的跨越式发展,这一历程堪称现代生物技术的典范。20 世纪中期,Christian Anfinsen 提出的"氨基酸序列决定蛋白质三维结构"假说,为计算蛋白质设计奠定了理论基础。随着计算方法的进步,Rosetta 软件的问世标志着蛋白质工程进入新纪元,该工具使科学家能够在计算机上预测并设计稳定的蛋白质结构。2003 年,David Baker 团队在《科学》(Science)杂志发表的 Top 7 蛋白研究具有里程碑意义,完全人工设计的蛋白质(98 个氨基酸),并且在自然界中没有同源蛋白。这项突破首次证明计算方法可以设计具有稳定折叠结构的蛋白质,为从头重新蛋白质设计奠定了基础。人工智能的引入彻底改变了蛋白质设计领域。2020 年,DeepMind 公司的 AlphaFold 2 在蛋白质结构预测领域取得历史性突破,通过深度学习精确预测蛋白质结构,在 CASP 14 竞赛中达到了接近实验的精度。随后,Meta AI 的 ESMFold 进一步加速了蛋白质结构预测,实现未知蛋白质的大规模解析,为蛋白质设计提供更丰富的数据基础。同时,生成式 AI 的引入带来质的飞跃,RFdiffusion 实现从头设计功能性蛋白质,大幅提高了蛋白质工程的可塑性和效率。2023 年,David Baker 团队再创佳绩,进一步推进人工智能在蛋白质设计领域的应用,开发了一种基于深度学习的 AI 算法,成功从头设计出一种具有高催化活性和高底物特异性的人造荧光素酶。这是首次完全依赖 AI 生成全新酶类蛋白,标志着人工智能驱动的蛋白质设计从结构预测迈向功能设计的关键转折点。2024 年,瑞典皇家科学院将诺贝尔化学奖授予 David Baker,表彰其在计算蛋白质设计方面的贡献,并将另一半授予 Demis Hassabis和 John M. Jumper,以表彰他们在蛋白质结构预测方面的突破。这一殊荣不仅是对个人成就的肯定,更是对整个蛋白质设计领域的认可,彰显了计算生物学在现代科学中的核心地位。AI 蛋白质设计正在突破传统方法的局限,大幅拓展蛋白质发现的边界。与依赖天然模板或随机突变的传统方法相比,AI 技术能够突破进化限制,快速生成具有全新功能的蛋白质,如人工酶、智能生物材料等。通过深度学习和生成模型的结合,AI 将蛋白质筛选与优化流程从传统方法所需的数月时间,大幅缩短至数小时或数周。在医疗应用方面,AI 蛋白质设计展现出广阔前景。除了前文提到的抗蛇毒血清外,这项技术还可开发抗菌、抗病毒蛋白及靶向降解工具,助力耐药性疾病和神经退行性疾病治疗。未来,AI 蛋白质设计与自动化实验技术的结合将带来更多突破。这种融合将加速蛋白质功能优化过程,推动合成生命系统的构建,为精准医疗、绿色能源和合成生物学等领域带来革命性进展。参考文献
[1]Ortiz-Prado, E., Yeager, J., Andrade, F., Schiavi-Guzman, C., Abedrabbo-Figueroa, P., Terán, E., Gómez-Barreno, L., Simbaña-Rivera, K., & Izquierdo-Condoy, J. S. (2021). Snake antivenom production in Ecuador: Poor implementation, and an unplanned cessation leads to a call for a renaissance. Toxicon : official journal of the International Society on Toxinology, 202, 90–97.
[2]Watson, J. L., Juergens, D., Bennett, N. R., Trippe, B. L., Yim, J., Eisenach, H. E., Ahern, W., Borst, A. J., Ragotte, R. J., Milles, L. F., Wicky, B. I. M., Hanikel, N., Pellock, S. J., Courbet, A., Sheffler, W., Wang, J., Venkatesh, P., Sappington, I., Torres, S. V., Lauko, A., … Baker, D. (2023). De novo design of protein structure and function with RFdiffusion. Nature, 620(7976), 1089–1100.
[3]Vázquez Torres, S., Benard Valle, M., Mackessy, S. P., Menzies, S. K., Casewell, N. R., Ahmadi, S., Burlet, N. J., Muratspahić, E., Sappington, I., Overath, M. D., Rivera-de-Torre, E., Ledergerber, J., Laustsen, A. H., Boddum, K., Bera, A. K., Kang, A., Brackenbrough, E., Cardoso, I. A., Crittenden, E. P., Edge, R. J., … Baker, D. (2025). De novo designed proteins neutralize lethal snake venom toxins. Nature, 10.1038/s41586-024-08393-x. Advance online publication.
出品丨科普中国
作者丨Denovo团队
监制丨中国科普博览
责编丨一诺
审校丨徐来 林林
转载使用可能引发版权纠纷
来源:科普中国