摘要:2025年9月17日,斯坦福大学(Stanford University)和阿克研究所(ArcI nstitute)的Brian Hie研究团队在预印本平台bioRxiv发布的研究,给生命科学圈投下了一颗重磅炸弹。
撰文 / 钱亚光
编辑 / 张 南
设计 / 柴文静
现在已经进入了AI吟诗作画的时代,但如果AI开始绘制生命本身的设计即“基因组”,你会有什么感觉呢?其实这已经成为现实,不再是科幻世界里的事了。
2025年9月17日,斯坦福大学(Stanford University)和阿克研究所(ArcI nstitute)的Brian Hie研究团队在预印本平台bioRxiv发布的研究,给生命科学圈投下了一颗重磅炸弹。
研究员在BSL-1级生物安全实验室的超净工作台前,将化学合成的DNA片段导入大肠杆菌(Escherichia coli)培养皿,72小时后观察到了教科书级别的“菌斑效应”——直径2-3毫米的透明圆圈里,细菌被彻底裂解,而造成这一结果的,是自然界从未存在过的人工噬菌体。
该研究的领头人之一、斯坦福大学化学工程助理教授、阿克研究所的创新研究员Brian Hie回顾这一瞬间说:“实际看到AI生成的球体时,印象非常深刻。”
这场实验的主角ΦX174噬菌体本是生命科学史上的“明星模板”。噬菌体(bacteriophage)是一种自然界存在的能够感染细菌细胞的病毒。1915年和1917年,噬菌体由英国病理学家弗雷德里克·特沃特(Frederick Twort)和法国–加拿大双重国籍微生物学家费利克斯·德赫雷尔(Félix d’Hérelle)分别独立发现,并逐步应用于临床治疗细菌感染。
1977年它成为首个被完整测序的基因组,助弗英国生物化学家弗雷德里克·桑格(Frederick Sanger)拿下诺贝尔奖;2003年,美国生物学家、CeleraGenomics公司创始人约翰·克雷格·文特尔(John Craig Venter)合成其基因组,实现书写生命代码的突破;如今AI则完成了更关键的设计跨越。
此次AI生成的302个候选基因组中,16个成功“复活”,其中Evo-Φ2483的裂解效率令人惊叹:在OD600值(衡量细菌密度的指标)测试中,它将宿主密度降至0.07仅需4小时,比天然ΦX174快25%,堪称“速效杀手”。
▲ BrianHie和他的Evo研发团队
更意外的是AI的跨界创新:Evo-Φ36噬菌体被发现嵌入了远亲噬菌体G4的基因片段,这种跨物种基因重组人类科学家曾多次尝试均告失败,AI却通过序列优化实现了功能兼容。当16种AI噬菌体组成“鸡尾酒疗法”测试时,它们成功突破了三种耐药大肠杆菌的防线——这些菌株对头孢哌酮等6种抗生素均已耐药,天然噬菌体也束手无策。
纽约大学朗格尼健康中心(NYU Langone Health)的生物学家杰夫·博克(Jef Boeke)表示,这是朝着由AI设计的生命形式迈出的“令人印象深刻的一步”。他从《麻省理工科技评论(MIT Technology Review)》处获得了该论文的预发版本。
01
AI如何学会“写生命代码”
▲去年11月,Evo的第一个版本(在80000种细菌、古细菌和病毒的基因组上进行训练)就登上了《科学(Science)》杂志封面
Evo系列AI模型的创作能力,源于对生命密码的深度拆解。团队打造的两款核心模型中,Evo-1已在200万个噬菌体基因组上完成基础训练,而升级版Evo-2的“学识”更为惊人:它吞噬了12.8万个全基因组数据,涵盖细菌、古菌、动植物等所有生命域,总计9.3万亿个核苷酸,训练参数高达400亿。
这种训练并非简单的序列记忆,而是让AI掌握基因组的“语法规则”。以ΦX174为例,其5386个核苷酸构成的基因组看似简短,却暗藏7个调控元件、2个识别序列,更特殊的是存在重叠基因结构——一段DNA同时编码两种蛋白质,就像一句话用两种语言解读都通顺,任何碱基突变都必须满足双重约束。
Evo模型通过无监督学习,精准捕捉到这些隐性规则:比如基因A与基因B的间隔区必须保留18个碱基的“标点符号”,衣壳蛋白基因的起始密码子后必须跟随特定的疏水氨基酸序列。
设计过程如同“精准命题作文”:研究人员先给AI输入ΦX174的核心基因片段作为“提示词”,再通过监督学习设定目标——“能感染大肠杆菌C株”“裂解效率高于天然噬菌体”。AI生成序列后,团队用定制化基因预测工具筛选:必须包含至少7个关键蛋白编码基因,调控元件完整性达90%以上,最终从数千个候选方案中挑出302个进入实验阶段。
最令人惊叹的是AI的“原创性”:16个成功复活的噬菌体中,每个都带有67-392个新突变,Evo-Φ2147与最近缘天然噬菌体的平均核苷酸一致性仅93%,达到微生物新物种的分类标准。冷冻电镜解析显示,Evo-Φ36的DNA包装蛋白——J蛋白长度从天然的38个氨基酸缩短至25个,却通过构象重排维持了与衣壳的结合力——这种“精简优化”是人类工程师从未设想过的方案。
02
从“沙漠寻针”到“72小时定制武器”
以前找治疗用的噬菌体,就像在撒哈拉沙漠里找针。
2024 年新加坡综合医院(SGH)完成的东南亚首例噬菌体治疗案例,筛选周期长达5 个月。美国加州大学圣地亚哥分校 IPATH 中心(全球顶尖噬菌体治疗机构)的筛选周期通常为 7-10 天。
AI正在改写这种“被动等待”的局面。BrianHie团队的实验显示,AI 可直接设计全新噬菌体基因组,从 “获取细菌基因信息” 到 “合成 DNA 片段” 仅需72 小时,且无需依赖噬菌体库 —— 这意味着未来筛选周期可能压缩至传统方法的 1/10。
这种效率提升源于三重突破:首先是靶点精准化,AI可根据细菌表面受体基因(如大肠杆菌的F菌毛基因)设计匹配的噬菌体尾丝蛋白,确保“精准打击”;
其次是进化预判,通过模拟细菌耐药突变路径,AI能提前设计出具有交叉感染能力的噬菌体,比如此次生成的噬菌体同时攻克C株与W株大肠杆菌,而天然ΦX174仅能感染C株;
最后是组合优化,AI设计的“噬菌体鸡尾酒”可通过基因重组快速适应耐药菌进化,实验中仅需1-5次传代就能突破耐药屏障。
“这项技术肯定有很大的潜力。”研究参与者塞缪尔·H·金(Samuel H. King)说。他指出,大多数基因治疗都使用病毒将基因传递到体内,AI或许可以开发出更有效的病毒。
这项技术的价值远不止于治病。在农业领域,针对青枯病的AI定制噬菌体已进入田间试验,能减少70%的农药使用;在基因治疗领域,AI优化的腺相关病毒载体正在临床试验中,其免疫原性降低40%,基因递送效率提升两倍——这些应用都源于对病毒基因组的精准设计能力。
03
是潘多拉魔盒还是希望火种
“当AI能设计杀死细菌的病毒,理论上也能设计感染人类的病毒。”德国海德堡大学生物安全专家克斯廷·格普弗里希(Kerstin Göpfrich)的担忧引发广泛讨论。但深入分析实验细节会发现,研究团队早已搭建三重安全屏障。
第一道屏障是“数据隔离”:Evo模型的训练数据明确排除了所有真核生物病毒,尤其剔除了流感、新冠等人类病原体序列,从源头避免生成危险基因组。
第二道是“宿主限制”:实验选用的ΦX174噬菌体仅感染大肠杆菌,对动植物均无致病性,且宿主系统为BSL-1级安全标准,属于分子生物学研究中最安全的类别。
第三道是“功能筛查”:所有设计序列必须通过生物相容性测试,确保不具备水平基因转移能力——即无法将耐药基因或毒素基因转移给其他微生物。
▲ΦX174(C)和Evo-Φ36(D)不对称单位的原子模型与冷冻电镜密度拟合的可视化展示
即便如此,潜在风险仍不容忽视。合成基因组先驱文特尔指出,当前AI设计的5k级基因组尚属“简易模型”,但随着技术发展,若扩展到48k的λ噬菌体甚至更大的病毒基因组,风险会呈指数级上升。
更隐蔽的是生态风险:AI设计的噬菌体若意外流入自然环境,可能与野生噬菌体发生基因重组,产生未知的生态影响。
对此,研究团队已提出应对方案:建立“设计序列备案库”,所有AI生成的基因组序列需在国际基因合成数据库登记;开发“自限性模块”,在噬菌体中插入环境敏感基因,使其离开实验室环境后48小时内自动失活;推动面向合成核酸供应商及用户的《核酸合成筛选框架(Frame work for Nucleic Acid Synthesis Screening)更新,明确AI设计生物的伦理边界。
正如Brian Hie所说:“我们不是在创造生命,而是在设计生命工具,工具的风险可控与否,取决于使用者的规范。”
04
从5000到30亿碱基对的生命设计长征
当前AI设计的噬菌体基因组,在生命尺度上仍属“入门级”。ΦX174的5386个碱基对,仅相当于大肠杆菌基因组470万碱基对的1/1000,人类基因组32亿碱基对的1/557000。“基因数量每增加一个数量级,相互作用的复杂度就会增加三个数量级,这比预测宇宙星系运动更困难。”杰夫・博克解释道。
但科学家们已踏上征程。波士顿Ginkgo Bioworks公司正在构建“AI设计-自动化验证”闭环系统:机器人每天可完成1000个合成基因组的测试,数据实时反馈给AI进行模型迭代,目标三年内攻克48kb的λ噬菌体设计,五年内实现简单细菌基因组的从头设计。
该公司CEO杰森・凯利(Jason Kelly)透露,美国国防高级研究计划局(DARPA)已投入2亿美元支持该项目,希望打造“抗生物威胁的合成生物盾牌”。
对普通人而言,这场技术革命的影响正在悄然渗透。在加州大学旧金山分校的实验室里,AI设计的肠道噬菌体正在进行临床试验,用于调节菌群治疗肥胖症;在荷兰的温室中,定制噬菌体让番茄青枯病发病率从30%降至5%。未来更可期,也许孩子感冒时,医生取咽拭子后AI连夜设计噬菌体,次日即可给药;而农民通过手机APP上传作物病害照片,可能一周内就能收到定制的生物农药。
但在技术狂奔的背后,更需要回答一个根本问题:当AI能设计越来越复杂的生命,人类该如何定义“生命的尊严”?当噬菌体可以被精准设计成“生物武器”,国际社会该建立怎样的监管体系?这些问题没有标准答案,但至少现在,我们有了更多思考的时间——因为AI的每一次设计突破,既是对生命奥秘的揭示,也是对人类智慧的考验。
从1977年读取第一个基因组,到2003年合成第一个基因组,再到2025年AI设计第一个基因组,人类用不到半个世纪的时间,完成了对生命密码“读-写-创”的跨越。这场跨越的终点在哪里?或许正如冷冻电镜下那些AI设计的噬菌体——它们带着人类从未见过的基因序列,却完美执行着生命的基本法则,在微观世界里诉说着答案:生命的本质是信息,而信息的创新永无止境。
参考:bioRxiv, Nature, MIT Technology Review
来源:轩辕商业评论