用AI模拟5亿年的进化,创造出全新荧光蛋白

B站影视 2025-02-24 14:33 1

摘要:原创 生物世界 生物世界撰文丨王聪编辑丨王多鱼排版丨水成文大约 35 亿年前,地球从化学反应中诞生了最初的生命。大自然发明了 RNA、蛋白质和 DNA 这些生命的核心分子,并创造了核糖体这一分子工厂,它能根据基因组中的指令合成蛋白质。蛋白质是奇妙的动态分子,具

原创 生物世界 生物世界撰文丨王聪编辑丨王多鱼排版丨水成文大约 35 亿年前,地球从化学反应中诞生了最初的生命。大自然发明了 RNA、蛋白质和 DNA 这些生命的核心分子,并创造了核糖体这一分子工厂,它能根据基因组中的指令合成蛋白质。蛋白质是奇妙的动态分子,具有令人难以置信的功能——从驱动运动的分子引擎,到捕获光并将其转化为能量的光合作用机器,构建细胞内部骨架的支架,与环境相互作用的复杂传感器,以及运行生命程序和操作系统的信息处理系统等等,蛋白质关乎疾病与健康,许多救命药物本身就是蛋白质。生物学是用一种人类尚未理解的“语言”所书写。如果我们能够学会利用生物学的“语言”来读写,那么,生物学将变得可编程,反复试验将被逻辑取代,费力的实验将被模拟所替代。2024年诺贝尔化学奖授予了 AI 蛋白质设计先驱 David Baker 教授以及 AI 蛋白质结构预测工具 AlphaFold 的开发者 Demis Hassabis 和 John Jumpe,他们的研究为我们利用 AI 来理解、想象和创造蛋白质奠定了基础。近日,AI 初创公司 EvolutionaryScale 的研究团队在国际顶尖学术期刊 Science 上发表了题为:Simulating 500 million years of evolution with a language model 的研究论文。论文标题非常简单直接,甚至是夸张——用语言模型模拟 5 亿年的进化。该研究开发了一种人工智能语言模型——ESM3,ESM3 在思维链(Chain of Thought)的提示下生成了一种全新的绿色荧光蛋白——esmGFP,其在进化上与天然的绿色荧光蛋白(GFP)差异巨大,与已知的最接近的荧光蛋白只有 58% 的序列同源性,大自然需要 5 亿年时间才能进化出这种新型绿色荧光蛋白,也就是说,ESM3 模拟了 5 亿年进化,创造了一种新型绿色荧光蛋白。研究团队表示,ESM3 是一款向生命科学领域的前沿人工智能语言模型,也是第一个同时对蛋白质的序列、结构和功能进行推理的生成式人工智能模型,它提升了我们利用生命密码进行编程和创造的能力,让我们能够像设计建筑、制造机器和微芯片以及编写计算机程序一样,从底层原理出发来改造生物学。由ESM3模型生成的新的绿色荧光蛋白——esmGFP据悉,EvolutionaryScale 公司正在开发 ESM3 的专用版本,以解锁前沿药物设计领域的应用,助力科学家创造新型药物。EvolutionaryScale 公司表示,相信未来的人工智能将帮助我们在最基础的层面上理解生命的复杂系统,做出改变我们对生物学认知的新发现,助力我们找到疾病治疗方法,并构建一个更可持续的世界。参考链接:https://www.science.org/doi/10.1126/science.ads0018https://www.science.org/doi/10.1126/science.ade2574https://www.evolutionaryscale.ai/blog/esm3-release原标题:《Science:用AI模拟5亿年的进化,创造出全新荧光蛋白,重新点亮生物学》

来源:科学小课堂

相关推荐