Nature | 丈量生命之树,解码万物细胞:一项比肩“人类基因组计划”的宏伟蓝图

B站影视 韩国电影 2025-10-02 19:25 1

摘要:在生命科学的历史长河中,总有一些里程碑式的时刻,它们不仅推动了知识的边界,更彻底改变了我们看待世界的方式。从列文虎克用显微镜窥见微观宇宙,到达尔文乘“贝格尔号”环游世界,再到沃森和克里克揭示DNA双螺旋的奥秘。如今,我们或许正站在又一个伟大航程的起点。

在生命科学的历史长河中,总有一些里程碑式的时刻,它们不仅推动了知识的边界,更彻底改变了我们看待世界的方式。从列文虎克用显微镜窥见微观宇宙,到达尔文乘“贝格尔号”环游世界,再到沃森和克里克揭示DNA双螺旋的奥秘。如今,我们或许正站在又一个伟大航程的起点。

9月25日,《Nature》刊登了一篇意义深远的展望文章”The Biodiversity Cell Atlas: mapping the tree of life at cellular resolution“。这篇文章并非一份寻常的研究报告,而是一份由全球顶尖研究人员共同发起的“英雄帖”,宣告了一个雄心勃勃的国际合作计划——“生物多样性细胞图谱”(Biodiversity Cell Atlas, BCA)的诞生。它旨在利用最前沿的单细胞技术,以前所未有的分辨率和广度,系统地绘制整个真核生物生命之树的细胞图谱。这不仅仅是一项数据收集工程,更是一场旨在连接基因与功能、分子与表型、微观与宏观的认知远征,其深远影响或可与“人类基因组计划”相提并论。

过去三十年,是基因组学(genomics)的黄金时代。浪潮始于1996年,当研究人员完成了第一个真核生物——酿酒酵母(Saccharomyces cerevisiae)的基因组测序时,一扇通往生命密码核心的大门轰然开启。紧接着,秀丽隐杆线虫(Caenorhabditis elegans)在1998年、拟南芥(Arabidopsis thaliana)在2000年的基因组相继被破译,宣告了动物和植物基因组时代的到来。而2001年人类基因组计划(Human Genome Project)首个草图的发布,更是将这一浪潮推向了顶峰。

近年来,随着“地球生物基因组计划”(Earth BioGenome Project)等宏大项目的推进,我们正以惊人的速度积累着地球生命的多样性基因组数据。迄今为止,已有超过一万个真核生物物种的基因组被测序。这些由A、T、C、G四个字母谱写的“生命天书”,极大地改变了分子遗传学、进化生物学乃至生物技术和医学研究的面貌。它们为我们描绘物种间的亲缘关系提供了坚实的系统发育框架(phylogenetic framework),让我们能清晰地比较不同物种的基因库、转座子(transposable elements)和染色体结构。

然而,巨大的成功也带来了“甜蜜的烦恼”。我们手中的“生命天书”越来越多,书页越来越厚,但我们发现自己很大程度上成了一位“文盲”读者。我们能读出每个字母,却不理解它们如何组成词语、构成句子、最终汇成一部宏伟的生命史诗。换言之,我们对基因组序列的知识与我们对这些序列如何编码复杂生物学功能的理解之间,出现了一条日益扩大的鸿沟。

蛋白质的密码是相对简单的:三个碱基对应一个氨基酸。但决定一个细胞何时分化、一个组织如何形成、一个生物体怎样应对环境的“高级语法”,那些驱动复杂表型的基因调控网络,却异常复杂且难以破译。这种知识上的断层,也成为了进化生物学面临的核心挑战之一:我们如何将基因序列的分子进化与我们在细胞结构、生命周期、形态行为上观察到的表型变化联系起来?我们拥有了海量的基因组序列数据和几个世纪积累的详细表型观察记录,但连接二者的桥梁却异常脆弱。

“生物多样性细胞图谱”(BCA)计划,正是为了建造这座至关重要的桥梁。它的核心思想是:回归生命的基本单位——细胞,通过系统地描绘生命之树上各类生物的细胞多样性,来破译基因组编码功能的深层逻辑。

为什么细胞是解开这个难题的关键?因为细胞本身就是基因组的“原生解码器”(native 'decoders')。在一个多细胞生物体内,几乎每个细胞都拥有相同的基因组“天书”,但一个神经细胞和一个肌肉细胞的功能却天差地别。这是因为在不同的细胞中,基因组这本大书被“阅读”的方式不同。细胞通过巧妙地整合来自发育和环境的信号,动态地调控成千上万个基因的活性,哪些基因被激活,哪些基因被沉默,从而将静态的基因组信息转化为动态、灵活的细胞功能。

这个过程赋予了单一基因组产生多种细胞功能的潜力。幸运的是,自然选择和进化力量的塑造,使得基因组可能产生的无数种活性状态被约束在一个有限且功能丰富的集合内。这个集合,在宏观上就表现为可以被归类的“细胞类型”(cell types)。这些细胞类型是构成组织、器官和复杂生命周期的基本功能单元。

在过去,我们依赖显微镜下的形态来区分细胞。但现在,单细胞组学技术(single-cell omics technologies)为我们提供了一把前所未有的“分子刻刀”。例如,单细胞RNA测序(single-cell RNA sequencing, scRNA-seq)可以精确量化单个细胞中成千上万个转录本的表达水平,为我们描绘出一幅详尽的“基因活性图谱”。通过对成千上万个单细胞进行分析,并利用计算方法将基因表达谱相似的细胞聚类,我们就能以数据驱动的方式,客观地识别出不同的细胞类型细胞状态(cell states)。将一个生物体内所有的细胞类型及其分子特征系统性地编目,就构成了一份“细胞图谱”(cell atlas)。以“人类细胞图谱联盟”(Human Cell Atlas consortium)为代表的努力,已经向我们展示了绘制这种图谱的巨大威力。

BCA计划的目标,正是要将这种强大的方法论从人类和少数几个模式生物,扩展到广阔的真核生物世界。通过整合生物多样性基因组测序和单细胞组学,BCA旨在为数以百计的物种、数百万个细胞、数千种基因活性状态建立分子快照

这不仅仅是数据的简单累积。研究人员提出了一个极具启发性的类比:解决蛋白质折叠问题。人工智能技术(例如AlphaFold)之所以能在预测蛋白质结构方面取得革命性突破,一个关键因素是它学习了来自生命之树各个角落的海量、多样化的蛋白质序列数据。通过分析这些序列中的共变信号(covariation signals),AI得以推断出决定其三维结构的规则。

BCA计划旨在为功能基因组学(functional genomics)提供类似的“燃料”。通过在广阔的系统发育尺度上,高质量地测量基因的分子活性和细胞状态,BCA将产生一个前所未有的庞大数据集。这个数据集将为开发全新的计算模型赋能,使我们能够以前所未有的方式将基因组与细胞表型联系起来。最终,这或许能让我们实现“在计算机中”(in silico)直接从基因组序列预测表型的梦想,并揭示基因组的微小变异如何驱动细胞表型的宏大进化。

系统性地探索整个生命之树的细胞分子表型,将为众多领域带来变革性的发现。这幅宏大的“万物细胞图谱”不仅是基础研究的宝库,更是应用科学创新的源泉。

发掘未知的生物技术与生物医学宝藏

广袤的生物多样性中潜藏着无数等待被发现的“生物技术创新”。许多非模式生物拥有独特的生物化学途径和分子机器。然而,由于功能未知,它们基因组中的绝大多数基因仍是“黑箱”。细胞图谱将基因置于其发挥作用的具体“语境”中:一个基因在何时、何地的哪种细胞中表达,以及它与哪些基因共同表达。

这些信息将为我们推断未知基因的功能提供强有力的线索。想象一下,我们或许能在嗜极微生物中发现新型的蛋白水解酶,在某种罕见的真菌中找到高效的抗生素肽,或者在植物中鉴定出参与高效光合作用(如C3和C4光合作用)的关键基因。BCA将成为一个巨大的假设生成引擎,为工业、农业和生物医药应用开启新的大门。

更进一步,比较细胞图谱将极大增强我们预测人类疾病相关基因变异致病性的能力。目前,我们常常通过比较不同物种间蛋白质序列的保守性来判断一个突变是否有害。未来,我们可以利用跨物种的基因表达数据来构建更复杂的模型。通过观察一个基因的表达模式在进化过程中是否保守,我们可以推断其功能的重要性,从而更准确地预测基因表达变异的后果。

革新基础研究与进化理论的范式

对于基础生物学研究而言,细胞图谱本身就是一个强大的发现工具。它将揭示在那些研究不足的物种中存在着怎样前所未知的新细胞类型和基因模块(gene modules)。一份参考细胞图谱,就像一份参考基因组一样,将成为新兴模式生物研究中不可或缺的资源。它不仅提供了细胞类型的“零件清单”,还使得研究人员可以通过将其作为“基准”,来分析实验扰动或环境变化对生物体产生的精确影响。

在进化生物学领域,BCA的影响将更为深远。长期以来,研究人员一直试图通过比较不同物种的细胞形态来追溯细胞类型的起源与演化,例如,不同动物门类中形态相似的神经元和肌肉细胞,启发了“细胞家族”(cell families)的概念。但这种基于形态的比较,往往是定性的、有限的,很难进行系统性的定量分析。

细胞图谱将细胞的身份定义为由数千个基因表达量构成的“分子指纹”,这为跨物种比较提供了海量的定量性状。我们可以通过比较直系同源基因(orthologous genes)的表达谱,或者调控这些基因表达的顺式调控元件(cis-regulatory sequences)的相似性,来构建跨物种的细胞类型层级树(cross-species cell type hierarchies)。这将彻底改变我们研究细胞类型进化的方式。

例如,我们可以定量地评估不同物种的两种细胞在分子层面上的相似度,从而更严谨地判断它们是否是“同源”(homologous)的,即源自共同祖先的同一细胞类型。我们还能识别出那些功能相似但独立起源的“趋同演化”(convergent)细胞类型,以及那些在进化中功能发生剧烈变化的同源细胞。有了在密集采样的系统发育树上获得的标准化细胞数据,研究人员将能开发全新的理论模型,来研究细胞类型起源、分化和丢失的进化过程。这将直接回答一些生命科学的终极问题,比如神经元是如何起源的?多细胞生命是在何种细胞功能模块的基础上演化出来的?

开启环境科学与生态监测的新纪元

BCA的视野超越了实验室中的模式生物,延伸至广阔的自然环境。单细胞技术可以被用作强大的生物监测(biomonitoring)工具。例如,研究人员可以通过分析环境水样中的微生物单细胞,揭示其物种构成、生命周期阶段(如休眠的孢子状态)、代谢活性以及物种间的相互作用。

这对于研究那些难以在实验室中培养的微生物真核生物尤为重要,因为它们占据了地球生物多样性的大部分。细胞图谱还能以极高的分辨率解析共生(symbiotic)关系。已有的研究通过单细胞技术,成功地同时分析了珊瑚与其共生藻、植物根系与丛枝菌根真菌的基因表达,揭示了它们在细胞层面的精细分子对话。未来,这种方法可以被广泛应用于解析各种复杂的共生体(holobiont)和生态系统。

相比于传统的环境宏基因组学(metagenome)和宏转录组学(metatranscriptome),它们只能告诉我们一个样本中“有哪些基因”或“哪些基因在表达”,单细胞方法能够将基因表达的“功能”信息与特定的“物种”和“细胞”联系起来。这种强大的能力使我们能够以前所未有的精度来刻画生态系统的状态,并监测它们在环境压力下的动态变化,为生物多样性保护和政策制定提供坚实的科学依据。

如此宏伟的计划,其实施必然充满了挑战。BCA的发起者们对此有着清醒的认识,并制定了清晰的路线图和策略。

BCA的航线:如何选择物种?

面对浩瀚的生命之树,BCA将如何决定优先“停靠”哪些“港口”?研究人员提出了几个核心的物种取样标准:

1. 最大化系统发育多样性(phylogenetic diversity):优先选择那些位于生命之树上未被采样过的、独特的演化支系,以捕捉最广泛的细胞多样性。一个务实的做法是,首先关注那些已经拥有或正在进行高质量基因组测序的物种。

2. 靶向关键的进化跃迁:重点研究那些位于进化史上重要转折点的物种。例如,多次独立演化出多细胞性的生物(如褐藻、植物、动物、真菌),细胞类型多样性发生“大爆炸”的类群(如两侧对称动物的神经系统),以及具有复杂生命周期和共生关系的物种。

3. 支持新兴模式生物:为那些具有重要研究潜力但缺乏工具的新兴模式生物创建高质量的细胞图谱,作为其未来研究的基石资源。

4. 驱动技术发展:主动选择那些具有巨大实验挑战性的生物,例如拥有坚硬外骨骼、特殊细胞壁、细胞数量极少或组织坚韧的物种。通过攻克这些“硬骨头”,来推动单细胞取样和分析技术的发展,使其能够适用于更广泛的生物。

该计划的初始阶段(Phase 0, 2024-2026年)将专注于开发和优化实验流程与计算资源。在此基础上,第二阶段(Phase 1, 2026年及以后)将正式进入大规模数据生产。

BCA面临的风暴:技术与计算的双重挑战

前方的航程并非一帆风顺,BCA需要穿越实验技术和计算分析的“风暴区”。

实验层面,最大的挑战之一是如何从各种各样的生物体中温和地获取高质量的单个细胞或细胞核。目前主流的单细胞解离方法,通常使用酶来消化组织,是为哺乳动物组织设计的,并不具有普适性。例如,脆弱的细胞类型可能在处理中丢失;海洋生物的高盐环境会干扰生化反应;植物和真菌等生物的坚固细胞壁是巨大的障碍。

为了应对这些挑战,研究人员正在探索多种策略。例如,使用化学固定剂先“定格”细胞的状态,可以有效避免应激反应。另一种强大的策略是直接提取细胞核(single-nucleus RNA-seq),因为细胞核膜比细胞膜更容易破裂,且可以从冰冻的组织中提取,这极大地简化了样本的保存和运输。BCA计划的一个关键目标,就是通过系统的基准测试(benchmarking studies),为不同的物种和组织类型建立一套“方法决策树”,指导研究人员选择最优的实验方案。

计算层面,挑战同样严峻。包括基因注释的质量参差不齐,缺乏统一的图谱质量评估标准,需要开发更先进的跨物种比较算法,以及建立统一的数据基础设施。BCA计划将通过设立专门的工作组,联合生物信息学家、计算生物学家和软件工程师,共同攻克这些难题,确保产出的数据不仅量大,而且质优、可用、可比较。

“生物多样性细胞图谱”计划的启动,标志着生物多样性基因组学和单细胞生物学的历史性交汇。它不仅仅是一个庞大的数据生产项目,更是一个由进化概念和系统发育思想驱动的、旨在系统性描述和解释细胞类型、细胞状态和基因模块在亿万年演化历程中变化的宏伟事业。

它承诺的回报是惊人的。通过将新兴的细胞类型与基因组序列的演化联系起来,BCA将为我们提供一个前所未有的框架,来理解基因组功能、基因调控、多细胞起源、真核生物生命周期和共生关系等一系列重大生物学问题。

这艘承载着人类好奇心和探索精神的“认知旗舰”已经启航。它将驶入一片前人从未系统探索过的“未知蓝海”,使用的“导航工具”是如此新颖和强大。我们有理由相信,在这段伟大的航程中,除了那些我们期望解答的问题,BCA还将带来完全意想不到的发现,驱动新的理论、新的思想和跨学科的科学革命。这或许就是现代生物学最重要的前沿之一,它邀请我们共同见证生命科学新篇章的开启。

参考文献

Sebé-Pedrós A, Tanay A, Lawniczak MKN, Arendt D, Aerts S, Archibald J, Arnone MI, Blaxter M, Cleves P, Coelho SM, Dias M, Dunn C, Elek A, Frazer J, Gabaldón T, Gillis J, Grau-Bové X, Guigó R, Hobert O, Huerta-Cepas J, Irimia M, Klein A, Lewin H, Lowe CJ, Marlow H, Musser JM, Nagy LG, Najle SR, Pachter L, Paez S, Papatheodorou I, Passalacqua MJ, Rajewsky N, Rhee SY, Richards TA, Sauka-Spengler T, Saunders LM, Seuntjens E, Solana J, Song Y, Technau U, Wang B; Biodiversity Cell Atlas meeting participants. The Biodiversity Cell Atlas: mapping the tree of life at cellular resolution. Nature. 2025 Sep;645(8082):877-885. doi: 10.1038/s41586-025-09312-4. Epub 2025 Sep 24. PMID: 40993253.

声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!

来源:生物探索一点号1

相关推荐