摘要:DNA是生命的蓝图,承载着所有遗传信息。但真正让生命“活”起来、执行指令的,是DNA转录出来的RNA。然而,这些RNA分子并非一劳永逸,它们从诞生到消亡,会在细胞内上演一场场精密的“分子舞步”:剪接 (splicing) 决定基因的最终面貌,翻译 (trans
引言
DNA是生命的蓝图,承载着所有遗传信息。但真正让生命“活”起来、执行指令的,是DNA转录出来的RNA。然而,这些RNA分子并非一劳永逸,它们从诞生到消亡,会在细胞内上演一场场精密的“分子舞步”:剪接 (splicing) 决定基因的最终面貌,翻译 (translation) 将遗传信息转化为功能蛋白,而降解 (Decay) 则确保了分子的更新与平衡。这场复杂舞蹈的“编舞者”,正是数千种被称为RNA相关蛋白 (RNA-associated proteins, RBPs) 的“幕后英雄”。一旦这些精妙的调控环节出现哪怕一丝失衡,就可能导致癌症、神经退行性疾病等多种严重的人类疾病。
长期以来,研究人员对这些RNA“隐秘舞步”背后的调控网络知之甚少。传统的基因筛选方法,往往只能通过间接的细胞表型(如细胞生长或荧光信号)来窥探,不仅耗时耗力,还难以直接揭示哪些基因精准调控了RNA的特定代谢事件。这就像我们只能看到舞蹈的最终效果,却无法看清每个舞者的精确动作和他们之间的互动,更别提幕后指挥家的意图了。
5月29日《Nature Methods》的研究报道“Decoding post-transcriptional regulatory networks by RNA-linked CRISPR screening in human cells”,带来了一项革命性的突破——ReLiC(RNA-linked CRISPR) 筛选平台!这项前沿技术巧妙地将CRISPR基因编辑的强大精准性与条形码RNA读数的巧妙结合,就像为细胞内的RNA世界安装了一个“分子侦探”,能够以前所未有的深度和广度,大规模解码每个基因敲除后,数千种RNA代谢过程的精微响应。它不仅揭示了生命蓝图的“幕后英雄们”如何协同工作,更打开了探索细胞功能、疾病发生发展新机制的全新视角。
革命性工具:ReLiC闪亮登场,破解RNA调控难题!
ReLiC (RNA-linked CRISPR) 这项技术巧妙地将CRISPR基因编辑的精准性与条形码RNA读数的灵活性相结合,实现了对人类细胞中2,092个已知RNA相关蛋白基因敲除后,各种RNA代谢过程响应的量化测量。
ReLiC的核心创新在哪里? 想象一下,ReLiC就像一个精密的“分子侦探工具包”,它采用了一种迭代整合策略:
首先,在一个明确的基因组位点,稳定整合编码Cas9酶(CRISPR基因编辑的关键酶)的基因。
接着,再整合一系列携带着特定条形码 (barcoded reporter libraries) 的单向导RNA (single-guide RNAs, sgRNAs) 报告库。这些条形码会与特定的sgRNA以及RNA报告分子牢固地“绑定”。
这种创新的位点特异性整合策略 (site-specific integration strategy) 避免了传统慢病毒递送 (lentiviral delivery) 中可能出现的sgRNA与条形码链接混乱,以及RNA条形码表达不稳定的问题,确保了实验的准确性和可重复性。
在初步验证中,研究人员发现,ReLiC在HEK293T和U2OS细胞系中能够均匀表达荧光报告基因,并在Cas9酶的介导下有效敲除目标基因。构建的最终文库针对2,190个基因(包括非靶向对照和必需基因靶向对照),每个基因平均有四个sgRNA对。通过对克隆的质粒文库进行深度测序,他们成功地将N20条形码与sgRNA进行了关联。数据显示,超过99%的sgRNA和100%的基因都至少有一个可检测到的条形码,平均每个sgRNA对有8个条形码,这充分保证了文库的复杂性和覆盖度。
此外,ReLiC能够准确捕捉基因扰动对细胞适应性 (fitness effect) 的影响。研究发现,在Cas9诱导后的第13天和第21天,与已知必需基因 (essential genes,共745个) 相关的条形码在基因组DNA和mRNA中的丰度均显著降低。在第13天,条形码在mRNA中的丰度变化与基因组DNA中的变化相关性高达0.89,到第21天更是达到0.90,这表明ReLiC不仅技术重复性高,还能有效反映基因敲除对细胞整体状态的影响。
解密翻译的奥秘:核糖体占有率之舞
翻译是生命从基因到蛋白的“临门一脚”。ReLiC首次将CRISPR筛选与核糖体分级技术 (polysome fractionation) 相结合,根据mRNA上的核糖体 (ribosome) 数量来测量其翻译效率,这在现有CRISPR筛选方法中是无法直接实现的。
研究人员使用了一个β-珠蛋白 (β-globin) 报告基因,它是一种翻译效率很高的mRNA模型。实验结果显示,在未受扰动的细胞中,超过75%的β-珠蛋白mRNA存在于重多核糖体 (heavy polysome) 部分,这代表它们正在高效地被翻译。
通过分析数千个基因敲除对核糖体占有率的影响,研究团队取得了惊人发现:
翻译的核心引擎: 毫不意外,敲除细胞质核糖体蛋白 (cytoplasmic ribosomal proteins) 和核糖体生物合成因子 (ribosome biogenesis factors) 会导致重多核糖体/单核糖体比率大幅下降。这就像拆掉了生产线上的关键部件,生产自然停滞。研究还发现,敲除大型核糖体蛋白和生物合成因子,对mRNA在核糖体上结合的影响更大。
翻译启动的关键:多数翻译起始因子 (translation initiation factors, eIFs) 的敲除也会降低核糖体占有率,尽管其影响通常小于核糖体蛋白的敲除。例如,EIF3复合体的七个亚基(A-E、G和I)被确定为关键调控因子,它们的缺失显著降低了核糖体占有率。
意想不到的“幕后操手”:除了核心翻译机器,研究还发现了一些非经典翻译调控因子。比如,与mRNA降解和腺苷酸化调控有关的CCR4-NOT复合体 (CNOT1、CNOT2、CNOT3和CNOT7) 亚基的敲除,也显著降低了核糖体占有率。更令人惊讶的是,敲除蛋白酶体 (proteasome) 和TRiC伴侣蛋白 (chaperonin) 亚基也导致核糖体占有率显著下降,其幅度可与核心翻译起始因子敲除相媲美。这表明,细胞内的蛋白稳态 (proteostasis) 与翻译过程存在着紧密的互调控关系。
那么,哪些基因敲除反而增加了核糖体占有率呢?研究发现,EEF2、EIF5A和EEF1A1的敲除会提高核糖体占有率,这与它们在促进翻译延伸 (translation elongation) 中的作用一致。有趣的是,作为核糖体关联质量控制因子 (ribosome-associated quality control factor) 的ASCC3成为重多核糖体/单核糖体比率增加的最高命中基因(log2(H/M) = 0.62)。ASCC3负责解离停滞的核糖体,这暗示即使是高效翻译的mRNA,也可能存在一定程度的核糖体停滞和质量控制需求。核糖体碰撞传感器 ZNF598 和新生多肽N端甲硫氨酸去除酶 METAP2 的敲除也增加了核糖体占有率,这进一步揭示了新生肽处理对mRNA翻译动力学的影响。
剪接的艺术:SF3B家族的精妙调控
RNA剪接是真核生物基因表达的另一个核心过程,它负责从前体mRNA中移除内含子 (introns) 并连接外显子 (exons),以产生成熟的mRNA。ReLiC的独特之处在于,它能直接测量同一条形码携带的不同剪接异构体 (splice isoforms) 的比例,从而精准捕捉基因扰动对剪接的影响。
研究团队再次利用β-珠蛋白报告基因,这次关注了三种不同的剪接异构体:内含子1滞留 (intron 1 retention)、内含子2滞留 (intron 2 retention) 和外显子2跳跃 (exon 2 skipping)。结果显示,随着Cas9诱导时间的延长,识别到的基因命中数逐渐增加。
筛选结果揭示了剪接过程的复杂网络:
核心剪接体 (spliceosome) 组件:大量基因命中集中在核心剪接体组件和剪接相关因子上,它们分布在剪接周期的各个阶段。例如,CDK11B和RNA聚合酶III亚基BRF2等被识别为剪接功能的反式调控因子 (trans regulators)。
内含子滞留的调控:内含子1滞留的增加与mRNA翻译和核RNA外切体 (nuclear RNA exosome) 因子有关。这可能通过影响无义介导的mRNA降解 (nonsense-mediated decay, NMD) 来起作用。研究发现,外显子连接复合体 (exon-junction complex, EJC) 成分(如MAGOH、EIF4A3、RBM8A)和RNA输出因子(如NCBP1、NCBP2)仅在内含子1滞留筛选中被识别为命中基因,这与NMD的已知触发机制相符。
SF3B复合体:剪接的“艺术家”:SF3B复合体是U2小核糖核蛋白 (U2 snRNP) 的关键组成部分,在剪接位点选择中发挥重要作用。令人惊叹的是,SF3B复合体的不同亚基(SF3B1-7)对剪接事件有着截然不同的影响,尽管它们对于细胞生长都是必需的。例如:
外显子2跳跃:SF3B1、SF3B2、SF3B3和SF3B5的缺失会导致外显子2跳跃显著增加,而SF3B7(PHF5A)的缺失仅轻微增加,SF3B4和SF3B6的缺失则没有影响。
内含子滞留:SF3B6和SF3B7的缺失增加了内含子2滞留,而SF3B1、SF3B2和SF3B5的缺失增加了内含子1滞留。
这些结果提示,SF3B复合体的不同亚基在调控特定剪接事件(如外显子跳跃或内含子滞留)方面可能存在功能上的分工。通过对内源性mRNA进行RNA测序 (RNA-seq) 验证,研究发现,SF3B5的缺失导致45个注释的盒式外显子 (cassette exon) 发生10%或更高的跳跃,而SF3B6或AQR的影响则小于10个外显子。这项工作不仅揭示了SF3B家族对剪接的精妙调控,也为理解其在疾病中的作用提供了新的视角。
守卫mRNA质量:NMD巡逻队的高效运作
细胞内部有一支名为NMD (Nonsense-mediated mRNA Decay) 的“巡逻队”,专门负责识别和降解含有提前终止密码子 (premature termination codon, PTC) 的异常mRNA,以防止其翻译出有毒的截短蛋白。ReLiC能够精确测量基因敲除对PTC报告基因mRNA水平的影响,从而识别NMD途径的关键调控因子。
研究人员构建了一个在第二个外显子位置引入PTC的β-珠蛋白报告基因。在稳态条件下,这个含有PTC的报告基因mRNA水平相比正常终止密码子 (normal termination codon, NTC) 的报告基因显著降低,这证实了NMD的有效性。通过ReLiC筛选,研究识别出90个基因敲除会增加PTC报告基因的mRNA水平,这其中就包括了NMD途径的核心组分,如UPF1、UPF2、SMG1、SMG5和SMG7。这再次证明了ReLiC在识别特定RNA质量控制因子方面的强大能力。
令人惊喜的是,除了NMD核心因子,筛选还发现一些参与内质网 (endoplasmic reticulum, ER) 和线粒体 (mitochondrial homeostasis) 稳态的基因(如HSPA5、HSPA9和PHB1)的敲除也会增加PTC报告基因的水平。这与先前的研究一致,即内质网和线粒体稳态的扰动会导致EIF2a磷酸化,从而抑制NMD。
为了进一步深入探究,研究团队还利用ReLiC进行了化学修饰剂筛选 (chemical modifier screen) 和遗传修饰剂筛选 (genetic modifier screen)。
在化学修饰剂筛选中,他们使用ISRIB(一种能使翻译对EIF2a磷酸化不敏感的小分子)处理细胞。结果发现,30个基因敲除会降低PTC报告基因的mRNA水平,其中就包括了内质网/线粒体蛋白和氨酰tRNA合成酶 (aminoacyl-tRNA synthetases)。
在遗传修饰剂筛选中,他们敲低了EIF2a激酶GCN2(当氨酰tRNA合成酶受抑制导致未充电tRNA积累时,GCN2会被激活)。结果显示,在降低GCN2表达后,12个基因敲除(其中10个是氨酰tRNA合成酶)导致PTC报告基因水平降低。
这些精密的组合筛选策略,就像剥洋葱一样,层层揭示了基因产物调控RNA过程的分子途径,为我们理解细胞如何维护mRNA质量提供了前所未有的细节。
药物的幕后舞者:HHT与GCN1的意外邂逅
最后,ReLiC被应用于一个实际的生物医学问题:揭示细胞对高三尖杉酯碱 (homoharringtonine, HHT) 这种抗白血病药物的响应机制。HHT是一种靶向核糖体的化疗药物,通过抑制蛋白合成来治疗慢性髓性白血病。然而,细胞如何响应这种翻译抑制,仍有待深入理解。
研究人员使用增强型黄色荧光蛋白 (EYFP) 作为报告基因,并用HHT处理细胞。ReLiC筛选结果令人瞩目——GCN1,一个在正常筛选中并非显著命中的基因,成为唯一的显著命中基因(FDR
GCN1作为核糖体碰撞传感器 (ribosome collision sensor),通常在氨基酸受限时激活激酶GCN2,从而引发EIF2a磷酸化。研究发现,HHT处理后,在GCN1缺失的细胞中,p38的磷酸化水平增加,而这种增加是依赖于ZAK激酶的。进一步的RNA测序分析显示,HHT处理在GCN1缺失的细胞中导致了60个基因(包括FOS、JUN和MYC等即时早期基因 (immediate early genes, IEGs))的差异上调。这些发现被进一步验证,并发现ZAK或GCN2的药理学抑制可以阻止GCN1缺失细胞中IEG的上调。
这些数据强有力地表明,GCN1在HHT治疗引起的核糖体碰撞应激中扮演着关键的缓解角色。它像一个“警报器”,感知核糖体碰撞,并触发下游信号通路来应对这种应激。
ReLiC的广阔天地
ReLiC技术不仅成功揭示了RNA翻译、剪接和降解过程中的核心调控网络,还识别出许多意想不到的因子和它们之间的复杂关联。它能捕捉到同一蛋白复合体内部不同成员的差异化效应(如SF3B复合体),也能识别出直接效应器和间接调控者。
当然,ReLiC作为一项新技术,也有其局限性,比如它目前依赖于异源表达的报告基因,并且需要位点特异性整合,这可能限制其在某些细胞类型中的应用。然而,研究人员已提出多种改进方向,包括:
引入更多基因编辑工具,如碱基编辑器 (base editors) 和先导编辑 (prime editors),以实现更高分辨率的核苷酸层面的RNA代谢研究。
使用非编码RNA (non-coding RNAs) 和病毒RNA作为报告基因,探索新型RNA调控机制。
将ReLiC文库扩展到所有蛋白编码基因,以揭示RNA代谢与其他细胞过程之间更广泛的相互作用。
总而言之,ReLiC为我们提供了一个前所未有的强大工具,能够大规模、高通量地“解码”人类细胞中复杂的转录后调控网络。这项研究不仅加深了我们对生命基本过程的理解,也为未来开发针对RNA代谢疾病的治疗策略奠定了基础。
参考文献
Nugent PJ, Park H, Wladyka CL, Yelland JN, Sinha S, Chen KY, Bynum C, Quarterman G, Lee SC, Hsieh AC, Subramaniam AR. Decoding post-transcriptional regulatory networks by RNA-linked CRISPR screening in human cells. Nat Methods. 2025 May 29. doi: 10.1038/s41592-025-02702-6. Epub ahead of print. PMID: 40442371.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
往期热文:
Nature Methods | 解密生命分子“指纹”:先进振动显微镜,无标记洞察生物奥秘
Nature
| 脑癌“星形母细胞瘤”起源之谜揭晓:致命融合基因,为何偏爱腹侧,还找到共同“命门”?Cell
| 突破!研究人员首次构建功能性人类羊膜囊体外模型,开启胚胎外发育研究新纪元Nature Methods | 从“猜”到“预见”:AI模型PUPS揭示单细胞蛋白质定位的秘密
Nature Medicine
| 不再盲目“照搬”!中国肺癌患者一线治疗新思考:IMpower151试验重塑认知Nature Methods | 解锁类器官“数字孪生”:高速、精准的3D分析新范式
来源:生物探索一点号1