摘要:细胞核基因组主要分为两大区域:基因丰富且相对开放的常染色质,以及基因稀少且相对致密的异染色质。随着Hi-C染色质构象捕获和染色质追踪等技术的出现,基因组的复杂层级组织结构正逐渐被揭示。每条染色体在细胞核内占据独立区域,其基因组可以人为划分为两个区室结构——A/
撰文丨章台柳
细胞核基因组主要分为两大区域:基因丰富且相对开放的常染色质,以及基因稀少且相对致密的异染色质。随着Hi-C染色质构象捕获和染色质追踪等技术的出现,基因组的复杂层级组织结构正逐渐被揭示。每条染色体在细胞核内占据独立区域,其基因组可以人为划分为两个区室结构——A/B区室(compartment),长度一般在数百万碱基(Mb)尺度,A区室呈松散染色质状态,基因密度高,属于转录活跃区域,而B区室则呈压缩染色质状态,基因密度低,属于转录抑制区域。基因组可进一步在1Mb-10千碱基(kb)尺度上分割为拓扑关联结构域(TADs)和染色质环。目前对异染色质组织的解释主要基于其凝聚特性——这种特性可表现为类液体或类凝胶状态。异染色质富含AT碱基且包含大量非编码重复序列,而高转录活性基因通常具有较低的AT含量。此外,组蛋白翻译后修饰(PTMs)和组蛋白变体也能反映染色质的功能状态。
尽管遗传-表观遗传特征的生物学功能主要被解释为需要与相互作用因子(如特定DNA序列或表观遗传密码的“阅读器”和“书写器”)协同发挥作用,但遗传-表观遗传特征其内在的物理特性也有直接的生物学意义。高AT含量的DNA序列或长poly(dA:dT)片段可形成特殊的沟槽结构与弯曲构象,这些特征可能在离子相互作用中发挥独特功能【1】。同时,PTMs可能是决定核小体内在特性的关键调节因子【2】。尽管我们对基因组组织已有广泛认知,但对基因组区室化的生物物理驱动力仍知之甚少。
近日,来自约翰·霍普金斯大学的Taekjip Ha团队在Nature杂志上发表文章Native nucleosomes intrinsically encode genome organization principles,对单个核小体是否携带足以指导三维基因组区室化(如通过生物物理特性)的信息进行探究。纯化获得高分散性的天然单个核小体,利用生理浓度多胺测定其凝聚性,发现:已知定位在A区室的染色体区域核小体凝聚性较低,而B区室核小体凝聚性较高。染色质聚合物模拟仅以凝聚性为输入参数(不依赖任何反式因子)即可重现A/B区室结构。核小体凝聚性还与基因表达呈显著负相关,这种关联在启动子附近尤为明显,且具有细胞类型特异性,这表明单核小体的生物物理特性与基因"开/关"状态直接关联。比较遗传和表观遗传特征,发现核小体凝聚性是一种涌现特性,为投射高维染色质状态提供了天然调控轴。通过不同凝聚剂、组蛋白修饰及突变体的分析,发现核小体编码的基因组组织原则本质上是静电驱动的。小鼠T细胞中多胺耗竭(通过敲除或抑制鸟氨酸脱羧酶实现)会导致凝聚性超极化,这表明当细胞无法依赖多胺将核小体生物物理特性转化为三维基因组组织时,会强化凝聚性差异——这或许能解释多胺缺乏导致的细胞功能障碍。
研究人员分离纯化出天然单核小体,利用多种DNA/核小体凝聚剂(包括多胺、异染色质蛋白HP1α和HP1β等)在体外诱导天然核小体凝聚。结果显示,天然核小体在凝聚后仍保持结构完整。单分子荧光共振能量转移(FRET)技术进一步显示,即使形成大型核小体凝聚体,也不会引起核小体DNA解旋。随后对上清液中残留核小体进行测序并与输入对照组比较,可以对每个核小体在基因组上进行定位,并评估其在凝聚后的存留概率,即可计算出凝聚性。这种“凝聚测序(condense-seq)”技术能以单核小体分辨率在全基因组范围测定凝聚性。随后研究人员绘制了H1人胚胎干细胞(H1-hESCs)的全染色体凝聚性图谱。在1Mb分辨率下,凝聚性值波动于2-3之间,且在亚端粒和着丝粒周边区域显著升高。RNA-seq显示基因表达水平与凝聚性呈现明显负相关。在更精细尺度上,转录起始位点(TSS)周边的凝聚性呈现以下规律:高表达基因的TSS区凝聚性最低,而低表达基因的TSS区凝聚性最高。这表明即使在体外(缺乏体内正常存在的其他因子)测定的单核小体,其固有的高/低凝聚性生物物理特性仍能分别对应低/高转录活性状态。其他特征如AT含量、CpG甲基化密度以及H3K9ac、H3K27ac和H3K4me3修饰水平虽然也与基因表达相关,但单独任一指标对启动子区域凝聚性谱的预测能力均较弱。值得注意的是,即使在高表达基因中,随着与TSS距离的增加(进入基因主体区域),凝聚性也会快速升高。启动子和增强子区域凝聚性最低,而异染色质区、基因主体区、Polycomb抑制区及静息态区域凝聚性最高。通过比较分化细胞(GM12878)和H1-hESC的凝聚状态,发现启动子区域凝聚性在分化细胞中更低,表明启动子区凝聚性具有细胞类型依赖性。
通过分析全染色体水平的凝聚性与常/异染色质区室化的关联,并结合计算机模拟,发现即使在没有其他因子参与的情况下,天然单核小体本身已具备大规模A/B区室化所需的大部分生物物理特性。而且,异染色质相关核小体比常染色质相关核小体更易凝聚的特性并不依赖于纤维连接性,这一发现与"细胞内不存在30nm纤维"的研究结论相互印证。即使染色质与HP1蛋白、Polycomb抑制复合体、黏连蛋白、CTCF及其他非编码RNA的特异性相互作用主导了更小尺度、功能导向的染色体组织,单个核小体的固有凝聚性仍构成了不可忽视的生物物理基础。进一步研究显示,核小体编码的基因组组织原则本质上是静电驱动的。
多胺是生物体内最普遍存在的代谢物之一,其水平变化对T细胞激活与分化具有关键调控作用。通过对T细胞特异性多胺代谢缺陷的T细胞、多胺代谢抑制剂处理的野生型T细胞以及野生型T细胞进行凝聚测序,发现多胺合成受阻会放大核小体凝聚性差异:高凝聚性核小体的凝聚性更高,而低凝聚性核小体更低。这提示我们,当细胞无法依赖内源多胺促使高凝聚性核小体聚集形成B区室或诱导启动子凝聚时,会通过修饰核小体来强化这种差异。这种凝聚性的变化,也伴随着基因表达的变化。凝聚性显著升高的基因富集于T细胞活化等免疫信号通路,而凝聚性显著降低的基因则富集于发育分化相关通路。即多胺缺乏不仅会通过增强B区室核小体及低表达基因启动子的凝聚性,减弱A区室核小体及高表达基因启动子的凝聚性来导致基因组区室化超极化,而且还会引发局部染色质紊乱(尤其影响发育基因),这可能导致细胞分化障碍。
总的来说,这项研究揭示了即使在缺乏染色质阅读器、重塑复合体及额外能量输入的条件下,单个核小体自身携带的生物物理信息足以指导其形成基因组组织,即单个核小体能够自发形成A/B区室等大规模结构,以及启动子、增强子及基因主体等局部功能单元。
制版人: 十一
参考文献
1. Yoo, J., Kim, H., Aksimentiev, A. & Ha, T. Direct evidence for sequence-dependent attraction between double-stranded DNA controlled by methylation.Nat. Commun.7, 11045 (2016).
2. Bowman, G. D. & Poirier, M. G. Post-translational modifications of histones that influence nucleosome dynamics.Chem. Rev.115, 2274–2295 (2015).
学术合作组织
战略合作伙伴
来源:小齐的科学讲堂