摘要:提起Y染色体,很多人脑海中浮现的标签往往是“决定男性性别”或是“正在不断退化”。长久以来,这条短小、充满重复序列的染色体在复杂疾病的研究中犹如一片未被充分开垦的荒原。然而,男性的健康与寿命究竟在多大程度上受控于这条神秘的染色体?
引言
提起Y染色体,很多人脑海中浮现的标签往往是“决定男性性别”或是“正在不断退化”。长久以来,这条短小、充满重复序列的染色体在复杂疾病的研究中犹如一片未被充分开垦的荒原。然而,男性的健康与寿命究竟在多大程度上受控于这条神秘的染色体?
2月23日,《Nature Medicine》的研究报道“Genetic regulation across germline and somatic variation on the Y chromosome contributes to type 2 diabetes”,系统性地解析了Y染色体的生殖系变异与体细胞突变如何深刻影响男性的代谢健康,尤其是2型糖尿病(Type 2 diabetes, T2D)的患病风险。这项研究不仅打破了我们对Y染色体功能的刻板印象,更揭示了遗传与环境在衰老过程中的隐秘交锋,为未来的精准医疗开启了一扇崭新的大门。
在人类的23对染色体中,Y染色体是一个极其特殊的存在。它不仅是决定男性性别的关键,更具有极其独特的遗传模式。与常染色体不同,Y染色体严格遵循
“父传子”
的单系遗传规律。除了在其两端极小的拟常染色体区(Pseudoautosomal regions, PARs)能够与X染色体发生重组外,Y染色体的绝大部分区域,即男性特异性区域(Male-specific region of the Y chromosome, MSY),在世代交替中无法通过同源重组来重新洗牌。
这种无法重组的特性导致了
极高的连锁不平衡(Linkage disequilibrium, LD)
结构,同时也使得Y染色体上积累了海量的重复序列。正是因为这些技术上的挑战,在此前十多年的全基因组关联研究(Genome-wide association study, GWAS)热潮中,Y染色体常常被研究人员有意无意地排除在外。然而,这种忽视让我们错失了理解男性特异性疾病风险的重要拼图。由于没有重组的干扰,Y染色体上由于突变累积而形成的单核苷酸多态性(Single-nucleotide polymorphisms, SNPs)和插入/缺失多态性,成为了追溯人类群体演化历史的完美遗传标记,这些具有共同起源的变异组合被称为
“单倍群(Haplogroups)”
。通过对不同地理人群单倍群分布的对比分析,研究人员获得了一个极具价值的视角,用以审视生殖系变异(Germline variation)对人体生理机制的深远影响。
为了真正看清Y染色体在复杂疾病中扮演的角色,研究人员调动了目前世界上最具规模的两个大型生物样本库的基因组数据。他们系统性地评估了来自
日本生物样本库(BioBank Japan, BBJ)的122,683名东亚男性
,以及来自
英国生物样本库(UK Biobank, UKB)的181,472名欧洲男性
的Y染色体单倍群以及体细胞突变状态。这不仅是一次跨越地域的群体遗传学盛宴,更是一次前所未有的
全表型组关联研究(Phenome-wide association studies, PheWAS)
。
在分析BBJ队列时,研究人员面临着一个棘手的技术问题:早期的芯片设计在Y染色体上覆盖的位点相对较少(如BBJ1仅包含1,117个SNPs),这导致在初步的单倍群估算时出现了一定的偏差。为了解决这一问题,研究人员巧妙地利用了基于全基因组测序(Whole-genome sequencing, WGS)的参考序列进行
基因型插补(Genotype imputation)
。这一策略极大地提升了分析的精度,使得他们能够清晰地描绘出东亚人群独特的Y染色体进化树。
在随后的PheWAS扫描中,研究人员不仅考察了55种二元疾病表型,还分析了35种定量表型特征。这种不预设单一目标的广泛撒网式扫描,旨在捕捉Y染色体变异在人类整个生理和病理图谱中留下的任何微小涟漪。正是这种宏大的研究视野,使得一个潜伏在东亚人群中的古老单倍群浮出水面。
当研究人员对比日本队列与千人基因组计划(1000 Genomes Project)的数据时,一个极具地域色彩的现象引起了他们的注意。在日本男性中,主要存在三种单倍群:C、D和O,其占比分别为10.3%、34.0%和53.7%。其中,
单倍群D(Haplogroup D)
显得尤为特殊。这种单倍群几乎仅存在于日本本土,在其他东亚人群中难觅踪迹。
为了追寻单倍群D的起源轨迹,研究人员进一步分析了其在日本列岛的地理分布。有趣的是,常染色体数据显示日本主要存在两个大的遗传聚类:主要分布在本土四岛的“本州(Hondo)”聚类,以及主要分布在琉球群岛的“琉球(Ryukyu)”聚类。
单倍群D在琉球聚类中的频率显著高于本州聚类。
在更细致的区域划分中,冲绳地区的单倍群D频率达到了惊人的
38.7%
。而在琉球群岛内部的与论岛(Yoron Island),这一比例甚至高达
55.7%
。这一地理分布与常染色体中远古绳文人(Jomon)基因组渗入现代日本人的比例高度一致,暗示着单倍群D可能是远古先民留给现代人的独特遗传馈赠。
从分子层面来看,单倍群D携带了一个极其显著的结构变异——Y染色体Alu多态性(Y Alu polymorphism, YAP)。研究人员利用长读长全基因组测序(Long-read WGS)证实,这是一段长度为
349个碱基对(bp)的Alu短散布核元件(SINE)
,它被独特地插入到了HERVIP10B3-int序列元件中。
那么,这段承载着远古印记的单倍群D,究竟在现代人体内发挥着怎样的生理作用?PheWAS的结果给出了令人震撼的答案。在东亚人群中,这个日本特异性的单倍群D与2型糖尿病的患病风险呈现出极其显著的负相关(比值比(Odds ratio, OR)为0.94,P值为2.2×10^-5)。这意味着,携带单倍群D的男性,其罹患糖尿病的概率在遗传基础上就低于其他人群。与此同时,单倍群D还展现出了其多效性(Pleiotropic effects),它与东亚人群的
身高呈现显著负相关
(效应值(β)为-0.050,P值为1.5×10^-15)。除此之外,单倍群D还与估算肾小球滤过率(eGFR)、白蛋白水平以及单核细胞计数等生理指标相关。这些数据清晰地表明,Y染色体上的生殖系变异绝不仅仅是记录群体迁徙的“化石”,它们至今仍在深刻地塑造着宿主的代谢网络。
除了自受精卵形成之初便已注定的生殖系变异,我们的基因组在漫长的生命周期中也在不断积累体细胞突变(Somatic mutations)。其中,最常见的一种形式便是
Y染色体嵌合丢失(Mosaic loss of the Y chromosome, LOY)
。这是一种典型的克隆性造血(Clonal hematopoiesis)现象,即在表面看起来完全健康的男性外周血中,出现了一群失去了Y染色体的血细胞克隆。
在这项研究中,研究人员利用微阵列芯片的探针强度数据,在BBJ队列的9,650名东亚男性(占比
8.0%
)中检测到了LOY现象。而在更年轻的UKB欧洲队列中,LOY的发生率甚至达到了
11.7%
(18,778名男性)。数据确凿无疑地显示,LOY的发生率随着年龄的增长而急剧攀升。此外,环境因素也扮演了极不光彩的角色:
吸烟显著增加了发生LOY的风险
,尤其是在欧洲人群中,当前吸烟者(Current smokers)表现出极高的LOY患病率。
为了弄清哪些天生的基因变异让我们更容易在衰老中失去Y染色体,研究人员进行了一项包含161,026名东亚男性的全基因组关联分析荟萃分析(GWAS meta-analysis)。他们不仅发现了61个与LOY相关的常染色体基因座(其中10个为全新发现),更揭示了一个有趣的现象:
Y染色体的生殖系变异同样影响着自身丢失的概率。
前文提到的、对糖尿病具有保护作用的单倍群D,在这里再次显现了它的特殊价值——它同样能够显著降低LOY的发生风险(OR为0.85,P值为8.1×10^-11)。这种生殖系遗传变异与体细胞突变易感性之间的奇妙交织,为我们理解疾病风险提供了一个立体的双重视角。
如果说单倍群D的故事展现了遗传庇护的美好一面,那么LOY在PheWAS扫描中展现的则是一幅更加复杂、甚至充满矛盾的病理图景。当研究人员将视野投向LOY与疾病关联时,一个巨大的“群体悖论”横亘在他们面前。
在东亚人群(BBJ)中,LOY表现出明显的致病性:它不仅与哮喘风险增加相关(OR为1.36,P值为4.5×10^-11),更
显著增加了2型糖尿病的患病风险(OR为1.15,P值为1.1×10^-7)
。此外,诸如COVID-19、慢性阻塞性肺疾病(COPD)和类风湿性关节炎等疾病也与东亚人群的LOY呈正相关。
然而,当目光转向欧洲人群(UKB)时,情况却发生了戏剧性的反转。
在欧洲男性中,LOY竟然与降低一系列代谢性疾病的风险相关!
数据显示,欧洲人群的LOY与痛风患病风险降低相关(OR为0.68,P值为7.6×10^-21),与高血压患病风险降低相关(OR为0.91,P值为2.2×10^-6),最令人费解的是,它
与2型糖尿病的关联也变成了负向(OR为0.78,P值为1.6×10^-8)
。这与东亚人群的数据形成了完美的镜像倒置。
同一种体细胞突变,为何在不同人种中表现出截然相反的代谢影响?
研究人员并没有被这一悖论所困扰,而是敏锐地将焦点对准了驱动两种人群患病的不同病理机制。他们指出,在欧洲人群中,2型糖尿病的主要驱动因素往往是与肥胖高度相关的胰岛素抵抗;而在东亚人群中,糖尿病往往特征性地表现为胰岛素分泌功能的下降,即便患者的胰岛素抵抗程度较低。数据证实了这一点:体重指数(Body mass index, BMI)对2型糖尿病的影响在UKB队列中是BBJ队列的两倍以上(BBJ的效应值β为0.081,而UKB的效应值β高达0.18)。
更关键的证据在于,在欧洲人群中,BMI与LOY之间存在特异性的负相关关系(效应值β为-0.029,P值为1.9×10^-44),而这种负相关在东亚人群中并不显著(β为-0.0048,P值为0.18)。这说明什么?这意味着在欧洲人中,较高的BMI一方面急剧增加了糖尿病风险,另一方面却作为一种保护因素抑制了LOY的发生(这与之前利用孟德尔随机化发现的因果保护效应一致)。因此,这种肥胖驱动的代谢差异,成为了解释欧洲特异性负相关的关键混杂因素。排除了这层肥胖的干扰后,非糖尿病的欧洲样本中LOY仍与糖化血红蛋白(HbA1c)水平升高呈正相关(β为0.091,P值为5.0×10^-26),暗示LOY在本质上可能依然在不知不觉中损害着欧洲男性的糖代谢功能。
尽管横断面数据指出了关联,但体细胞变异究竟是导致代谢恶化的“因”,还是代谢恶化后引发的“果”?为了回答这个问题,研究人员开展了
纵向随访分析(Longitudinal follow-up analysis)
。基于BBJ和UKB建立的基线LOY状态,研究人员使用Cox比例风险模型(Cox proportional hazards models)评估了随访期间新发疾病的风险。对于PheWAS中发现的具有显著正相关的疾病,纵向分析给出了一致的答案:在东亚人群中,基线检测出LOY的男性,
未来发生2型糖尿病的风险显著增加(风险比(Hazard ratio, HR)为1.22,P值为0.014)
,发生血脂异常的风险也同样上升(HR为1.19,P值为0.0018)。在欧洲人群中,LOY基线则显著预测了COPD的发生风险(HR为1.22,P值为8.3×10^-5)。
单纯的流行病学随访仍不足以揭示遗传层次的因果脉络。于是,研究人员引入了多基因风险评分(Polygenic risk score, PRS)这一强大的统计遗传学工具。他们在BBJ1队列中构建了针对T2D和LOY的PRS模型,并在独立的BBJ2队列中进行测试。分析发现,在从不吸烟的人群(Never-smokers)中,
LOY的PRS不仅能极强地预测LOY的发生
(效应值β高达6.2,P值为4.6×10^-18),同时这套原本用来预测“染色体丢失”的基因评分,
居然也与该人群2型糖尿病的风险增加显著相关
(效应值β为0.81,P值为0.013)。这种环境低风险(无吸烟)条件下的遗传因果性暴露,为LOY参与驱动糖尿病发生提供了极具说服力的论证。
更为震撼的是,研究人员发现LOY在不同遗传背景的人群中扮演着一种“代偿性”的病理角色。他们根据常染色体的糖尿病PRS将受试者分层:在那些常染色体遗传风险极低的人群(PRS排名在后10%)中,LOY对糖尿病的致病效应变得异常强大(OR高达1.62,P值为0.0090);而在常染色体遗传风险极高的人群(PRS排名前10%)中,LOY对糖尿病反而不再显示出显著的额外影响(OR为1.08,P值为0.68)。这揭示了一个残酷的生物学真相:即便你的先祖赐予了你极为优秀的常染色体基因组合,如果在衰老过程中你的体细胞频繁发生了Y染色体的丢失,这种后天累积的突变依然能够绕过常染色体的保护壁垒,将你推向糖尿病的深渊。这也从根本上确立了体细胞变异在复杂疾病预测中不可替代的补充价值。
确立了LOY的致病风险后,摆在研究人员面前的终极挑战是:缺失了一条Y染色体的免疫细胞,是如何隔空影响宿主的全身代谢网络并诱发糖尿病的?为此,研究团队进行了一场涉及蛋白质组学(Proteomics)、代谢组学(Metabolomics)以及单细胞水平(Single-cell)的多维度深度挖掘。
在分析BBJ1队列中51,612名东亚个体的血清样本后,代谢组学揭示了单倍群D与多种代谢物水平存在关联,其中
乙酸盐(Acetate)
的关联尤为显著(β为0.052,P值为2.1×10^-4)。而在对2,071名个体进行的蛋白质组学分析中,研究人员发现有四种与糖尿病正相关的关键循环蛋白(
F16P1、TSP2、ACY1和NFASC
)同样与LOY呈现出强烈的正相关;与此同时,起保护作用的单倍群D则与其中三种蛋白(F16P1、TSP2、NFASC)呈现负相关。这种分子水平的完美契合,暗示着这些循环蛋白极有可能是传递Y染色体信号、调控系统性葡萄糖代谢的关键分子信使。
然而,血液生化指标的改变仅仅是表象。想要看清LOY在细胞内部掀起的风暴,就必须将精度推进到单细胞分辨率。研究团队整合了多个大型单细胞RNA测序(scRNA-seq)数据集,包括亚洲免疫多样性图谱(Asian Immune Diversity Atlas)以及其他队列,共计处理了来自840名男性的1,899,675个外周血单核细胞(PBMCs)。为了最大限度地排除假阳性,他们设定了极其严格的唯一分子标识符(Unique molecular identifier, UMI)阈值。
单细胞分析的结果描绘出了一幅清晰的免疫失衡图谱:在众多免疫细胞子集中,LOY并非随机发生,而是极其显著地富集于
单核细胞(Monocytes)
群体中(OR介于1.91至5.07之间)。为了探究这种特定细胞谱系富集背后的表观遗传机制,研究人员对同时展现出较高LOY水平的样本进行了单细胞多组学分析(同时测定RNA转录本和ATAC染色质可及性)。利用SCENIC+计算工具,他们发现,在发生LOY的单核细胞中,
转录因子FLII相关的基因调控网络(eRegulon)出现了显著的下调
。不仅靶基因的表达降低,与其相关的增强子可及性也同步减弱。已知降低的FLII活性能够在体内促进单核细胞的扩增,这一发现完美地解释了为何缺失Y染色体的造血干细胞会倾向于向髓系单核细胞方向发生偏倚性分化。而在针对哮喘患者的单细胞分析中,LOY单核细胞内部与细胞运动和迁移相关的通路发生了显著下调(80个下调基因),揭示了LOY可能通过不同疾病特异性的机制改变免疫细胞的行为。
血液中的LOY固然能够引发全身性的炎症免疫反应,但LOY仅仅是血液系统的“特产”吗?为了探究体细胞突变的组织广度,研究人员调取了基因型-组织表达项目(GTEx)的数据。通过计算血液测序中的相对Y染色体覆盖率,并将其与组织RNA-seq中的Y染色体基因表达得分进行交叉比对,他们发现:如果在个体外周血中能检测到明显的LOY,那么在其多个其他实质器官(包括肾上腺、乙状结肠等)中,Y染色体的表达水平同样会出现下降。
这一发现促使研究人员将视线投向了糖尿病的核心阵地——
胰腺
。在对两组独立的人类胰岛单细胞数据集(共计来自25名男性的86,027个细胞)进行深度解析后,一个令人揪心的现象被揭示出来:正如血液中发生的那样,胰岛细胞发生LOY的比例也随着捐献者年龄的增长而稳步攀升。更关键的是,在胰腺的各种实质细胞中,
LOY特异性地富集于负责分泌胰岛素的β细胞(Beta cells)中
(在糖尿病样本中OR为1.54,在对照组样本中OR为1.64)。
当研究人员对这些发生了LOY的β细胞进行差异表达分析时,发现其内部的
Akt(蛋白激酶B)信号传导通路遭到了显著的下调
。在内分泌学中,PI3K-Akt通路是维持β细胞存活与胰岛素分泌功能的绝对核心,该通路的衰退在糖尿病发病机制中具有毁灭性的后果。此外,通过多组学网络的构建,他们还发现另一个关键的转录因子——ARNT的活性在LOY β细胞中也出现了降低。ARNT在葡萄糖稳态维持中扮演着举足轻重的角色。综上所述,外周血中的LOY可能仅仅是冰山一角,伴随衰老而发生的实质器官(尤其是胰岛β细胞)体细胞Y染色体丢失,导致了关键代谢通路的停滞与功能衰竭,这很可能是驱动葡萄糖代谢紊乱的又一个核心病理机制。
当生殖系的古老遗传变异(单倍群D)与个体后天衰老所积累的体细胞变异(LOY)共同勾勒出2型糖尿病的风险图谱时,我们现有的疾病预测模型显得如此不完整。在常规的临床研究中,多基因风险评分(PRS)一直仅依赖于常染色体的数据。这项研究试图打破这一藩篱。
研究人员尝试将Y染色体的信息整合进原有的多基因预测模型中。令人振奋的是,将单倍群和LOY状态独立添加到包含常染色体与X染色体PRS的模型后,不仅2型糖尿病的
预测准确性(以Pseudo-R²衡量)得到了极大的提升
,极大似然比检验也给出了极其显著的统计学支持(加入单倍群的P值为0.027,
加入LOY的P值为2.8×10^-5
)。类似地,这种预测能力的提升在身高这一表型上也得到了验证。
科学的探索并未止步于男性。为了验证这套预测策略在全人类中的普适性,研究人员将同样的逻辑应用到了女性的数据中,考察了
女性X染色体的体细胞丢失(Loss of X, LOX)与增加(Gain of X, GOX)现象
。在112,776名BBJ女性中,他们同样发现了惊人的东亚特异性:
LOX与女性糖尿病风险显著负相关
(OR为0.26,P值为4.8×10^-24),而
GOX则呈现出极强的正相关
(OR为3.4,P值为2.7×10^-55)。当把LOX和GOX的变异信息纳入BBJ女性的疾病预测模型后,糖尿病风险
预测的精确度迎来了惊人的飞跃(P值为7.0×10^-70)
。这一系列的突破性进展郑重地宣告:无论男女,将生殖系与体细胞的性染色体变异纳入现有的风险评估体系,必将大幅提升未来糖尿病乃至多种复杂疾病预测模型的效能。
结语
在这场由基因组学、单细胞测序以及宏大队列数据交织而成的科学探险中,研究人员彻底颠覆了我们对Y染色体的传统认知。从承载着东亚先民迁徙密码、对代谢提供遗传庇护的单倍群D,到随着岁月流逝在血液和胰岛深处不断丢失、悄然推高糖尿病风险的体细胞LOY突变,这条曾被视为“遗传荒原”的染色体,实际上是一部记录着人类演化与衰老进程的精密档案。
疾病的发生从来不是单个基因的独角戏,而是远古遗传遗产与现代环境压力、个体衰老突变之间在细胞深处旷日持久的博弈。通过重新审视这些被遗忘的遗传密码,我们不仅获得了理解糖尿病发病机制的全新维度,更为未来精准医疗和疾病早期预防点亮了一座全新的灯塔。
参考文献
Sato G, Yamamoto Y, Sonehara K, Saiki R, Ojima T, Kanai M, Liu A, Edahiro R, Shirai Y, Namba S, Namkoong H, Hasaegawa T, Koyanagi YN, Kasugai Y, Yamaji T, Nakano S, Genovese G, Sipilä TP, Ghazal A, Tanaka H, Azekawa S, Uwamino Y, Yamamoto K, Suzuki K, Hata T, Uemura M, Takeda Y, Kanai A, Higashiue S, Kobayashi S, Afuso H, Matsuura K, Mitsumoto Y, Fujita Y; FinnGen; Japan COVID-19 Task Force; Biobank Japan Project; Oda Y, Suzuki Y, Morisaki T, Ishii M, Kitagawa Y, Koike R, Kimura A, Imoto S, Miyano S, Kanai T, Takayama J, Iwasaki M, Sawada N, Fukunaga K, Matsuo K, Kumanogoh A, Doki Y, Eguchi H, Nakagome S, Tamiya G, Ganna A, Palotie A, Daly MJ, Wilson JF, Yamamoto M, Matsuda K, Ogawa S, Yamauchi T, Kadowaki T, Okada Y. Genetic regulation across germline and somatic variation on the Y chromosome contributes to type 2 diabetes. Nat Med. 2026 Feb 23. doi: 10.1038/s41591-026-04213-z. Epub ahead of print. PMID: 41731096.
声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!
来源:生物探索一点号1