摘要:尽管单一罕见病的发病率极低,但累计起来却影响着全球约3.5%-5.9%的人口【1】,为患者及其家庭带来沉重的健康和经济负担。近年来,基因组测序技术的飞速发展极大推动了罕见病的分子诊断,使越来越多的患者得以明确病因。然而,即便借助全外显子组测序(WES)和全基因
撰文 | 阿童木
尽管单一罕见病的发病率极低,但累计起来却影响着全球约3.5%-5.9%的人口【1】,为患者及其家庭带来沉重的健康和经济负担。近年来,基因组测序技术的飞速发展极大推动了罕见病的分子诊断,使越来越多的患者得以明确病因。然而,即便借助全外显子组测序(WES)和全基因组测序(WGS)等高通量技术,仍有50%-80%的罕见病患者无法获得明确的分子诊断。这一现状不仅暴露了当前遗传病研究的局限,也凸显了破解这一难题的迫切需求。
据《在线人类孟德尔遗传数据库》(OMIM)统计,已知的罕见孟德尔病(单基因病)约有10,000种,但其中仅不到一半找到了明确的遗传根源【2】。这一“未解之谜”在一定程度上源于现有基因组分析方法的局限。例如,传统诊断策略主要关注外显子区域,可能忽略了非编码区变异或结构变异的关键作用。更具挑战性的是,许多罕见病的致病突变可能位于尚未被发现或尚未建立疾病关联的基因中。因此,仅依赖于现有数据库或候选基因筛选,往往难以满足临床诊断需求。
为突破这一瓶颈,多个国际大规模罕见病测序项目相继启动,包括未确诊疾病网络(UDN)、孟德尔基因组中心(CMG)、发育障碍解码计划(DDD)以及英国的10万基因组计划(100KGP)【3】。这些项目不仅致力于挖掘新的致病基因,还借鉴了复杂疾病研究中的病例-对照分析方法,以提高基因与疾病关联的识别能力。通过整合并分析大规模罕见病患者的基因数据,这些研究为揭示罕见病的遗传机制提供了前所未有的机会,也为更多患者带来了精准分子诊断和潜在治疗方案的希望。
近日,伦敦皇后玛丽大学Damian Smedley实验室联合多家机构在
Nature杂志发表了题为Rare disease gene association discovery in the 100,000 Genomes Project的研究文章。研究团队通过优化罕见变异筛选流程和统计建模方法,升级了基因负荷分析框架,使其更适用于孟德尔疾病及不平衡的病例-对照研究,并开发出通用的开源可视化R框架geneBurdenRD研究团队利用该框架分析了100KGP的大规模数据,借助改进的计算分析和临床专家评估,初步发现了69个潜在的新“疾病-基因”关联,最强的5个关联涉及UNC13A(单基因糖尿病)、GPR17(精神分裂症)、RBFOX3(癫痫)、ARPC3(CMT病)和POMK(眼异常)。本研究开发的罕见变异基因负荷分析框架具有广泛适用性和显著潜力,为揭示罕见病遗传基础提供了有力工具。研究团队开发了一个开源R框架geneBurdenRD,用于在罕见病测序队列中进行病例-对照的基因负荷测试。用户需提供包含疑似致病变异的Exomiser处理文件、分析标签及样本分组信息,病例和对照可根据疾病类别、表型注释或聚类定义。geneBurdenRD框架通过质量控制过滤假阳性或常见变异,并剔除对照中出现的病例变异,以模拟孟德尔疾病模型。利用CAST统计和Firth回归,框架评估FDR校正的疾病-基因关联,针对功能丧失、高致病性、受限编码区及新生变异进行测试,并对结果进行可视化。
随后,研究团队利用geneBurdenRD框架对100KGP中的34,851个先证者及其家族(共72,690个基因组)开展了罕见变异基因负荷分析。在4,643,230个筛选出的变异中,他们针对226种疾病的病例与20个疾病组的对照进行了161次比较分析,最终识别出165个已知“疾病-基因”关联,以及141个新发现的关联。其中,5个新关联得到独立研究验证,其余经筛选保留69个,主要由致病性错义变异驱动。结合文献、表型及动物模型证据,30个关联获得实验支持,ClinGen评估显示27个达到中等证据水平,并最终选出5个高评分候选 “疾病-基因”关联进行重点展示。
研究发现,UNC13A基因变异与“提示单基因病因的糖尿病”呈显性关联(ClinGen评分9)。这一关联由两名病例中的罕见功能丧失(LoF)变异(p.Ala53Serfs50和p.Gly44*)驱动,比值比(OR)高达329.8。这些变异未在gnomAD数据库中检出,被评估为“可能致病”,并预测会引发无义介导的mRNA降解(NMD)。UNC13A在调控β细胞胰岛素分泌方面发挥关键作用,动物模型研究表明,杂合敲除小鼠表现出糖耐量受损,进一步支持其作为致病基因的可能性。
此外,研究还发现RBFOX3变异与家族性广泛性癫痫相关(ClinGen评分11),ARPC3变异与腓骨肌萎缩症(CMT病)相关,POMK变异与角膜异常相关,GPR17变异则与精神分裂症伴额外特征相关。这些关联均经过严格的统计分析、文献支持及实验验证,显示出较高的可信度。
综上所述,本研究开发了新的罕见变异基因负荷分析框架——geneBurdenRD,将该框架应用于分析100KGP测序数据后,鉴定到141个新的疾病-基因关联,其中5个已获文献支持。经过筛选和评审,69个关联被优先考虑,30个获得实验支持。证据最强的5个关联分别涉及UNC13A(单基因糖尿病)、GPR17(精神分裂症)、RBFOX3(癫痫)、ARPC3(CMT病)和POMK(眼部异常)。未来若这些发现能够进一步得到验证,将显著提高诊断率,并充分展现该统计方法和分析框架在罕见病研究中的重要价值。
制版人: 十一
参考文献
1. Nguengang Wakap, S. et al. Estimating cumulative point prevalence of rare diseases: analysis of the Orphanet database.Eur. J. Hum. Genet.28, 165–173 (2020).
2. Amberger, J. S., Bocchini, C. A., Scott, A. F. & Hamosh, A. Omim.org: leveraging knowledge across phenotype-gene relationships.Nucleic Acids Res.47, D1038–D1043 (2019).
3. Turnbull, C. et al. The 100 000 Genomes Project: bringing whole genome sequencing to the NHS.BMJ361, k1687 (2018).
学术合作组织
战略合作伙伴
来源:枯木生玫瑰