摘要:DNA甲基化(DNAm)在特定CpG位点上的5-甲基胞嘧啶(5mC)比例随年龄而显著变化,因此DNA甲基化是法医学中估计个体年龄的关键分子标记,然而,基于年龄相关CpG位点(AR-CpG)DNA甲基化标记的年龄预测模型在不同细胞类型和组织中的表现不一致,尤其是
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。
DNA甲基化(DNAm)在特定CpG位点上的5-甲基胞嘧啶(5mC)比例随年龄而显著变化,因此DNA甲基化是法医学中估计个体年龄的关键分子标记,然而,基于年龄相关CpG位点(AR-CpG)DNA甲基化标记的年龄预测模型在不同细胞类型和组织中的表现不一致,尤其是精子发生过程中独特的甲基化模式,导致体细胞模型在精液中的表现不佳。同时目前的研究受到甲基化芯片覆盖范围有限的限制,因此,迫切需要鉴定和验证精液特异性的AR-CpG标记。
近日,华中科技大学同济医学院法医学系黄代新教授团队利用双酶切简化基因组亚硫酸盐测序(dRRBS)鉴定出新的精液特异性年龄相关CpG(AR-CpG)位点,并通过亚硫酸盐扩增测序(BSAS)验证这些标记,再结合先前报道的位点和邻近CpG位点,以开发稳健的年龄估计模型。相关研究成果以“DNA methylation-based age estimation from semen: Genome-wide marker identification and model development“为题发表在《Forensic Science International: Genetics》期刊。深圳易基因科技为本研究提供DNA甲基化年龄预测的dRRBS技术服务。
本研究对21名健康中国男性(分为三个年龄组)的精液样本进行了全甲基化组关联研究,每个样本生成了超4M CpG位点(深度≥5×)。对721840个共有CpG位点的分析显示,超95%的位点未被传统甲基化芯片覆盖。差异甲基化和相关性分析鉴定出139个AR-CpG位点,并采用基于多重PCR的BSAS两阶段验证过程。第一阶段,对dRRBS鉴定的129个精液样本(22-64岁)中前47个AR-CpG位点、26个文献报道的位点和242个邻近CpG位点进行预测,验证了31个dRRBS、26个文献报道的和152个邻近CpG位点与年龄相关。第二阶段,在247个样本(22-67岁)中检验了154个CpG位点,确认了71个AR-CpG位点(|rho| > 0.50)。其中,chr2:129071885(cg19998819)作为最强年龄相关标记(rho = 0.81)脱颖而出。利用第二个BSAS数据集,研究在重复嵌套交叉验证(CV)框架内开发了基于多元线性回归和随机森林(RF)算法的年龄估计模型。RF模型在5-25个CpG特征子集上表现出更高的准确性。优化的9-CpG RF模型平均均方根误差为4.73年(4.62-4.96,SD=0.10),平均绝对误差为3.30年(3.23-3.43,SD=0.06)。本研究表明dRRBS在大规模AR-CpG发现中的实用性,并为法医学应用提供了一个稳健的年龄估计模型和一个全面的精液特异性AR-CpG位点参考数据库。
研究方法
样本收集:精液样本来自两组健康中国男性志愿者,一组用于标记鉴定,另一组用于标记验证和模型开发。AR-CpG位点的识别:使用dRRBS技术对发现队列的精液样本进行全基因组AR-CpG位点鉴定。候选AR-CpG位点的选择:基于dRRBS鉴定的AR-CpG位点和文献中报道的位点,选择前50个AR-CpG位点进行进一步验证。候选AR-CpG位点的验证:通过BSAS进行两阶段验证过程,定量检测候选位点及其邻近CpG位点的甲基化水平。统计分析和年龄估计建模:使用嵌套交叉验证(CV)框架开发年龄估计模型,包括多重线性回归(MLR)和随机森林(RF)算法。结果图形
图1:研究流程图
图2:dRRBS鉴定精液中的AR-CpG位点
表1:dRRBS筛选出的候选年AR-CpG
图3:BSAS验证候选年龄相关CpG位点
图4:利用重复嵌套交叉验证(CV)方法进行年龄估计建模和性能评估。
易小结:研究亮点
dRRBS技术的应用:dRRBS技术在大规模AR-CpG发现中的实用性,为法医学应用提供了稳健的年龄估计模型和全面的精液特异性AR-CpG位点参考数据库。模型准确性:随机森林模型在5至25个CpG表征子集上表现出优越的准确性,优化的9-CpG模型实现了平均均方根误差4.73年和平均绝对误差3.30年的高精度年龄估计。新标记的发现:研究不仅验证了先前报道的AR-CpG位点,还发现了新的与年龄强相关的位点,如chr1:19339432和chr13:93039685,为未来的法医学年龄估计提供了新的标记。关于易基因简化基因组甲基化测序(RRBS)研究解决方案
简化甲基化测序(Reduced Representation Bisulfite Sequencing,RRBS)是利用限制性内切酶对基因组进行酶切,富集启动子及CpG岛等重要的表观调控区域并进行重亚硫酸盐测序。该技术显著提高了高CpG区域的测序深度,在CpG岛、启动子区域和增强子元件区域可以获得高精度的分辨率,是一种准确、高效、经济的DNA甲基化研究方法,在大规模临床样本的研究中具有广泛的应用前景。
为适应科研技术的需要,易基因进一步开发了可在更大区域内捕获CpG位点的双酶切RRBS(dRRBS),可研究更广泛区域的甲基化,包括CGI shore等区域。
为助力适用低起始量DNA样本(5ng)量多维度甲基化分析,易基因开发了富集覆盖CpG岛、启动子、增强子、CTCF结合位点的甲基化靶向基因组测序方法:extended-representation bisulfite sequencing(XRBS),实现了高灵敏度和微量样本复用检测,使其具有高度可扩展性,并适用于有限的样本和单个细胞基因组CG位点覆盖高达15M以上。
技术优势:
起始量:100ng gDNA;单碱基分辨率;多样本的覆盖区域重复性可达到85%-95%、测序区域针对高CpG调控区域,数据利用率更高;针对性强,成本较低;基因组CG位点覆盖高达10-15M,显著优于850K芯片。应用方向:
RRBS/dRRBS/XRBS广泛应用于动物,要求全基因组扫描(覆盖关键调控位点)的:
队列研究、疾病分子分型、临床样本的甲基化 Biomarker 筛选复杂疾病及肿瘤发病机制等甲基化研究模式动物发育和疾病甲基化研究易基因提供全面的表观基因组学(DNA甲基化、DNA羟甲基化、cfDNA)和表观转录组学(m6A、m5C、m1A、m7G、ac4C、RNA与蛋白互作)、DNA与蛋白互作及染色质开放性技术方案(ChIP-seq、ATAC-seq),详询易基因:0755-28317900。
参考文献:
Li Y, Liu X, Chen M, Yi S, He X, Xiao C, Huang D. DNA methylation-based age estimation from semen: Genome-wide marker identification and model development. Forensic Sci Int Genet. 2024 Dec 25;76:103215. pii: S1872-4973(24)00211-4. doi: 10.1016/j.fsigen.2024.103215. PubMed PMID: 39752798.
相关阅读:
1. Nature | 易基因DNA甲基化测序助力人多能干细胞向胚胎全能8细胞的人工诱导
2. Cell|易基因微量DNA甲基化测序助力中国科学家成功构建胚胎干细胞嵌合体猴,登上《细胞》封面
3. 项目文章 | WGBS+RNA-seq揭示松材线虫JIII阶段形成过程中的DNA甲基化差异
4. 项目文章|WGBS揭示Vpr蛋白在HIV-1感染中对CD4+ T细胞DNA甲基化变化的作用
5.项目文章 | WGBS+RNA-seq揭示黄瓜作物的“源-库”关系受DNA甲基化调控
6. 项目文章 | WGBS等揭示SOX30甲基化在非梗阻性无精症中的表观遗传调控机制
7. 项目文章|WGBS+RNA-seq揭示PM2.5引起男性生殖障碍的DNA甲基化调控机制
8.项目文章:oxBS揭示复发性膀胱癌的DNA甲基化和羟甲基化变化并鉴定预测PD-L1表达标记物
9.项目文章|PNAS:中国农大田见晖教授团队揭示DNA甲基化保护早期胚胎线粒体基因组稳定性
10.年终盘点 | 易基因2023年度DNA甲基化研究项目文章精选
11. 项目文章:泪腺RRBS+RNA-seq揭示Sjögren综合征相关干眼症的潜在基因
来源:易基因科技