Nat. Commun. | 突破传统GWAS方法?浙大杰青团队开发定位新策略直接锁定棉花功能基因!

B站影视 韩国电影 2025-06-03 21:38 2

摘要:想做单细胞测序、T2T基因组、群体GWAS等分析,怕看不懂数据,0基础自学又怕学不会,一直没行动?别愁啦!组学大讲堂VIP来破局!

想做单细胞测序、T2T基因组、群体GWAS等分析,怕看不懂数据,0基础自学又怕学不会,一直没行动?别愁啦!组学大讲堂VIP来破局!

0基础学习,免软件安装一键分析1对1的VIP售后答疑,边学边练易上手,助你高效发文章。时值618活动,优惠更多,更具性价比!

棉花作为全球最重要的天然纤维来源,其遗传改良依赖于对复杂性状遗传机制的深入解析。传统全基因组关联分析(GWAS)主要基于单核苷酸多态性(SNP),但由于基因组复杂结构、连锁不平衡(LD)及多倍体特性,难以直接定位到功能基因。

近日,浙江大学张天真教授团队在国际权威期刊《Nature Communications》在线发表研究成果:《Reveal genomic insights into cotton domestication and improvement using gene level functional haplotype-based GWAS》。

该研究提出一种创新策略,将基因组变异转化为基因水平的功能单倍型(Functional Haplotype, FH),通过整合3724份棉花种质资源(包括野生种、地方品种及现代栽培种)的基因组和表型数据,结合改进的混合线性模型,直接识别与20个农艺性状相关的数量性状基因(QTGs)。这一方法有效降低了基因组结构复杂性及LD的干扰,为植物功能基因的高效定位和育种设计提供了新思路。

主要分析方法和结果

1. 功能单倍型(FH)的构建与基因多样性分析

方法:基于非同义突变(missense variants)将基因编码区的变异转化为复合功能单倍型(FH),每个基因的FH类型由其非同义突变组合决定。通过计算香农均衡指数(E_H)评估基因多样性,结合群体结构分析,解析棉花驯化过程中的选择信号。

结果:

在3724份种质中,共鉴定出1,368,685个FH,平均每个基因含22种FH。

基因多样性(E_H)在染色体间差异显著,D11染色体多样性最低(E_H=0.0391),可能与人工选择压力相关。

野生种和早期地方品种(如中美洲、南美洲种质)的基因多样性显著高于现代栽培种,表明驯化过程中存在定向选择(图2c)。

序列保守基因(SCGs)主要参与细胞骨架、光合作用等基础功能,而高多样性基因(HPGs)多与抗病和逆境响应相关(图2d)。

2. 群体结构与基因交流分析

方法:基于FH遗传距离构建系统发育树,解析全球棉花种质的遗传关系;通过基因单倍型块(haplotype blocks)追踪遗传成分的流动。

结果:

3724份棉花分为6个遗传群体,其中G6包含美洲及中国南方早期地方种,G4主要为美国现代栽培种(图3a)。

FH单倍型块分析揭示染色体A06和A08的结构变异,例如A08的HB-1单倍型为中国西北棉区特有,携带该单倍型的种质纤维长度(FL)和强度(FS)显著提升(图3c-e)。

基因交流分析显示,美国种质向中国黄河流域(YRR)及长江流域(YZR)的基因渗入频繁,反映了历史引种与育种中的遗传改良(图3f)。

3. FH-GWAS关联分析及QTGs鉴定

方法:采用改进的混合线性模型,将FH基因型与245组表型数据(涵盖纤维品质、产量、抗性等20个性状)进行回归分析,筛选显著关联基因,并通过CRISPR-Cas9验证关键基因功能。

结果:

共鉴定10,279个候选QTGs,经效应值筛选后确认532个具显著育种潜力的基因(如GH_D11G1903,图4a-c)。

纤维品质相关QTGs(如FL、FS)多位于A亚基因组,受较强选择压力;产量相关QTGs(如衣分LP)在D亚基因组富集(图4c)。

时间趋势分析显示,1990年后育成品种中高产、优质相关FH比例显著增加,而纤维细度(FM)相关FH减少,反映育种目标演变(图4d-e)。

基因GhFAH1(编码阿魏酸5-羟化酶)的FH-2和FH-4单倍型显著降低纤维品质,CRISPR敲除该基因后纤维长度提高12.7%(图5)。

4. 驯化与改良的遗传基础

方法:通过对比早期种质与现代栽培种的基因多样性变化,解析驯化过程中的选择模式。

结果:

现代品种中,与碳水化合物代谢、花粉识别相关的基因多样性显著降低,暗示人工选择对产量性状的强化(图2e)。

纤维品质与产量的负相关性由QTGs的拮抗效应驱动:79.41%的QTGs对FS和LP呈同向效应,但

来源:小黄看科技

相关推荐