iMeta | 贵州大学王孝敬组-杜鹃属植物T2T基因组、泛基因组分析和热应激反应基因

B站影视 内地电影 2025-03-10 12:38 1

摘要:T2T genome, pan-genome analysis, and heat stress response genes in Rhododendron species

杜鹃属植物T2T基因组、泛基因组分析和热应激反应基因

iMeta主页:http://www.imeta.science

研究论文

● 原文: iMeta (IF 23.8)

● 原文链接:

https://onlinelibrary.wiley.com/doi/full/10.1002/imt2.70010

DOI: https://doi.org/10.1002/imt2.70010

2025年3月5日,贵州大学王孝敬、牛素贞和华北理工大学宋小明等在iMeta在线发表了题为“

T2T genome, pan-genome analysis, and heat stress response genes in Rhododendron species”的文章。

本研究首次报道了T2T水平的百合杜鹃基因组,鉴定了几个与热胁迫相关的关键基因和miRNA,为杜鹃属植物的比较基因组学和功能基因组学研究提供了丰富的资源。

● 第一作者:王孝敬、周平、胡晓玉、白云、张晨浩

● 通讯作者:宋小明(songxm@ncst.edu.cn)、牛素贞(niusuzhen@163.com)

● 合作作者:付艳红、黄蕊蕊

主要单位:贵州大学农业生物工程研究院、山地植物资源保护与种质创新教育部重点实验室、生命科学学院;华北理工大学生命科学学院、基础医学院;加州大学旧金山分校人类遗传学研究所

亮 点

● 本研究首次报道了具有13条染色体的高质量端粒到端粒(T2T)的百合杜鹃基因组;

● 基于15个杜鹃属植物基因组,对杜鹃属植物进行了泛基因组分析;

● 结合基因组测序和全转录组测序,鉴定了几个与热胁迫相关的关键基因和miRNA,为杜鹃属植物的比较基因组学和功能基因组学研究提供了丰富的资源。

摘 要

本研究首次报道了具有13条染色体的高质量端粒到端粒(T2T)的百合杜鹃基因组。在该基因组中检测到24个端粒和全部13个着丝粒,达到最高质量水平。另外,对另外3种杜鹃进行了染色体测序和组装。基于15个杜鹃属植物基因组,对杜鹃属植物进行了泛基因组分析。结合基因组测序和全转录组测序,鉴定了几个与热胁迫相关的关键基因和miRNA,并通过转基因实验进一步验证。本研究为杜鹃属植物的比较基因组学和功能基因组学研究提供了丰富的资源。

视频解读

Bilibili:https://www.bilibili.com/video/BV1r8RNYFEvq/

Youtube:https://youtu.be/Oaq4US_i3-k

中文翻译、PPT、中/英文视频解读等扩展资料下载

请访问期刊官网:http://www.imeta.science/

全文解读

引 言

杜鹃花属于杜鹃花科,是木本植物中最大的属之一。全世界大约有1000种杜鹃花,中国是重要的分布中心。它们在喜马拉雅-横断山脉经历了进化辐射,横断山脉是世界生物多样性的热点。杜鹃花属植物因其观赏价值而在园艺中占有重要地位。全球气候变化导致温度升高,而热胁迫会影响植物的生长发育。然而,杜鹃花植物通常适应较冷的气候。利用多组学分析和分子生物学技术研究杜鹃花对高温胁迫的响应机制,对选育耐热品种、扩大杜鹃花栽培范围具有重要意义。

结 果

杜鹃属植物基因组测序、组装与评价

在这里,我们通过PacBio HiFi、Oxford Nanopore Technology(ONT)、Illumina和Hi-C技术(图1A,表S1-6)对四种杜鹃花植物(Rhododendron liliiflorum、Rhododendron decorum、Rhododendron platypodumRhododendron concinnum)进行从头基因组测序。通过K-mer估算的R. liliiflorum、R. decorum、R. platypodumR. concinnum的基因组大小分别为759.08 Mb、581.05 Mb、593.47 Mb和1356.22 Mb,并通过流式细胞术进一步验证(表S1,图1B)。

我们发现,R. concinnum的基因组几乎是其他三个物种的两倍大。因此,我们利用流式细胞术进一步分析了染色体核型,首次发现R. concinnum为四倍体,核型为2n=4x=52,与其他三个二倍体物种(2n=2x=26)有明显差异(图1C,表S1)。

4个物种的基因组大小分别为793.25 Mb、649.87 Mb、652.27 Mb和1321.11 Mb(表S1)。经Hi-C检测,4个种的染色体锚定率均在97.90%以上(图1D,表S5)。我们获得了4个高质量的组装基因组,支架N50大于48.68 Mb。核心真核基因作图法(CEGMA)值从95.63%到99.56%,基准通用单拷贝同源序列(BUSCO)值从96.65%到97.34%,读取作图率超过99.40%(表S7)。

最重要的是,我们获得了一个高质量的R. liliiflorumT2T基因组,该基因组由13条染色体组成,检测到24个端粒和13个着丝粒(图S1A,表S8-11)。其中11条染色体在端粒与端粒之间没有间隙,另外2条染色体只有一个间隙。百合杜鹃花基因组的重叠群N50大于58.56MB,大于以往大多数杜鹃基因组的重叠群N50。采用BUSCO软件对基因组完整性进行评估(96.65%),基因组一致性质量值(QV)为43.71(表S1)。基因组LTR组装指数(LAI)值为21.15(图S1B),表明已达到最高质量水平(LAI≥20)。

重复序列占4个基因组的49.10%以上,以长末端重复序列(LTRs)最多(图1E,表S11)。在这四个基因组中,共预测到41406、41084、40556和83203个基因(表S12)。检测到超过97.15%的BUSCO基因,说明预测的完整性较高(表S13)。NR、eggNOG、GO、KEGG、TrEMBL、KOG、Swissprot和Pfam数据库对92.16%以上的基因进行了注释(表S14)。共检测到2355、4862、2852和9511个非编码RNA(表S15)。

15个杜鹃属植物泛基因组分析

杜鹃属植物以其多样的花朵展示而闻名,近年来,随着第一个R. delavayi基因组的公布,一些基因组被解码,引起了科学界的高度关注。报道了几种杜鹃属植物的基因组,如R. griersonianum、R. Henanense、R. Irroratum、R. kiyosumense、R. Ripense、R. Vialii、R. nivaleR. williamsianum。这些基因组为泛基因组研究奠定了基础。

基于这四个高质量基因组以及11个先前发表的基因组,对杜鹃属植物进行了泛基因组分析(图1F,表S16)。选择T2T水平的R. liliiflorum基因组作为参考。该泛基因组通过添加394.57 Mb和14424个基因,扩展了T2T水平的R. liliiflorum基因组。

15个物种的基因家族数量为45731个,包括5734个核心基因家族、37027个可有可无的基因家族和2970个私有基因家族(图1G、图S2A、表S17)。利用打乱图分析了15个物种间基因家族共享与唯一性的关系。最后,我们基于聚类分析构建了基因家族存在与否的分布图(图1H)。

在2970个私有基因家族中,R.irroratum(1705)的物种特异性基因最多(表S17,图S2B)。功能富集分析表明,“倍半萜和三萜生物合成”和“亚油酸代谢”途径显著富集(图S3)。

共鉴定出121185个核心基因,R. ovatum基因组的数量最多(9847)(图S2B)。功能富集分析表明,与花的颜色和香味相关的基因途径显著富集,如柠檬烯和蒎烯降解(图S4)。

15个杜鹃属植物基因组的变异分析

基于以T2T基因组为参考的泛基因组分析,我们对杜鹃花的单核苷酸多态性(SNPs)、插入和缺失(InDels)以及结构变异(SVs)等变异进行了全面鉴定(图1I-L,图S5)。

四倍体R. concinnum具有最多的SNP(1876446)和InDels(图1I,表S18-19)。功能富集分析表明,含有SNPs和InDels的基因在“碳代谢”和“氨基酸生物合成”途径中显著富集。R. concinnum的SV数量最多,达到7694(表S20)。同时,我们进一步将SVs细分为重复(DUP)、易位(TRANS)和反转(INV),发现在大多数杜鹃属植物中,前者的数量超过后者(图S6-7)。SVs基因与SNPs或InDels基因相比表现出明显的模式,主要集中在RNA聚合酶和mRNA监控途径上。

15个杜鹃花基因组的LTR分析

我们在15个杜鹃属物种的全基因组中鉴定了70759个LTR,其中R. griersonianum基因组的LTR数量最多(7323)(表S21)。我们发现,在过去的一百万年中,大多数杜鹃花物种只经历了一次插入事件的爆发,而R. delavayi、R. molleR. williamsianum经历了两次插入事件的爆发。两个事件分别发生在1.53mya和2.94mya。

我们对15个物种的LTR进行聚类,得到每个聚类中的共享LTR。结果表明,共有2622个LTR聚类,其中R. platypodum最多(531个)。R. liliiflorum中特异性LTRs数量最多(109个),而R. williamsianum中未发现物种特异性LTRs。聚类图显示,R.williamsianum与其他物种共享LTR的比例最高(图1M)。此外,LTR在染色体中部的分布密度大于两端(图1N)。

15个杜鹃属植物基因组的共线性分析

通过共线性分析,我们发现15个杜鹃基因组普遍表现出良好的共线性(图1O)。共线性区组数从336个(R. henanense vsR. delavayi)到692个(R. irroratum vsR. prattii)。此外,还发现了一些基因组转座现象,如R. ovatum7号染色体的末端区域与R. simsiiR. henanense

图 1. 4种杜鹃属及11种已发表杜鹃属植物的基因组分析

(A)四种杜鹃花的开花照片;(B)通过k-mer进行基因组调查。(C)流式细胞术检测染色体核型;(D)基因组组装的Hi-C接触图;(E)转座子、SSR、基因密度和GC含量在染色体上的分布;(F)核心(红色)和非核心(蓝色)基因家族数量趋势图;(G)核心集群、可有可无集群和私有集群的家族数量;(H)核心、可有可无和私有集群的存在和缺失分析;(I)百合杜鹃花基因组中基因密度、SNP和InDel变异的分布情况;(J-L)以T2T基因组为参照,研究了端粒红豆杉、鸭嘴兽和短柄红豆杉基因组的同源性和重排;(M)两个物种之间共享LTR的比例(Rconc: R. concinnum; Rdeco:R. decorum; Rdela: R. delavayi; Rgrie:R. griersonianum; Rhena:R. henanense; Rirro:R. irroratum; Rlili:R. liliiflorum; Rmoll: R. molle; Rovat:R. ovatum; Rplat:R. platypodum; Rprat:R. prattii; Rripe:R. ripense; Rsims: R. simsii; Rvial:R. vialii; Rwill: R. williamsianum);(N)LTR在染色体上的分布。x轴代表染色体位置的百分比,y轴代表LTR的插入时间;(O)15种杜鹃属植物的基因组共线性。右边的数字表示共线块编号。

热反应基因的全转录组测序与检测

为了探索杜鹃花的耐热基因和调控机制,我们在CK热处理、3天热处理(H3)和6天热处理(H6)条件下进行了全转录组测序(图2A,表S22)。共鉴定出50648个mRNAs、17476个lncRNAs、448个miRNAs和6299个circRNAs(图2B)。此外,在CK、H3和H6处理中,632个mRNAs、21个lncRNAs和6个miRNAs的表达和共享存在差异(图2C)。

候选基因的功能验证

我们选择了两对具有代表性的miRNAs和相关靶基因进行功能验证。热处理后3h和6h,靶基因表达显著上调,小RNA表达显著下调。我们进一步研究了miR177对RdbHLH153(Rhdel02G0118700)表达和miR49对RdMYB1R1(Rhdel08G0208700)表达的影响。将萤火虫荧光素酶分别融合到RdbHLH153和RdMYB1R1的C端,并将miR49和miR177分别插入SK载体(图2D)。结果显示,RdbHLH153中的miR177和RdMYB1R1中的miR49的靶位点略有改变(图2E)。用RdbHLH153/RdMYB1R1与空SK载体(混合并渗透)或RdbHLH153与miR177(RdMYB1R1和miR49)的混合物对烟草单叶渗透区进行渗透。均显示荧光素酶信号的诱导,而R. delavayi中过表达的miR177和miR49可消除RdbHLH153/RdMYB1R1产生的信号(图2E-G)。

为了进一步研究RdbHLH153和RdMYB1R1在热胁迫中的作用,采用花浸法获得了过表达RdbHLH153和RdMYB1R1的转基因拟南芥株系(表S23)。36 h热处理后,转基因植株的生长明显优于WT(图2H)。经过热处理后,幼苗恢复正常状态5天,发现转基因植株转活,WT叶片全部变黄。说明RdbHLH153和RdMYB1R1在提高耐热性中起重要作用。DAB和NBT染色显示,与野生型植株相比,RdbHLH153/RdMYB1R1 OE株系中H2O2和O−2的含量显著降低(图2I)。

图2. miRNA和靶基因的全转录组分析及功能验证

(A)R. delavayi的对照(CK)和热处理(H3和H6);(B)mRNA、lncRNA、miRNA和circRNA的鉴定和差异表达分析;(C)三种比较中特异性和常见的差异表达RNA;(D)效应器和报告器结构图;(E)miR49和miR177靶点突变示意图;(F)荧光素酶测定统计。误差条表示三个重复的SEs(*,p 22和O−2。

讨 论

杜鹃属植物以其多样的花朵展示而闻名,近年来,随着第一个R. delavayi基因组的公布,一些基因组被解码,引起了科学界的高度关注。通过对9种杜鹃属植物的基因组测序,研究人员揭示了花色多样性形成的分子机制。此外,还报道了一些杜鹃属植物的基因组,如R. griersonianum、R. Henanense、R. Irroratum、R. Kiyosumense、R. Ripense、R. Vialii、R. nivaleR. williamsianum。这些基因组和相关数据库为更全面地了解比较基因组学和功能基因组学研究奠定了基础。

虽然已经对杜鹃花进行了多个基因组测序,但均未达到T2T水平,特别是以T2T基因组为参照进行大规模的泛基因组分析。在T2T水平上对R. liliiflorum基因组进行了破译。与已发表的基因组相比,我们获得了质量更高、更完整的杜鹃基因组。R. liliiflorum基因组的重叠群N50大于58.56MB,大于以往大多数杜鹃基因组的重叠群N50。此外,对15个杜鹃属植物基因组进行了大规模的全基因组分析,发现了大量的结构变异,用于了解不同形态背后的遗传多样性。

代码和数据可用性

所有测序数据已保存在NCBI中,提交编号SUB15033098,生物项目登录号PRJNA1215314(https://www.ncbi.nlm.nih.gov/sra/PRJNA1215314)。所有的基因组注释数据集也被整理在TEGR数据库的下载界面上(http://www.tegr.com.cn)物种拉丁名。使用的数据和脚本保存在GitHub中(https://github.com/songxm-ncst/Rhododendron)。补充材料(方法、图表、图表、图形摘要、幻灯片、视频、中文翻译版和更新材料)可在DOI或iMeta Science网站上找到http://www.imeta.science/.。

引文格式

Xiaojing Wang, Ping Zhou, Xiaoyu Hu, Yun Bai, Chenhao Zhang, Yanhong Fu, Ruirui Huang, Suzhen, Niu, Xiaoming Song. 2025. “T2T genome, pan-genome analysis, and heat stress response genes in Rhododendron species.” iMeta4: e70010. https://doi.org/10.1002/imt2.70010.

作者简介

王孝敬(第一作者)

● 贵州大学副教授。

● 主要从事园艺植物基因的起源和进化功能生物信息分析,以及染色体水平的植物基因组挖掘。发表SCI 论文20余篇,累计影响因子超过90,引用300余次。以第一作者或通讯作者在Horticulture Research,Journal of Integrative Agriculture,Horticultural Plant Journal,BMC Plant Biology等国际著名期刊发表SCI论文18篇,其中中科院一区期刊6篇。获得发明专利2项、专著1部。主持国家自然科学基金和贵州省科技项目、中央引导地方项目等多个项目。

周平(第一作者)

● 贵州大学硕士。

● 研究方向为:生物信息学、杜鹃抗逆胁迫研究、植物生物化学与分子生物学等。以第一作者发表中文核心论文一篇。

张晨浩(第一作者)

● 华北理工大学生物学硕士。

● 目前研究方向为基因组学、泛基因组学等,相关学术成果已发表于Nucleic Acids Research、Horticulture Research等期刊。

宋小明(通讯作者)

● 华北理工大学教授、博导、副院长。

● 主要研究方向为园艺作物组学、生物信息学及分子生物学。发表SCI论文100余篇,累积影响因子400+,引用3400余次,h-index=34。以第一作者或通讯作者在iMeta、Cell Reports、Nucleic Acids Research、Plant Biotechnology Journal、Plant Physiology、Plant Journal和Horticulture Research等国际著名期刊发表SCI论文60余篇,其中中科院一区top论文28余篇(IF >10文章8篇)。获得软件著作权4项、专著3部。主持国家自然科学基金面上和青年项目、国家重点研发计划-青年科学家项目、中国博后科学基金特别资助、教育厅青年拔尖人才等十余个项目。担任园艺领域顶级期刊Horticulture Research副主编,Vegetable Research期刊执行主编,Forestry Research副主编。担任中科院SCI大类一区top期刊Horticultural Plant Journal编委,Agriculture Communications编委,Journal of Integrative Agriculture和iMeta等期刊青年编委。荣获中国科技期刊卓越行动计划选育高水平办刊人才奖、河北省自然科学奖二等奖、三等奖各1项。荣获河北省杰青、河北省“燕赵英才”和唐山市“凤凰青年英才”等多个荣誉称号。担任中国园艺学会分子育种分会理事、中国园艺学会青年分会理事、中国生物工程学会计算生物学与生物信息学专业委员会委员。教育部人才项目、中国科协财政项目、国家自然科学基金等多个项目评审专家。

更多推荐

(▼ 点击跳转)

高引文章 ▸▸▸▸

iMeta | 引用16000+,海普洛斯陈实富发布新版fastp,更快更好地处理FASTQ数据

高引文章 ▸▸▸▸

iMeta | 兰大张东组:使用PhyloSuite进行分子系统发育及系统发育树的统计分析

高引文章▸▸▸▸

iMeta | 唐海宝/张兴坦-用于比较基因组学分析的多功能分析套件JCVI

iMeta封面

1卷1期

1卷2期

1卷3期

1卷4期

2卷1期

2卷2期

2卷3期

2卷4期

3卷1期

3卷2期

3卷3期

3卷4期

3卷5期

3卷6期

4卷1期

iMetaOmics封面

1卷1期

1卷2期

2卷1期

期刊简介

iMeta” 是由威立、宏科学和本领域数千名华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表所有领域高影响力的研究、方法和综述,重点关注微生物组、生物信息、大数据和多组学等前沿交叉学科。目标是发表前10%(IF > 20)的高影响力论文。期刊特色包括中英双语图文、双语视频、可重复分析、图片打磨、60万用户的社交媒体宣传等。2022年2月正式创刊!相继被Google Scholar、PubMed、SCIE、ESI、DOAJ、Scopus等数据库收录!2024年6月获得首个影响因子23.8,位列全球SCI期刊前千分之五(107/21848),微生物学科2/161,仅低于Nature Reviews,学科研究类期刊全球第一,中国大陆11/514!

iMetaOmics” 是“iMeta” 子刊,主编由中国科学院北京生命科学研究院赵方庆研究员和香港中文大学于君教授担任,是定位IF>10的高水平综合期刊,欢迎投稿!

iMeta主页:

姊妹刊iMetaOmics主页:

出版社iMeta主页:

出版社iMetaOmics主页:

iMeta投稿:

iMetaOmics投稿:

邮箱:

office@imeta.science

来源:微生物组

相关推荐