bioRxiv | 四倍体小麦Kronos染色体水平基因组组装和功能基因组学资源构建

B站影视 内地电影 2025-09-28 08:10 1

摘要:小麦作为世界三大主粮之一,其遗传改良对于保障全球粮食安全至关重要。然而,普通六倍体小麦(AABBDD)基因组的庞大与复杂性,为功能基因组学研究带来了巨大挑战。因此,基因组结构相对简单、遗传背景清晰的四倍体硬粒小麦(Triticum turgidum, AABB

小麦作为世界三大主粮之一,其遗传改良对于保障全球粮食安全至关重要。然而,普通六倍体小麦(AABBDD)基因组的庞大与复杂性,为功能基因组学研究带来了巨大挑战。因此,基因组结构相对简单、遗传背景清晰的四倍体硬粒小麦(Triticum turgidum, AABB)成为了一个理想的模式系统。其中,‘Kronos’栽培种因其优良的农艺性状和丰富的遗传资源,在过去十年中被全球科研社区广泛应用,积累了近3000份与诱变种子库相关的外显子和启动子捕获测序数据,以及大量的转录组和表型数据。尽管资源丰富,但长期以来‘Kronos’一直缺乏一个高质量的参考基因组,这极大地限制了这些宝贵数据的深度挖掘和利用,阻碍了其作为模式系统的潜力发挥。

加州大学伯克利分校的Ksenia V. Krasileva团队在bioRxiv预印本平台发表题为“The Annotated Blueprint: Integrated Functional Genomic Resources for a model Tetraploid Wheat Triticum turgidum cv. Kronos”的论文,为四倍体模式小麦‘Kronos’构建了一个染色体级别的参考基因组“蓝图”,并整合了全面的功能基因组注释。该研究不仅精细解析了超过1000个抗病基因(NLRs)的结构与分布,还通过重新分析海量公共数据,极大地提升了突变检测的灵敏度和准确性,并绘制了完整的小分子RNA图谱,从而将‘Kronos’提升为功能基因组学和转化研究的顶级参考平台。

高质量参考基因组的构建与精细注释

研究团队利用PacBio HiFi长读长测序和Hi-C染色体构象捕获技术,成功组装了‘Kronos’的染色体级别参考基因组。该基因组大小为10.45 Gb,包含14条染色体,其中7条实现了端粒到端粒的完整拼接,展现了极高的连续性和完整性。基于详实的转录组证据,团队对其进行了精细的基因注释,最终获得了71,357个高可信度的蛋白编码基因模型,其完整性(BUSCO评估)高达99.9%,达到了参考基因组级别(图1)。

抗病基因(NLR)的系统性发掘与解析

NLR基因是植物免疫系统的核心,但其数量庞大、结构多样且呈簇状分布的特点,给自动注释带来了巨大困难。为解决此问题,研究团队对‘Kronos’基因组中的2,328个NLR位点进行了逐一的人工审阅和校正,最终鉴定出1,089个高可信度的完整NLR基因,并将其与假基因明确区分。这一精细的注释工作首次揭示了‘Kronos’中 ранее 未被发现的NLR多样性,并清晰地解析了它们在染色体末端富集区域的复杂组织结构,解决了以往参考基因组在这些区域的组装和注释难题(图2)。系统发育分析进一步揭示了这些NLR基因的演化关系,并鉴定出多个已知抗病基因(如Sr13Pm41)在‘Kronos’中的直系同源基因,为抗病育种提供了直接的候选靶点(图3)。

图2 突变体资源的深度挖掘与重新定义

‘Kronos’拥有世界上最大的小麦TILLING(靶向诱导基因组局部损伤)突变体库。研究团队将已发表的近3000份外显子捕获(EC)和启动子捕获(PC)测序数据重新比对到新的高质量参考基因组上。结果显示,新基因组极大地提升了突变检测的灵敏度和准确性。与之前基于零散参考序列的分析相比,新分析发现的EMS诱导的突变数量增加了5%,而非EMS诱导的背景突变则减少了23%,表明信噪比显著提高。尤其是在启动子区域,检测到的突变数量增加了惊人的2.4倍(143%),这使得研究人员能够以前所未有的分辨率,系统地评估调控区域变异对基因功能的影响(图5)。这一全面的突变目录,揭示了‘Kronos’突变体库中蕴含的全部遗传变异,为基因功能研究提供了完整的资源。

转录组与小分子RNA图谱的完善

除了基因组和突变信息,研究团队还对‘Kronos’的转录组和小分子RNA(sRNA)数据进行了重新注释和分析。通过整合不同发育阶段的RNA-seq数据,他们发现了一个有趣的现象:大量NLR基因在未受病原菌侵染的分生组织(如茎尖)中也呈现出组成型表达。这一发现挑战了NLR基因在无胁迫条件下通常被抑制的传统观点,暗示它们可能在植物发育或基础免疫监视中扮演着尚不为人知的重要角色(图6)。

此外,通过对sRNA测序数据的重新分析,研究团队构建了‘Kronos’中microRNA(miRNA)和分阶段小干扰RNA(phasiRNA)的完整基因座图谱。他们共鉴定出157个miRNA基因座和超过10,000个phasiRNA基因座,并发现这些sRNA基因座的分布与基因组的结构变异密切相关,揭示了表观遗传调控与基因组演化之间的复杂互作(图7)。

本研究通过整合高质量的基因组组装、精细的人工基因注释、海量突变数据的深度挖掘以及转录组和小分子RNA图谱的系统性重构,为四倍体小麦‘Kronos’打造了一个内容极其丰富、注释高度可靠的“功能基因组学蓝图”。这一系列资源的发布,彻底解决了长期以来制约‘Kronos’研究社区发展的核心瓶颈,使其正式成为与拟南芥和水稻相媲美的、用于小麦研究的顶级模式系统。

这项工作不仅为小麦基础研究(如抗病机制、发育调控、基因组演化)提供了前所未有的分辨率和深度,也为应用导向的转化研究提供了强大的数据支持和遗传资源。研究人员现在可以利用这个平台,快速地从突变体库中筛选功能基因,精确地解析基因调控网络,并设计新的育种策略。可以预见,这个“注释蓝图”将极大地加速小麦功能基因的发现进程,推动小麦遗传改良进入一个全新的精准设计时代。

DOI链接:https://doi.org/10.1101/2025.09.12.675711

来源:睡不醒的科学家

相关推荐