摘要:DNA测序技术的革新有力地推动了植物基因组学的快速发展,也为遗传变异鉴定、群体多样性研究以及分子育种等方面提供了有力的技术支持。建立在测序数据基础之上的基因组学研究方法,如序列比对、遗传变异的鉴定等,也在不断地发展与完善。然而,传统的基因组学分析方法主要基于单
DNA测序技术的革新有力地推动了植物基因组学的快速发展,也为遗传变异鉴定、群体多样性研究以及分子育种等方面提供了有力的技术支持。建立在测序数据基础之上的基因组学研究方法,如序列比对、遗传变异的鉴定等,也在不断地发展与完善。然而,传统的基因组学分析方法主要基于单一的线性参考基因组,这可能导致在高度分化基因组区域中引入偏差,降低下游分析的准确性。近年来,泛基因组,尤其是图形泛基因组的出现,为解决这些挑战提供了新的思路。
近日,华中农业大学焦文标教授课题组在aBIOTECH发表了题为“Plant graph-based pangenomics: techniques, applications, and challenges” 的综述论文,该论文系统总结了图形泛基因组的构建、序列比对、变异分型等方面的技术原理和发展趋势,深入探讨了图形泛基因组技术在植物基因组学研究中的前沿应用及其面临的技术挑战。
作者首先回顾了植物泛基因组的发展历程及其在农业研究中的应用。随着测序技术的进步和成本的降低,植物基因组学研究迎来了革命性的突破。泛基因组(Pan-genome)作为一种强大的工具,正在彻底改变我们对植物基因组多样性和复杂性的理解。通过整合多个个体基因组的序列信息,泛基因组不仅克服了单一参考基因组的局限性,还为作物育种和基因组学研究提供了全新的视角。本文从四个方面系统总结了图形泛基因组的原理和应用:
一、 图形泛基因组的构建
图形泛基因组的构建是泛基因组研究中的核心步骤,目前主要采用两种存储结构:de Bruijn图和序列图。de Bruijn图通过重叠的k-mer表示基因组序列,但其固定k-mer长度和复杂拓扑结构限制了其在变异图谱中的应用。序列图则更为广泛使用,节点代表DNA序列,边表示序列间的连续关系,能够直观地表示基因组变异和单倍型路径。图形泛基因组的构建方法主要包括基于参考变异的构建和基于多基因组比对的构建。前者利用线性参考基因组和变异文件(如VCF)构建有向无环图(DAG)或双向循环图(BCG),而后者通过多基因组比对直接生成泛基因组图,适用于大规模基因组数据的整合。近年来,Minigraph、Cactus和PGGB等工具的发展显著提升了图形泛基因组的构建效率和精度,为大规模泛基因组研究提供了有力支持。
图1 图形泛基因组模型和图形泛基因组的构建
二、 基于图形泛基因组的序列比对和变异分型
图形泛基因组目前主要用于下游的短片段测序数据比对和变异分型。当前主流的基于图形泛基因组的序列比对和变异分型工具可分为基于读段比对(如vg、Paragraph)和基于k-mer深度(如BayesTyper、PanGenie)两大类。近年来,vg giraffe和PanGenie等工具通过优化算法,显著提高了比对速度和分型精度,尤其在大规模基因组数据中表现出色。这些工具的结合使用(如EVG)进一步提升了分型性能,为植物基因组研究提供了强大支持。
三、 图形泛基因组在植物中的应用
图形泛基因组在植物基因组学中的应用显著提升了对遗传多样性的理解,尤其是在作物驯化和育种中。通过整合多个个体基因组,图形泛基因组能够提高短读长测序数据的比对率,进而提升结构变异检测效率。例如,大豆、水稻和番茄的图形泛基因组研究分别鉴定了大量结构变异,并结合表型数据进行全基因组关联分析,获得了多个与重要农艺性状相关的功能位点。此外,图形泛基因组还增强了基因组选择(GP)和标记辅助选择(MAS)的准确性,特别是在捕捉传统线性参考基因组无法检测的“缺失遗传力”方面表现出色。近年来,超泛基因组(super-pangenome)的构建进一步扩展了研究范围,整合了栽培种、野生近缘种和近缘物种的基因组,为作物改良提供了新的遗传资源。
四、 图形泛基因组在植物中的挑战
尽管图形泛基因组在植物基因组学中展现出巨大潜力,但其应用仍面临诸多挑战。首先,植物基因组中重复序列(如转座元件)的存在增加了比对和变异分型的难度,尤其是在着丝粒和抗病基因簇等复杂功能区域。其次,超大基因组(如小麦)和高杂合度、多倍体(如同源四倍体马铃薯)的复杂性进一步加剧了计算资源的消耗和变异分型的不确定性。针对这些问题,现有工具在处理多倍体基因组时表现不佳,尤其是同源染色体间的相似区域容易导致比对错误。未来需要开发更高效的算法,并结合长读长测序技术,以应对植物基因组的独特复杂性,提升图形泛基因组在作物改良中的应用效果。
最后,作者认为图形泛基因组技术虽然不会完全取代传统的线性基因组学技术,但会在多个方面成为首选的分析手段。未来,图形泛基因组将继续推动植物转录组学、表观组学和3D基因组学等领域的发展,为作物育种和功能基因组学等研究提供重要的技术支撑。
华中农业大学信息学院博士生杜泽臻、贺家宝为论文共同第一作者,焦文标教授为论文通讯作者。研究工作得到了国家自然科学基金、园艺作物种质创新与利用全国重点实验室自主培育重点项目的资助。
引用本文:
Du, ZZ., He, JB. & Jiao, WB. Plant graph-based pangenomics: techniques, applications, and challenges. aBIOTECH (2025). https://doi.org/10.1007/s42994-025-00206-7
植物科学最前沿,专注于植物科学前沿进展、资讯、招聘信息的发布及方法软件共享等zwkxqy;
来源:美少女科学家