摘要:禽流感病毒(H5N1)甲型病毒(IAV)的频繁感染病例,构成了人禽重配IAV大流行的风险。2025年9月17日,军事医学科学院李靖、北京化工大学童贻刚、军事医学科学院姜涛和中国医学科学院吴爱平共同通讯在National Science Review在线发表题为
禽流感病毒(H5N1)甲型病毒(IAV)的频繁感染病例,构成了人禽重配IAV大流行的风险。2025年9月17日,军事医学科学院李靖、北京化工大学童贻刚、军事医学科学院姜涛和中国医学科学院吴爱平共同通讯在National Science Review在线发表题为“
Deep learning predicts potential reassortments of avian H5N1 with human influenza viruses”的研究论文。该研究旨在构建一个名为HAIRANGE的注意力深度学习模型,用于预测H5N1和人IAV可能适应人类的重配。HAIRANGE中一个与生物相关的非预训练嵌入模型Codon2Vec,在基准测试中与其他嵌入器(例如ESM2、DNABERT2等)相比表现出色,表明IAV RNA聚合酶相关基因的基因组背景与病毒宿主或血清型高度相关。HAIRANGE准确预测了每个聚合酶相关基因的适应性以及自适应聚合酶相关基因重配,并通过体外报告分析验证了聚合酶活性。令人担忧的是,HAIRANGE 预测了禽流感 H5N1 和人流感 H3N2 禽流感病毒 (IAV) 之间的适应性重配,并通过聚合酶活性测定进行了验证。总而言之,HAIRANGE 可以根据嵌入的基因组背景预测适应性禽流感病毒 (IAV) 重配。目前,禽流感 H5N1 禽流感病毒 (IAV) 可能通过与人流感病毒 (IAV) 发生重配而构成大流行的潜在风险。
禽流感病毒A(IAV)自然栖息于野生水禽和滨鸟体内,偶尔会溢出感染哺乳动物,并偶尔会周期性地引发人类流感大流行。由于基因重配和高突变率,IAV的八段RNA基因组高度多样化。家禽和野生鸟类的全球分布和密度扩大了禽流感病毒溢出到哺乳动物的生态界面。这些鸟类宿主中积累的广泛遗传多样性增加了某些毒株拥有与IAV进入哺乳动物或复制相容的分子性状的可能性。溢出事件发生后,额外的宿主特异性突变或重配可能会适应哺乳动物宿主,进一步增强病毒的感染和传播能力。病毒的适应性表现为在单基因或多基因水平上,通过受体结合、生长效率和拮抗宿主免疫反应等机制,在感染和传播方面具有进化优势。1918年、1957年、1968年、1977年和2009年的最近五次流感大流行被认定是由重组禽流感病毒(IAV)引起的。因此,识别禽流感病毒的适应性和适应性重组至关重要。
禽流感病毒(IAV)的宿主适应性转变主要受血凝素(HA)介导的受体与人或禽类受体(α2,6-或α2,3-连接唾液酸)的结合、神经氨酸酶(NA)介导的病毒释放以及病毒RNA聚合酶复合物介导的病毒复制效率控制。IAV毒株的受体结合特异性明确且易于区分。除H3、H2和H1外,H5和其他血清型主要与禽类受体结合。然而,多种聚合酶相关基因(PB2、PB1、PA和NP)介导的适应性则更为复杂且难以识别。迄今为止,已充分证实H5N1的受体结合为禽类类型,然而,每个聚合酶相关基因的适应性以及这些基因与其他禽流感病毒(IAV)介导的潜在人类适应性重配仍不清楚。IAV在共感染期间通过交换其片段频繁发生基因重配。目前的证据表明,IAV片段重配受内在基因组包装约束控制,而非随机发生。每个RNA片段都包含顺式作用信号,指导高度有序的“7+1”组装,从而保持基因组的完整性和颗粒的感染性。这些信号对传入片段的骨架基因组提出了兼容性要求。然而,相互作用网络并不严格,允许有限的“容错”片段组合,为偶尔的重配事件和随后的适应性探索提供了基础。此外,宿主适应性对于评估可能的禽流感病毒重配株的流行潜力更为重要。只有对人类适应性更高的重配株才有可能在病毒种群中占据主导地位并发展成新的毒株,从而构成大流行风险。此外,不同片段具有不同的重配率。NS片段在人和禽类病毒中均表现出较高的重配率,而其他五个内部基因片段的重配率同样较低,但不同血清型之间的重配率存在显著差异。此外,新形成的重组子代病毒颗粒也受到宿主因素(例如ANP32A、MxA和BTN3A3)通过各种分子机制的制约。这些发现强调了片段兼容性和宿主生物学特性在驱动禽流感病毒重配方面的相互作用。
自20世纪90年代末以来,H5N1禽流感病毒(IAV)已被记录导致人类感染,并在2003年至2014年间持续出现,主要发生在东亚地区。致病性更强的H5N1禽流感病毒(2.3.4.4b H5亚型)在世界各地的野生鸟类中出现,并迅速适应了哺乳动物。更令人担忧的是,自2022年以来,欧洲、北美以及中美洲和南美洲国家已广泛报道了哺乳动物感染H5N1病毒,这意味着该病毒具有很高的哺乳动物适应风险和哺乳动物间传播风险,就像美国的牛群一样。因此,我们有理由担心H5N1禽流感病毒可能引发大流行,而大流行最有可能是通过与人类禽流感病毒的重组而引发的。
人工智能 (AI) 方法在病毒基因型-表型学习方面取得了显著成果,例如预测禽流感病毒 (IAV) 的宿主适应性、预测病毒宿主和节肢动物媒介以及预测 SARS-CoV-2 或其他冠状病毒的适应性转变。特别是,自然语言处理 (NLP) 的蛋白质序列嵌入可以更深入地学习蛋白质基因型与其表型之间的关联,例如蛋白质结构和病毒进化。考虑到 H5N1 和人类禽流感病毒 (IAV) 之间实验性重配测试的生物安全性和伦理问题,迫切需要建立一个 AI 预测器来评估 H5N1 和人类禽流感病毒 (IAV) 之间重配的人类适应潜力。并且,这种 AI 嵌入或预测器不应带来次要的生物安全性和伦理问题,例如基于大型基因序列数据集预训练嵌入工具,以及训练高危病毒基因组生成器。一些生物信息学方法已经出现,它们利用进化史和序列衍生的兼容性信号来分析禽流感病毒(IAV)的重配,例如基于系统发育的 GiRaF 和 FluReF 流程或无需比对的技术 。为了进一步实现面向表型的预测,HopPER 的随机森林分类器允许对宿主趋向性进行概率推断,进而推断宿主特异性片段的兼容性 ,尽管其预测的重配尚未经过实验验证。因此,更高效、更安全的禽流感病毒基因自然语言处理 (NLP) 嵌入器和更智能的网络似乎有望评估当前 H5N1 禽流感病毒中具有高适应潜力的重配株,特别是结合生物学方法的验证。
本研究提出了一个智能框架——HAIRANGE(基于基因组嵌入的注意力网络进行人类自适应流感病毒重配),用于预测当前流行的H5N1禽流感病毒(包括PB2、PB1、PA和NP四个RNA聚合酶相关基因)与人类H3N2禽流感病毒(包括H3N2禽流感病毒)的重配株在人类中的高度适应潜力。HAIRANGE集成了一个新型基因组上下文嵌入器Codon2Vec和一个深度学习预测器,以评估禽流感病毒重配株在人类中的高度适应潜力。未经预训练的Codon2Vec将病毒基因序列嵌入为一个上下文矩阵,该矩阵表示每个密码子及其编码的残基,并依赖于其上游和下游的密码子和残基,从而在细粒度级别上编码RNA和蛋白质信息。 HAIRANGE 中的 ResNet 分类器用于预测聚合酶基因的适应性和适应性重配,并提供可解释的消融和聚合酶活性的生物学验证。智能预测和生物学验证框架可以及时且可解释地评估流行的 H5N1 禽流感病毒造成的高大流行风险。
图1 HAIRANGE 工作流程用于基因组嵌入、自适应 IAV 重配预测和聚合酶活性验证。(图源自National Science Review )
来源:小琪在学习