摘要:华盛顿大学 David Baker 团队证明,结合使用微调 RFdiffusion 网络的计算蛋白质设计与酵母展示筛选,可以生成抗体可变重链(VHH)和单链可变片段(scFv),以原子级精度结合用户指定的表位。
编辑 | 萝卜皮
抗体在现代医学中发挥着核心作用,但目前还没有完全在计算机中设计与特定表位结合的新型抗体的方法。相反,抗体发现目前依赖于动物免疫或随机文库筛选方法。
华盛顿大学 David Baker 团队证明,结合使用微调 RFdiffusion 网络的计算蛋白质设计与酵母展示筛选,可以生成抗体可变重链(VHH)和单链可变片段(scFv),以原子级精度结合用户指定的表位。
为了验证这一点,研究人员使用多种正交生物物理方法(包括低温电子显微镜)对四种疾病相关表位的 VHH 结合物进行了实验表征,证实了针对流感血凝素和艰难梭菌毒素 B (TcdB) 设计的 VHH 具有正确的免疫球蛋白折叠和结合姿势。对于针对流感的 VHH,高分辨率结构数据进一步证实了 CDR 环构象的准确性。
虽然初始计算设计表现出适度的亲和力,但使用 OrthoRep 进行亲和力成熟可以产生保持预期表位选择性的个位数纳摩尔结合物。
团队进一步展示了单链可变片段(scFvs)的从头设计,通过结合设计的重链和轻链 CDR 创建 TcdB 和 Phox2b 肽-MHC 复合物的结合物。低温电子显微镜结构数据证实了两种不同的 TcdB scFv 的正确免疫球蛋白折叠和结合姿势,其中一种设计的高分辨率数据还验证了所有六个 CDR 环的原子级精确构象。
这种方法建立了一个框架,用于合理计算设计、筛选、分离和表征完全新生抗体,在结构和表位靶向方面都具有原子级精度。
该研究以「Atomically accurate de novo design of antibodies with RFdiffusion」为题,于 2025 年 2 月 28 日发布在 bioRxiv 预印平台。
背景
抗体是蛋白质治疗药物中占主导地位的一类,目前全球已获许可的抗体治疗药物超过 160 种,预计未来五年市场价值将达到 4450 亿美元。虽然制药界对抗体治疗药物兴趣浓厚,但抗体治疗药物的开发仍然依赖于动物免疫或抗体库筛选,以确定与目标靶标结合的候选分子。这些方法费力、费时,而且可能无法产生与治疗相关表位相互作用的抗体。
抗体的计算机设计工作已将残基移植到现有抗体结构中,采样替代天然 CDR 环以提高亲和力,并使用 Rosetta 序列设计来改善相互作用区域。基于结构和基于序列的深度学习网络已被训练来设计新的抗体序列,但从头(与针对该表位的现有抗体无同源性)设计结构准确的抗体仍然难以实现。
最近在使用 RFdiffusion 设计结合蛋白(不是抗体)方面取得了进展,与之前的方法不同,它不需要预先指定蛋白质结合物骨架,从而允许设计具有与用户指定的表位固有形状互补性的非常多样化的结合物。
然而,与其他从头界面设计方法一样,这些结合剂几乎完全依赖于与目标表位的规则二级结构(螺旋或链)的相互作用,因此原始(「vanilla」)RFdiffusion 网络无法从头设计抗体。
设计从头抗体的理想方法将能够 1) 针对任何感兴趣的靶标上的任何特定表位;2) 重点采样 CDR 环,使框架序列和结构接近用户指定的高度优化的治疗性抗体框架;3) 采样设计抗体相对于表位的替代刚体位置。
针对抗体开发的RFdiffusion变体
Baker 团队假设应该可以开发一种专门的 RFdiffusion 变体,能够设计从头 CDR 介导的界面,因为 RFdiffusion 可以设计的从头界面具有多样性和质量,并且界面形成的底层热力学是相同的。
RoseTTAFold2 (RF2) 和 RFdiffusion 在整个蛋白质数据库 (PDB16) 上进行训练,这有助于克服 PDB 包含相对较少抗体结构(约 8,100 个抗体结构,而总结构超过 200,000 个)的问题,这增加了大型机器学习模型的训练难度。
该团队着手开发 RFdiffusion 和 RF2 版本,专门用于抗体结构设计和结构预测,方法是对天然抗体结构进行微调。
图示:RFdiffusion 抗体设计概述。(来源:论文)
在这里,研究人员将原始 RFdiffusion 网络称为「vanilla RFdiffusion」,将他们描述的抗体特定变体简称为「RFdiffusion」。
成功设计抗体
实验表明,从头设计针对目标上特定表位的抗体结构域是可能的。设计的 VHH 针对流感 HA 和 TcdB 的低温电子显微镜结构数据与计算设计模型非常接近,表明该方法可以设计具有原子精度的 VHH 复合物(包括高度可变的 H3 环和整体结合方向),这些复合物与 PDB 中任何已知结构都非常不同。
图示:设计的 VHH 的生化表征。(来源:论文)
设计的与 TcdB 结合的 scFv 的低温电子显微镜结构数据证明了 RFdiffusion 能够准确设计双链 scFv。这是首次通过实验验证的具有结构精确结合的从头设计抗体案例。
另外,这种方法的成功不能归因于记忆,因为 PDB 中不存在针对 TcdB 表位的抗体,这增强了该模型设计真正从头结合物的能力。
图示:两种全新设计的 VHH 与流感血凝素和 TcdB 结合的低温电子显微镜结构表征。(来源:论文)
该团队的计算方法与从大型随机库中检索抗体的实验筛选方法在多个方面具有协同作用。
首先,广泛用于抗体库筛选的酵母展示选择方法能够在大量设计中检索出亲和力最高的结合物,由于设计成功率很低,这一点目前是必要的。
其次,筛选结合模式相似的设计中混合重链和轻链的组合库可以识别针对特定表位的 scFv,正如案例里用到的 TcdB 和 Phox2b 肽 MHC。在案例中,这种方法特别有利,因为很大一部分重组体可能由于其结构兼容性而具有功能性。
第三,使用 OrthoRep 进行亲和力成熟可将初始 VHH 设计的测量亲和力提高到个位数纳摩尔或亚纳摩尔范围,同时保留原始设计的结合模式。从实际角度来看,这项工作的关键进展不仅在于能够针对目标生成纳米抗体和 scFv(这通常可以通过纯实验方法实现),而且在于能够准确靶向特定结合表位。
图示:两种 TcdB 结合 scFv 的低温电子显微镜结构表征。(来源:论文)
事实上,低温电子显微镜研究明确证实,研究人员通过计算设计的抗体能够以惊人的精度与目标表位结合。这种高设计精度对于治疗应用至关重要,例如阻断受体-配体相互作用的拮抗剂、避免与内源性分子竞争的抗体、诱导构象变化以触发信号传导的调节剂,或靶向保守或进化受限的病毒表位的抗体。
局限性
虽然这里的结果表明抗体从头设计是成功的,但仍有很大的改进空间。
对于主链设计步骤,结合最近的架构改进和生成建模的新进展可能会产生具有更高可设计性和多样性的设计模型。RoseTTAFold2 和 RFdiffusion 最近也已扩展到模拟所有生物分子(而不仅仅是蛋白质),将此功能整合到抗体设计 RFdiffusion 中应该可以精确设计针对含有非蛋白质原子(如聚糖)的表位的抗体。
事实上,VHH_flu_01 观察到的亚化学计量结合可以用附近聚糖 N296 的存在来解释,而这在最初设计此 VHH 时并未考虑到。ProteinMPNN 在本研究中没有被修改,但设计与人类 CDR 序列更接近的序列预计会降低设计抗体的潜在免疫原性和可开发性。
另外,抗体预测方法的进一步改进应该能够更好地对上游设计方法进行计算机基准测试,并提高实验成功率。
将 scFv 转换为完整抗体应该很简单,因为可变的 CDR 序列保持不变。或者,这里使用的方法可以直接应用于 Fab 设计,只需省略重链和轻链之间的接头即可。随着这些进步,计算抗体设计有望成为常规方法。
结语
研究人员表示,使用 RFdiffusion 和相关方法进行抗体的计算从头设计可能会彻底改变抗体的发现和开发。RFdiffusion 方法可以精确靶向给定抗原上的特定表位。
随着方法的改进和成功率的提高,它有可能比免疫动物或筛选随机文库更快、更经济,因为后者需要对表位作图和结构表征进行广泛的跟踪。
基于结构的抗体设计方法能够以结构知情的方式优化关键的药物特性,例如聚集性、溶解性和表达水平。这允许进行有针对性的修改,同时避免可能破坏抗体-靶标界面或损害抗体稳定性的突变。
此外,从一开始就探索 CDR 环序列和结构的全部空间的能力,特别是对于 CDR1 和 CDR2,它们在体细胞超突变之前天生就局限于种系 V 基因编码的序列空间,应该可以简化可开发性特征的优化和非免疫显性表位的靶向性。
科学家预计抗体的合理设计将大大增加抗体疗法可处理的临床靶点和条件的数量。
论文链接:
来源:老吴说科学