罗氏 | 基于深度学习的Lab-in-the-loop治疗性抗体设计

B站影视 韩国电影 2025-03-19 04:06 1

摘要:治疗性抗体在药物开发中占据重要地位,但抗体发现和优化过程成本太过高昂、而且周期漫长。传统方法如动物免疫、杂交瘤技术虽能获得初步候选分子,但在亲和力、表达水平以及开发性等多目标优化上存在不足。为此,本文提出了一种全新的“Lab-in-the-loop”系统,通过

治疗性抗体在药物开发中占据重要地位,但抗体发现和优化过程成本太过高昂、而且周期漫长。传统方法如动物免疫、杂交瘤技术虽能获得初步候选分子,但在亲和力、表达水平以及开发性等多目标优化上存在不足。为此,本文提出了一种全新的“Lab-in-the-loop”系统,通过整合生成式深度学习模型、多任务性质预测、主动学习排序及高通量体外实验,实现了抗体从设计到验证的端到端优化,具有重大的理论意义和应用前景。

“Lab-in-the-loop”系统将计算与实验紧密耦合,构建了一个半自动化、迭代优化的抗体设计平台。系统从已有的种子(seed)分子出发,利用生成模型探索抗体序列空间,生成大量候选设计。随后,通过性质预测器对每个候选分子进行表达、结合亲和力及非特异性风险等多方面指标的评估,并采用主动学习框架选出最具潜力的设计进入实验验证。实验数据再反馈用于更新模型,形成一个不断自我完善的闭环系统。

图1:Lab-in-the-loop自主治疗性抗体优化

a、生成模型产生多样化的计算机模拟抗体序列设计库。设计方案由属性预测预言机进行排名,这些预言机采用锦标赛方式选择,其排行榜表现基于上一轮实验中保留的数据集进行评估。利用预测属性对设计方案排序,以最大化相对于主导抗体的预期改进。设计方案表达后,利用表面等离子体共振(SPR)技术测量其对抗原目标的结合亲和力。实验室数据用于重新训练生成模型和属性预测预言机,以实现主动学习。
b、主导抗体分子是通过体内动物免疫和免疫库挖掘中识别出的最佳起始点,尽管我们的方法可以从任何抗体发现方法初始化。
c、Lab-in-the-loop在连续的设计轮次中实现了生成更高结合亲和力变体的单调改进。

d、集成无指导和有指导的生成模型使得LitL框架能够动态探索并利用抗体序列空间的各个区域。

在候选分子生成阶段,系统采用了多种生成模型,包括无引导采样(如离散Walk-Jump Sampling与序列变分扩散模型)和引导式优化方法(如LaMBO-2、PropEn及DyAb)。这些模型均基于大规模抗体序列数据训练,通过引入生物物理先验保证设计过程中框架区稳定性,同时允许在互补决定区(CDRs)引入多样性。为防止单一方法生成的候选分子占比过大,系统对每个种子分子设定了设计上限,并通过模型集成策略实现优势互补,从而构建出一个既具多样性又符合实验要求的候选库。

生成候选分子后,系统利用多任务性质预测器对每个设计进行注释,主要评估指标包括抗原结合亲和力、表达量及非特异性风险。预测器采用二分类或回归模型,并结合分布外检测(OOD)和化学风险过滤措施,确保候选分子在理化性质上符合临床转化要求。随后,系统采用Noisy Expected Hypervolume Improvement(NEHVI)算法对候选设计进行排序,选取在各项指标上均处于(Pareto frontier)帕累托前沿的分子进入实验验证阶段。

图 2:通过 Lab-in-the-loop 的亲和力成熟实现治疗性抗体先导分子的优化

a、所有设计抗体结合亲和力变化(∆pKD)的直方图。虚线垂直线表示结合亲和力提高了3倍。
b、所有设计抗体表达产量(mg)变化的直方图。虚线垂直线表示表达产量提高了0.01 mg。
c、针对 IL6 的 357 pM 结合剂的代表性 SPR 曲线。
d、针对四种不同抗原目标的10个先导抗体中,最大结合亲和力提升情况。虚线水平线表示结合亲和力提高了3倍。
e、22个最高结合亲和力设计的预测 pKD 与实际测量 pKD 的对比。

f、各轮设计中,设计方案(蓝色)与先导分子(红色)的绝对测量 pKD 值(数值越高越好)。

为了加速实验验证,系统引入了一套高通量、短周期的抗体生产与检测流程。通过Gibson组装法构建线性DNA片段(GLF),在HEK293细胞中进行1 mL规模的瞬时表达,有效节省了传统克隆步骤和时间。纯化后采用表面等离子共振(SPR)技术测定候选抗体的结合动力学参数,精确量化其结合亲和力。实验数据不仅用于评估候选设计的性能,还作为反馈输入到模型中,不断优化后续的设计策略。

系统采用迭代优化策略,通过多轮实验与数据反馈逐步提升抗体性能。初始阶段由于缺乏局部数据支持,候选分子的性能参差不齐;但随着每一轮反馈的加入,系统逐步调整设计方向,显著提高了整体候选分子的质量。经过四轮迭代,约26%的候选分子实现了至少3倍亲和力改善,部分设计甚至达到10倍以上提升。该闭环迭代不仅缩短了从设计到验证的周期,还大幅降低了实验成本,提高了成功率。

为验证设计策略的合理性,研究团队对部分最佳候选抗体进行了晶体结构解析和计算机模拟。结果显示,优化后的抗体在保留种子分子核心互作区域(seed CDR loop conformations)的基础上,通过引入特定的突变(包括插入、缺失及侧链替换),形成了新的氢键和疏水相互作用,从而进一步稳定了抗原–抗体复合物。这些分子结构结果揭示了亲和力提升的分子机理,证明了系统在序列级设计中学习到的生物物理先验和结构信息具有较高的可解释性和实际意义

在抗体优化过程中,不仅需要关注亲和力的提升,还必须兼顾表达量、稳定性及非特异性风险。系统通过对每个候选分子进行全面的多目标评估,利用Therapeutic Antibody Profiler(TAP)等工具确保大部分设计均在合理的开发性范围内。同时,通过训练内部BV ELISA数据的替代模型,对候选抗体的非特异性风险进行预测和过滤,确保所有进入实验验证的分子均具有良好的理化性质和安全性。

“Lab-in-the-loop”系统展现了计算与实验协同优化在抗体设计中的巨大潜力。该平台不仅在亲和力提升上取得了显著成果,同时兼顾了表达及开发性要求,实现了多目标优化。未来,随着计算模型与实验自动化技术的进一步发展,该系统有望扩展至全流程药物开发,从早期候选分子筛选到后续临床前研究,实现更高效、低成本的药物研发。总体来看,该方法为治疗性抗体设计提供了一种全新的、数据驱动的优化策略,推动了药物发现向全面自动化和智能化方向的发展。

参考资料:Frey, N. C., Hotzel, I., Stanton, S. D., Kelly, R. L., Alberstein, R. G., Makowski, E. K., ... & Gligorijevic, V. (2025). Lab-in-the-loop therapeutic antibody design with deep learning. bioRxiv, 2025-02.

来源:老钱说科学

相关推荐