基于炼金自由能计算的配体结合亲和力评估方法

B站影视 港台电影 2025-04-18 20:19 1

摘要:在药物发现的早期阶段,准确预测配体与靶蛋白之间的结合亲和力具有重要意义。近年来,炼金自由能(Alchemical Free Energy)计算方法因其预测精度高而成为结构基础药物设计中的重要工具。该方法通常可以将结合自由能的预测误差控制在±1 kcal/mol

在药物发现的早期阶段,准确预测配体与靶蛋白之间的结合亲和力具有重要意义。近年来,炼金自由能(Alchemical Free Energy)计算方法因其预测精度高而成为结构基础药物设计中的重要工具。该方法通常可以将结合自由能的预测误差控制在±1 kcal/mol之内,对优化先导化合物具有实际指导价值。然而,由于其操作复杂、参数多变、缺乏标准化自动化工具等原因,限制了其在工业界的广泛应用。

Kuhn 等人(2020)提出了一种基于多种开源工具构建的自由能计算自动化工作流程,并通过多个公开数据集对其进行了系统验证。本综述将围绕其工作原理、方法实现、性能评估及实际应用等方面进行详细介绍与分析。

02 方法概述

2.1 炼金自由能计算原理

图1. 自由能计算的示意图。化合物的结合自由能是根据热力学循环计算的,该循环由四个不同的状态组成:分子A和B的蛋白质-配体复合物,以及A和B在水盒中的状态。A通过一系列化学中间态转变为B。由于分子动力学模拟是在等温-等压集合中进行的,因此使用吉布斯自由能ΔG代替赫尔姆霍兹自由能ΔF。

炼金自由能计算基于热力学循环(Thermodynamic Cycle)原理,利用模拟配体A转变为配体B的过程中系统自由能的变化,来间接计算二者相对结合自由能。此过程需在结合态(蛋白-配体复合物)游离态(溶液中配体)两个环境中分别模拟。

为克服状态间采样空间重叠不足的问题,引入了耦合参数 λ(λ ∈ [0,1]),在该参数控制下构建多个中间态(λ-windows),以平滑过渡终态能量面,实现自由能的数值积分。常用方法包括自由能微扰法(FEP)、热力学积分法(TI)及多态Bennett接受率方法(MBAR)。

2.2 系统设置与模拟流程

研究使用了基于Sire、SOMD、BioSimSpace和OpenMM构建的工作流程。蛋白使用AMBER14SB力场,配体使用GAFF2.1力场并采用AM1-BCC电荷模型。溶剂采用TIP3P水模型,并添加Na⁺/Cl⁻中和系统。

每次自由能计算包含两条路径(正向与反向),用于评估计算的可靠性(例如是否存在滞后现象)。λ-windows数量根据体系难度设定在5至24之间,每个窗口进行4 ns分子动力学模拟。计算结果经由MBAR方法整合,得到最终的相对结合自由能差(ΔΔG)。

3.1 数据集与评估指标

研究使用了Wang等人提出的标准数据集,包含8个蛋白靶点、220个配体、超过300个配体间扰动(perturbation)。核心评估指标包括:

图2. Flare中完成的FEP项目的截图。扰动网络和计算得到的相对自由能可以在中央面板中找到。箭头根据扰动在两个方向上的滞后效应进行颜色编码。其他四个面板包含:重叠矩阵(左上),比较计算自由能和实验自由能的图(左下),包含分子动力学模拟截图的3D窗口(右上),以及列出循环闭合误差的彩色编码表(右下)。

Flare工作流程在大多数子数据集上的预测性能与FEP+、AMBER、GROMACS等主流平台相当甚至略优。平均R = 0.70 ± 0.05,τ = 0.53 ± 0.05,MUEc = 0.83 kcal/mol。

3.2 可重复性与稳定性分析

通过对4组具有代表性的扰动进行五次独立重复模拟,结果显示小分子修饰(如卤素替换)具有良好的重现性(滞后 。而对环状基团的大改动(如−H至−环庚基)则出现显著滞后(达1.4 kcal/mol),但平均自由能值仍与实验数据接近。

3.3 与简化模型对比

分子量(MW)作为“空模型”基准对比,发现尽管MW与实验结合自由能在某些数据集(如PTP1B)呈现弱相关(R² = 0.55),但整体预测性能仍远不如炼金计算(R_avg = 0.70 vs. R_MW = 0.38),证明该方法的优越性。

研究进一步验证了该方法对结构差异较大的骨架跃迁类扰动的适用性,包括环的开闭、核心更换、极性改变等情境。在6个公开数据集中,对21个配体进行了自由能预测,平均MUEc为0.59 kcal/mol,略高于对照研究(0.28 kcal/mol),但仍显示出良好趋势捕捉能力

例如CHK1抑制剂系列中,对于不同骨架的比较预测效果优异,但对于活性较弱化合物19预测偏差较大,提示方法在极端低活性分子上仍有提升空间。

图3. 21种配体在骨架筛选数据集中的实验(深灰色)和计算(本研究中为彩色,Wang等人报告中的为浅灰色)相对结合亲和力。Wang等人的研究中未明确列出每种化合物的误差。

05 计算效率与可扩展性

采用GTX2070 GPU进行4 ns计算,配体-蛋白复合物与溶液态模拟分别耗时21min/ns和4min/ns。与FEP+和GROMACS等平台相比,具有较优的单卡效率,且支持自动化批量并行计算,适用于工业界高通量筛选。

此外,研究表明在某些扰动中1 ns模拟即可得到稳定预测,提示存在进一步压缩计算时间的空间

06 总结与展望

该研究表明,通过Sire-BioSimSpace-OpenMM等工具集成的炼金自由能计算流程,不仅在标准数据集上具备与商业软件相媲美的准确性,也能应对结构复杂的骨架跃迁类扰动。其高度自动化、图形化界面、结果可视化与健壮的可靠性检测机制,为炼金自由能计算在药物设计中的普及提供了有力工具。

未来工作将着重于非线性λ窗口优化、自适应采样策略,以及对更大规模数据集的验证。进一步的标准化与开源工具的发展,也将推动该方法走向工业级应用标准。

参考资料:Kuhn, M., Firth-Clark, S., Tosco, P., Mey, A. S., Mackey, M., & Michel, J. (2020). Assessment of binding affinity via alchemical free-energy calculations. Journal of Chemical Information and Modeling, 60(6), 3120-3130.

来源:小杜的科学讲堂

相关推荐