分子胶的筛选案例详解_MedChemExpress(MCE 中国)

B站影视 内地电影 2025-06-04 11:04 2

摘要:分子胶(Molecular Glues)是一类能够诱导蛋白质-蛋白质相互作用的小分子,近年来可谓是医药圈的‘香饽饽’。据不完全统计,2020 年以来礼来、辉瑞等各大药企在分子胶领域已经完成 24 笔大的交易,整体交易规模加起来高达 270 亿美元。它们不仅扩展

分子胶的作用机制是什么?已知的分子胶是如何被发现以及改造优化的?为什么 CRBN 类分子胶的研究热度最高?AI 能否助力分子胶的发现?本期小 M 将就这些问题带大家一探究竟~

分子胶(Molecular Glues)是一类能够诱导蛋白质-蛋白质相互作用的小分子,近年来可谓是医药圈的‘香饽饽’。据不完全统计,2020 年以来礼来、辉瑞等各大药企在分子胶领域已经完成 24 笔大的交易,整体交易规模加起来高达 270 亿美元。它们不仅扩展了‘不可成药’靶点的治疗潜力,还为癌症、神经退行性疾病等难治性疾病提供了新的解决方案。

Section.01

分子胶的作用机制是什么?

如图 1,分子胶通常通过诱导蛋白质相互靠近发挥作用,即诱导或增强两种蛋白质之间的相互作用。这可能会产生多种生物学效应,包括:(A) 降解靶蛋白(通过诱导靶蛋白与 E3 连接酶相互靠近);(B) 稳定靶蛋白-效应蛋白复合物的结构;(C) 抑制酶的活性 (通过阻断靶蛋白酶与其下游活动所需的 Native binding partner 的结合);(D) 激活靶蛋白的活性 (通过促进靶蛋白与调节蛋白的相互作用,增强靶蛋白的活性)。

图 1. 分子胶诱导蛋白相互作用功能示意图[1]。

Section.02

已知的分子胶是如何被发现

以及改造优化的?

小 M 为大家整理了 3 类高效筛选分子胶的案例,其基本研究思路为:① 构建分子胶类似物化合物库; ② 通过高通量筛选获得苗头分子; ③ Western blot 验证被降解的目标蛋白; ④ AlphaScreening 或 NanoBit 实验检测蛋白-蛋白相互作用; ⑤ HiBiT 实验检测蛋白含量以获得 DC50 (半数降解浓度) 和 Dmax (最大降解率)。

案例一

利用高通量表型筛选出一类分子胶降解剂,该分子胶可以诱导胎儿血红蛋白(HbF)的表达,为治疗镰状细胞病等血红蛋白相关疾病提供了新的候选药物

研究人员开发了一种基于高通量流式细胞术的表型筛选方法,使用人源 CD34+ 细胞衍生的成红细胞作为实验模型来筛选胎儿 HbF诱导剂。研究人员筛选了一个包含 2,814 种基于 CRBN 的分子胶类似化合物库,发现了一组能够增加 HbF 阳性细胞比例的化合物 (如图 2),同时不影响成红细胞的增殖和分化。这种表型在之前已知的 HbF 诱导剂类别中很少见。

图 2. 表型筛选流程与结果分析[2]。

随后进一步基于全局蛋白质组学分析识别出在化合物 1 的处理下显著变化的蛋白质,图 3A 表明化合物 1 是通过 CRBN 依赖性降解转录因子 WIZ,进而驱动了体外 HbF 诱导。图 3B 表明化合物 1 能够显著降解 WIZ 并诱导 HbF,因此被选为优化的起点。

图 3. 验证化合物 1 的作用靶点[2]。

(a) log2 (倍数变化) 和 p 值的双重标准,确保筛选结果的可靠性和显著性),(b) 体外活性分析。

接下来,研究人员对化合物 1 进行了简单的改造得到化合物 2,该化合物同样能够以 CRBN 依赖的方式强效诱导胎儿 HbF并降解 WIZ,随后研究人员进一步评估化合物 1 和化合物 2 的理化性质和药代动力学性质,如图 4 所示,化合物 2 表现出更好的口服生物利用度 (BA%last = 12%),因此后续以化合物 2 作为进一步开发的先导分子。

表 1. 化合物 1 和化合物 2 的 ADME/PK 数据[2]。

案例二

戊二酰亚胺是 CRNB 分子胶降解剂的关键片段,研究人员开发一种利用多组分反应作为核心模块化步骤合成含戊二酰亚胺分子胶库的方法。通过对合成的化合物库进行筛选发现了靶向酪蛋白激酶 1α (CK1α) 和 Wee 样蛋白激酶 (WEE1) 的分子胶降解剂。并且通过分子对接和结构分析,为进一步优化分子胶提供结构基础。

研究人员首先设计了一种新的化学合成策略,即利用 GBB 反应 (Groebke−Blackburn−Bienayme,一种多组分缩合反应) 作为最后一步关键的合成步骤,快速高效地获得 200 多个结构多样的 CRBN 分子胶库。

图 4. 基于多组分反应 (GBB reaction) 一步合成含 HRZ 骨架的化合物库[3]。

随后,研究人员在 CRBN 野生型和 CRBN 敲除的 MOLT-4 细胞(人白血病细胞) 中进行 72 小时的细胞存活率实验,以筛选出以 CRBN 依赖性方式诱导强效抗增殖的化合物,结果找到 3 个苗头分子,其中化合物 2 的 EC50 低于 5 nM,化合物 1 和 3 的 EC50 分别为 12 nM 和 139 nM。

图 5. 3 个苗头分子结构[3]。

接下来,研究人员基于化合物 2 来识别靶点,通过全细胞蛋白质组学分析 (whole-cell proteome profiling) 检测化合物 2 处理 MOLT-4 细胞 5 小时后的蛋白变化,发现 CK1α (酪蛋白激酶 1α) 和 WEE1(细胞周期调控激酶) 是主要降解靶点,并通过 Western blot 确认化合物 1,2,3 是 CRBN 依赖的 CK1α 和 WEE1 降解剂。

图 6. 全细胞蛋白组学结果分析图 (CSNK1A1 即为 CK1α) 以及 Western blot 验证图[3]。

随后研究人员开始进行结构优化,以化合物 1 作为改构起点。为了方便构效关系分析,研究人员引入 HiBit 标签,以定量监测 Jurkat 细胞 (T 细胞白血病细胞) 中内源性 WEE1 和 CK1α 蛋白的水平,将经过改造的细胞系与不同浓度的化合物一起孵育 5 小时,然后通过终点荧光素酶测定法来检测靶点的降解情况获得 DC50 和 Dmax。改构主要基于传统的药化改构思路,围绕化合物 1 的骨架进行较小的改动,以获得活性和选择性更好的化合物,最终得到化合物 10 是活性最好的分子。

表 2. HRZ-1 骨架苯胺取代基的 SAR 分析[3]。

值得一提的是,研究人员还通过实验验证了 2 个重要的问题,第一个问题是已报道的认为 CRBN 分子胶都是通过一个由含有甘氨酸残基的 β 发夹环(G loop) 的降解标签基序来与新底物结合的,研究人员分别测试了化合物 10 对野生型 WEE1 (WEE1-WT)、甘氨酸 322 突变为丙氨酸的 WEE1 (WEE1-G322A) 以及甘氨酸 322 突变为天冬酰胺的 WEE1 (WEE1-G322N) 的降解变化,结果和已报道的结论一致,WEE1-G322N 突变完全阻止了 WEE1 的降解。

第二个问题是化合物 10 是如何介导 WEE1 与 CRBN-DDB1 结合,通过 cryo-EM 获得 WEE1-化合物 10-CRBN-DDB1 的复合物结合模式,结果显示 WEE1 的 G loop 对介导三元复合物的形成很重要。与此同时,尽管化合物 10 具有高亲和力,但它与复合物的结合并没有使整个复合物变得刚性。如图 7,化合物 10 主要存在两种可能的构象,且通过对化合物 13 进行分子对接显示:化合物 10 和 13 的 pose 基本和 fit1 一致。作者又将 WEE1-化合物 10-CRBN-DDB1 复合物与已报道的 DDB1-CRBN-SJ3149-CK1α 复合物结构进行叠合。在化合物 10 的两种可能结合模式中,咪唑并吡啶和金刚烷基取代基都与 SJ3149 的苯并恶唑部分部分重合,这为进一步优化分子胶提供结构基础

图 7. 冷冻电镜呈现的 DDB1-CRBN-化合物 10-WEE1 的复合物密度图以及放大后的 WEE1-CRBN 相互作用区域图[3]。

其中显示了化合物的 2 种可能结合模式 (左图)。CRBN-CK1α 相互作用口袋中,化合物 10 与来那度胺 (Lenalidomide) 和 SJ3148 的结合模式比较 (右图)。

案例三

构建靶向 VHL 的 CIP-DEL 筛选文库,该文库包含约 938,730 个化合物。开发一种基于亲和力的 CIP-DEL 筛选方法,利用“呈递蛋白比率”来理性筛选具有高协同性的小分子化合物,对分子胶的发现具有重要意义。

诺华的研究人员参考已报道的 BRD7/BRD9 降解剂 VZ185 的 VHL 配体的连接方式,通过酚氧基团构建基于三嗪的多样化 DEL 文库,DNA headpiece 和 DNA tag 连接在靶向 VHL 配体的远端酰胺上。

基于三轮建库,第一轮在三嗪和靶向 VHL 的配体之间引入 13 种连接子,第二轮和第三轮分别在三嗪骨架上引入 290 种和 249 种不同分子砌块,最终构建了一个包含 938,730 个分子的 DEL 筛选文库。

图 8. VHL CIP-DEL 文库核心骨架[4]。

在 CIP-DEL 筛选试验中,首先将 His-tag 的 BRD9 (靶蛋白) 固载在磁珠上,并使用 2 种不同的实验方法来鉴定潜在的分子胶。如图 10 所示,将文库和固载的 BRD9 蛋白孵育 (允许形成二元复合物),文库首先和 VCB (VHL–elongin C–elongin B) 预孵育,再和固载的 BRD9 蛋白孵育 (允许形成三元复合物)。为了控制非特异性结合,在不存在 BRD9 的情况下,将文库和磁珠孵育。洗涤 3 次后,加热使蛋白质变性以释放结合物,再将 DNA 条形码进行 PCR 扩增和测序以鉴定结合物的结构。

图 9. DEL 筛选流程[4]。

为了计算富集,研究人员将 DNA 条形码的计数数据建模为 Poisson 抽样,通过这种建模方式,研究人员能根据总样本计数对各个计数进行归一化处理,同时也会考虑到测序数据的不确定性。二元富集度通过 BTL 的计数值除以 BL 的计数值来计算,三元富集度通过 BTLP 的计数值除以 BL 的计数值来计算,而呈递蛋白比率则通过 BTLP 的计数值除以 BTL 的计数值来计算,本质上得到的是三元富集度与二元富集度的比值。呈递蛋白比率越高,表明 CIP-DEL 化合物与 BRD9 的结合越依赖于 VCB 的存在,这意味着该化合物具有更高的协同性。研究假设可以利用呈递蛋白比率来筛选在与 BRD9 和 VCB 形成三元复合物时具有不同协同程度的小分子。

如图 11,研究人员将结果分为三类:第一类是三元复合物富集度高但呈递蛋白比率低 (主要是带有 9 号连接子 (珊瑚色) 和 12 号连接子 (蓝色) 化合物),第二类是三元复合物富集度中等和呈递蛋白比率中等的化合物 (11 号连接子 (黄色) 化合物),第三类是三元复合物富集度低和呈递蛋白比率高的化合物 (主要是 13 号连接子 (绿色) 化合物)。

图 10. 三元复合物富集度与呈递蛋白比率的关系图[4]。

后续通过 AlphaScreen 进行协同性验证,发现化合物 13-3 和 13-7 无钩状效应。在细胞实验验证中,13-7 在 NanoBiT 实验中诱导三元复合物形成且无钩状效应,在 HiBit 实验中对 BRD9 的降解也无钩状效应,且具有较好的选择性。

图 11. AlphScreen, NanoBiT 和 HiBiT 实验结果图[4]。

Section.03

为什么 CRBN 类分子胶的

研究热度最高?

一家专注于分子胶降解剂开发的公司 Monte Rosa Therapeutics 对 CRBN 的底物进行了更广泛的探索。已知的 Neo-substrate 有 CK1α、GSPT1、IKZF1、IKZF2、WIZ 等,这些都是传统意义上的难成药靶蛋白。这些 Neo-substrate 通过一个 G-loop 与 CRBN/CELMoD 结合,G-loop 由 β-hairpin α-turn 构成,在特定位置有一个共同的甘氨酸,因此也被称为 β-hairpin G-loop。

研究人员首先以 CK1α 的 β-hairpin G-loop 作为查询模板(该模板由 I35 到 E42 八个氨基酸组成,包含 5 个上游残基 (G-5) 和 2 个下游残基 (G+2)),在蛋白质结构数据库 (PDB) 和 AlphaFold2 (AF2) 预测的人类蛋白质中进行搜索。选择与查询模板的均方根偏差 (RMSD) 小于 0.75Å 且与 CRBN 无空间位阻基序,并去除其中主要定位于细胞外的蛋白质,最终确定了 1,424 种含有 CRBN 兼容 β-hairpin G-loop 的蛋白质。除此之外,还发现一种新的 helical G-loop 基序,存在于 184 种蛋白质中,进一步扩展了 CRBN-neosubstrate 的范围。

图 12. β-hairpin G-loop 模版数据挖掘示意图[5]。

Section.04

AI 能否助力分子胶的发现?

一直以来,分子胶的计算评估是一大难点,这包括三元复合物结构难以准确预测,DC50 和亲和力难以有很强的相关性。

3 月 22 日,VantAI 给制药行业带来了振奋人心的消息,推出 NEO-1 模型,该模型被誉为药物研发领域一款具有开创性的人工智能模型。NEO-1 不仅能够预测生物分子结构,还能从头生成分子,尤其是具备从头生成分子胶方面的能力。大家感兴趣可以去官网进一步了解 vant.ai/neo-1。截止今日,该模型还无法试用且无公开的文献,小 M 很期待该模型能公开,到时跟大家再进一步分享。

图 13. 历代结构预测模型能力[6]。

产品推荐类药多样库 Plus由 80,000 种类药化合物组成。本多样性库具备新颖性、类药性,结构多样性等特点,库中化合物可重复供应,是新药研发的有力工具,可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。

5K Scaffold Library

由 5,000 种类药化合物组成,每种化合物代表一种结构骨架,最大程度保证了库的结构多样性。库中的化合物均经过 MedChem & PAINS filters 筛选,剔除了不合适的化学结构,避免“目标错误”。本库化合物数量少但结构足够多样,是药物筛选的有力工具。

Natural Product-like Compound Library由 5,000 个类天然产物化合物组成,库中每个分子含有天然产物关键骨架 (42 个) 或者和天然产物的谷本相似系数 >0.6,且 Natural-likeness scoring >-2。该化合物库同时具备类药性和新颖性,库中化合物可重复供应,是新药研发的有力工具,可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。RNA Binding Library由 5,000 多个具有潜在 RNA 相互作用活性的小分子化合物组成,我们收集了 PDB、R-BIND、ROBIN 和内部数据库中的已知 RNA 靶向小分子作为阳性数据集,并基于 ROBIN 数据集获得非靶向 RNA 的小分子作为阴性数据集。基于 GeminiMol 预训练模型,对这些分子进行编码,并通过 Mordred 计算了 1,700+ 分子描述符作为模型的输入。接着用 13 个深度学习模型对这些数据进行学习,所有模型都取得了良好的训练结果,AUROC 均超过 0.75。选择分类效果最好的 Finetune 模型(AUROC 值:0.82,预测准确率:0.76)对 HY-L901P 进行筛选。进一步基于 StaR Rules(cLogP≥1.5,Molar Refractivity≥4,Relative Polar Surface Area≤0.3)进行再过滤,该库同时具备结构多样性,是 RNA 靶向药物开发的有利工具。

[1] Holdgate, Geoffrey A. et al. SLAS Discovery, Volume 29, Issue 2, 100136

[2] John Ryan Kerrigan, Noel M.et al. Journal of Medicinal Chemistry 2024 67 (22), 20682-20694

[3] Hlib Razumkov.et al. Journal of the American Chemical Society 2024 146 (46), 31433-31443

[4] Liu S.et al. J Am Chem Soc. 2023 Oct 25;145(42):23281-23291

来源:小园说科技

相关推荐