摘要:一年一度的CSCO大会今年在山东济南召开。在笔者看来,CSCO年会就像一面镜子,折射出中国制药企业研发历年的迭代,来自中国研究者的好数据,中国研究者的“好声音”也越来越多。
一年一度的CSCO大会今年在山东济南召开。在笔者看来,CSCO年会就像一面镜子,折射出中国制药企业研发历年的迭代,来自中国研究者的好数据,中国研究者的“好声音”也越来越多。
2025年上半年,国家药监局批准了22款抗肿瘤药物上市,涵盖HER2、CDK4/6、EGFR等关键靶点,为乳腺癌、非小细胞肺癌、黑色素瘤等多癌种患者带来了新的治疗选择。今年CSCO也设置ADC、CAR-T/CAR-NK等创新型疗法议题,最新临床数据解读引人注目。
在欣喜于创新成果不断涌现的同时,学界和产业界也清醒地认识到,必须持续突破大热的疗法局限、推进更深层次的创新。拿肿瘤学一大热门——ADC药物来说,与会专家也对ADC药物面临的挑战进行探讨。例如,副作用方面,如何对下一代ADC进行优化,尽量减少副作用;如何优化ADC的分子结构和有效载荷的选择,以提高肿瘤特异性和有效载荷的传递效率;如何解决ADC的耐药性问题等。会上,有观点指出,需要开发新的ADC策略,例如使用双特异性抗体技术、双有效载荷ADC、非内化抗体等,以提高ADC的疗效并降低耐药性的发生率。
中国的研发模式在不断升级,本届CSCO年会上,最令笔者印象深刻的是,有的本土企业有40余项研究成果入选,其中6项研究获选为口头报告(论文发言)。另外一家创新企业两款自主研发的新药ZG006和ZG005年会上公布了最新临床数据,数据亮眼。
虽然“中国制造”在CSCO的各个论坛中频频亮相,但中国创新药的发展仍伴随一些值得冷静思考的议题。例如,源头创新仍有待加强,基础研究与转化医学之间的衔接尚不够紧密,一定程度上限制了从临床发现到科研验证的闭环构建。另一方面,研发同质化现象依然存在。未来,更应聚焦于未满足的临床需求,推进差异化创新,并推动政策、资本与人才更多投向真正具有原创性的项目中。唯有如此,才能持续涌现更多来自中国的“好数据”与“好声音”。
【本文作者李景成】
图源:CSCO大会
在本届CSCO学术年会的生物统计学专场,业内专家围绕罗氏的STARGLO研究这一核心案例,从多角度对多区域临床试验(MRCT)设计、区域异质性分析与监管适用性等议题提出深入见解。
前情提要
STARGLO研究是一项全球多中心Ⅲ期上市后验证性试验,这个全球多中心Ⅲ期研究将Columvi(格菲妥单抗)在美国用于三线或以上弥漫大B细胞淋巴瘤(DLBCL)治疗的加速审批转化为全面审批。
尽管该研究在总人群取得了OS(总生存期)和PFS(无进展生存期)的阳性结果,却因显著的地区疗效差异——尤其是亚洲与非亚洲患者人群结果不一致,FDA的肿瘤药物咨询委员会(ODAC)最终以8:1投票认为不适合用于美国,并在7月8日发布完整回应函拒绝该申请。
申办方
关键指标达阳性终点
复星医药全球研发中心的郭明明基于申办方公布的结果,结合自身研发经验对该研究进行解读。其指出,STARGLO研究于2021年2月至2023年3月期间,在12个国家的62家中心开展,共招募了274名患者。按国别来看,美国是该研究覆盖研究机构数量最多的国家(10个研究机构),按地区来看,欧洲和亚太地区为主要贡献者。
亚组分析显示,亚太地区疗效优于其他地区(OS HR:亚太0.41,欧洲1.09,北美2.60)。进一步探索表明,北美对照组中位OS达27.8个月,显著优于历史数据(8~13.5个月),可能因该组后续接受包括CAR-T和双特异性抗体等高效治疗的比例较高。经后续治疗校正后,非亚洲地区OS HR为0.73,与总体人群趋势一致。
申办方认为,该研究结果支持格菲妥单抗在全球范围内的适用性。目前,该药已在全球超过30个国家获批,并被美国NCCN指南列为Ⅰ类推荐。总体而言,STARGLO研究OS阳性结果为格菲替单抗联合化疗的临床应用提供了高等级证据支持。
FDA
事后分析难证适用性
但从FDA角度,可能有更多维度的考量。会上,前FDA审评员王亚平解释,FDA的拒批立场反映了其对证据严谨性和适用性的审慎考量。在STARGLO研究中,尽管申办方通过统计校正(如校正后续治疗的影响)得出OS风险比(HR)为0.73,并认为美国人群仍可能获益,但FDA认为这类分析属于“事后分析”(post hoc analysis),其模型设定和参数选择存在一定人为干预空间,可能引入偏倚,因此不足以作为批准上市的确凿依据。
王亚平指出,在审评过程中,这类探索性分析通常仅作为支持性参考,而不能替代预先设定的主要终点及其统计推断。
此外,FDA近年来明显加强了对MRCT中人群代表性的要求,尤其重视美国患者数据的充分性与独立性。STARGLO研究美国患者比例不足10%,被认为无法充分代表美国人群的疾病特征、医疗实践及治疗反应,从而严重限制了整体研究结果在美国的适用性推断。这一案例也凸显出,在全球药物开发中,仅依靠总人群阳性结果而忽视关键区域人群的一致性与代表性,获批难度可能增大。
此前,也有一些药企有这样的经历,其背后逻辑与此类似,即所提供的临床数据未能充分证明其治疗方案适用于美国患者群体,或试验设计未能满足FDA对人群代表性与数据质量的高标准要求。
临床学
聚焦亚组与精准获益
浙江省肿瘤医院的朱骥则关注该研究在深化亚组分析、强化风险效益评估与精准患者定位等方面情况。其认为,在STARGLO研究的亚组分析中,亚洲与非亚洲人群的数据显示出明显的不一致性。这种差异体现了同质性或异质性的亚组效应。
同质性亚组中,干预获益的方向一致,程度可能存在差异,此类情况通常不影响临床决策。然而,若后续治疗机会公平而OS仍未见获益甚至更差,如北美地区OS HR达2.6,则需要重新评估治疗的价值。
以晚期肠癌中西妥昔单抗的批准为例:对于RAS野生型患者疗效明确,但对RAS突变型患者则无效。这一差异无论对监管审批还是临床用药均具有重要影响。申办方尝试对当前结果提出解释,例如美国患者可能因二线及后线拥有更多高效治疗方案(如CAR-T或双特异性抗体),从而弥补了一线治疗的OS损失。然而需注意,若治疗组和对照组后续治疗机会相对公平,而OS仍未见显著获益甚至更差,则需深入评估一线治疗的临床价值。
另一方面,若一线治疗方案能够显著降低毒性、减少成本,且与后线治疗相比具有更好的风险效益比(例如免疫治疗在胃癌中基于CPS评分的选择),则可能成为新的研究方向。
综上,药企在未来开发中需注重以下方面:一是加强亚组一致性分析,尤其是不同区域人群的疗效验证;二是综合考虑疗效、毒性、成本及后续治疗可及性,开展全面的风险效益评估;三是针对异质性明显的亚组,探索生物标志物或临床特征以精准定位获益人群。
统计学
三策略应对区域差异
空军军医大学数据统计分析中心/卫生统计学教研室的李晨则从统计学视角剖析这一研究。在她看来,尽管MRCT在提高研发效率和优化资源利用方面具有明显优势,但其设计和执行过程中也伴随诸多挑战,尤其是区域间疗效差异的识别与解释。
以本研究为例,非亚洲人群未能显示预期疗效,一定程度上可归因于对照组中位生存时间显著高于预期(达27.8个月)。除后续治疗可能存在高效治疗方案之外,还需考量是否存在其他混杂因素干扰了结局评估的准确性。例如,在不同区域间是否实施了更频繁的影像学评估,从而导致PFS的判定存在测量偏倚。此外,本研究有一条排除标准是排除移植候选患者,多区域对医疗可及性、患者治疗意愿等文化差异也可能是研究人群异质性的潜在原因,在一定程度上导致区域间的结果差异。
展望未来,企业在设计和开展MRCT时,应在试验方案中更系统地嵌入区域差异性考量,例如为关键区域设置最低样本量要求;将区域作为分层因素考虑到随机化设计中;甚至可借鉴“主方案设计”(Master Protocol)的思路,在统一框架下分别制定各区域的试验方案;预先规划各区域或亚组的分析计划,明确各区域间一致性检验的方法以及区域疗效差异的评估标准。
只有在试验设计初期充分考虑这些因素,才能更好地应对跨国试验中复杂的异质性问题,提高全球开发策略的科学性与监管的可接受度。
MRCT区域一致性受考,药企如何应对全球化研发新态势?与会的一些企业高管也基于公司实践提出自己的观察。
明晰误区解决错位
在康特瑞科总经理蒋志伟看来,在设计MRCT时,必须高度重视强监管国家和地区的特定要求。在他看来,部分企业对MRCT的理解存在一定误区,例如,希望仅凭一项MRCT就能实现全球同步注册,希望一个试验解决所有问题。但现实情况往往并非如此。
实际上,企业应当明确试验的主要目标市场,集中资源满足关键监管机构的要求,而不是试图用一个试验“顺带”覆盖所有地区。全球研发计划应更有针对性,依据不同监管地区的期望作出科学和战略层面的组合决策。
从个案来看,企业与FDA之间存在着诉求错位:企业试图回答的是“该药物是否对该疾病的患者有效”,而FDA更关注的是“该药物是否对美国患者有效”。
在以往美国注册的MRCT中,入组的研究中心多来自医疗实践与患者特征与美国较为相似的地区(如西欧),其结果可以较好的外推至美国人群。但当试验人群来源多样、种族差异显著、以及医疗实践各异的地区时,研究所回答的科学问题就已发生变化。企业必须在试验设计之初,对如何证明药物在目标地区人群的有效性构建完整的证据链。
企业在开展全球临床试验时,不能仅依靠“一刀切”的策略。在不同国家或地区申报时,可能需要制定不同的方法构建证据链以及相应的注册策略。从公司整体战略到具体试验设计,都应尽早与目标监管机构沟通,站在对方的角度思考问题:他们真正关心的证据是什么?所生成的数据是否足以支持当地审批?如果无法充分回应这些问题,或许更务实的策略是主动调整目标市场范围。
策略各有局限
在石药集团数据科学中心的夏凡看来,罗氏的这项研究中不仅仅是OS存在区域差异,事实上所有关键终点(包括不受后续治疗影响的无进展生存期PFS)在北美人群中都未能显示获益。这表明核心问题可能并非如申办方所强调的后续治疗差异,而是存在更深层次的原因。
通过完整审视FDA的反馈,其认为监管机构实际上关注两个关键点:一是北美与亚洲患者在基线特征、疾病生物学及医疗实践上可能存在根本不同,本质上是两个迥异的患者群体;二是FDA似乎暗示试验执行层面,部分地区的数据质量可能存在疑虑,例如患者筛选(如以“患者拒绝”为由排除移植候选者)、疗效评估流程是否严格遵循方案等方面可能存在问题。
这一案例为未来全球同步研发带来重要启示:第一,区域差异不仅是“亚组问题”,更是由治疗模式、人群特征及医疗资源等多重因素交织而成的复杂问题。并非所有项目都适合采用MRCT策略,申办方需提前评估对照组选择、人群同质性及医疗环境差异等关键因素。
第二,MRCT中除预设的显性差异外,常存在难以预料的隐性风险。夏凡分享了一个MRCT案例:尽管各国采用统一的入排标准,中期分析却显示乌克兰亚组数据显著异常。经深入调查发现,因不可抗力因素导致当地患者无法持续用药,但为避免退出试验而未报告停药,然而血药浓度监测显示实际未依从用药。这凸显了中心选择、国家层面执行质量及社会经济因素可能对试验结果产生重大影响。
因此,企业若想成功开展MRCT,必须建立强大的统计与数据监查团队,通过持续的过程监测、合并数据分析和异质性检验,及时发现异常信号并管控风险。全球开发需更审慎的方案设计、更严格的执行监督,以及更灵活的区域策略调整能力。
考虑外部治疗生态
复星医药全球研发中心的郭明明指出,关于过程监控,除了对试验运营操作的常规监督外,还需高度关注外部治疗环境的变化对试验执行和结果解读的影响。回顾相关案例,2019—2025年,美国在淋巴瘤领域陆续批准了多款新药(包括至少3款双特异性抗体),其治疗格局和标准疗法已发生显著变化。这种动态演变可能直接影响对照组的疗效预期及患者入组意愿。
欧洲之所以对同一研究结果接受度较高,一方面由于欧洲亚组的OS风险比(HR)为1.09,但是PFS和CR率有和总体人群一致的获益趋势;另一方面,PFS和CR率等终点受后续治疗影响较小,数据结构相对清晰,且欧洲本身可及的新疗法选项相对有限,使得试验结果更容易被认可。
然而,美国的情况则不同:治疗选择更为丰富,竞争性疗法可能分流部分符合条件的潜在受试者,导致入组困难或人群代表性偏移。因此,申办方在开展MRCT时,不仅需加强常规监查,还应建立对区域治疗格局变化的敏感监测机制。例如,当某些中心入组缓慢时,不应简单归因于运营问题,而需深入分析:是否因当地新药可及性高,患者更倾向于选择已获批的有效治疗方案?这种洞察有助于及时调整区域策略、优化试验设计,并在解读结果时更充分考虑外部治疗生态的影响。
【本文作者陈淑文】
来源:医药经济报