摘要:礼来公司部署全球规模最大、性能最强的AI制药工厂,该设施采用基于英伟达Blackwell架构的DGX超级集群。超级计算机将为AI工厂提供动力,后者是专门用于大规模开发、训练和部署药物研发AI模型的计算基础设施。礼来公司表示,新的科学AI代理可以支持研究人员,先
10月29日消息,礼来公司部署全球规模最大、性能最强的AI制药工厂,该设施采用基于英伟达Blackwell架构的DGX超级集群。超级计算机将为AI工厂提供动力,后者是专门用于大规模开发、训练和部署药物研发AI模型的计算基础设施。礼来公司表示,新的科学AI代理可以支持研究人员,先进的医学影像能让科学家更清晰地观察疾病进展,并帮助开发用于精准治疗的生物指标。
制药行业利用AI加速药物上市的努力仍处于早期阶段。目前尚无使用AI设计的药物上市,但进展体现在进入临床试验的AI发现药物数量增加,以及药企近期聚焦AI的投资和合作伙伴关系上。这一合作不仅重构药物研发范式,更将推动医疗从 “经验驱动” 向 “数据驱动” 转型,为攻克复杂疾病和提升全球医疗可及性带来新机遇。
今天为大家分析一下什么是AI制药。
AI制药是将人工智能技术与生物医药研发深度融合,通过机器学习、自然语言处理、计算机视觉等技术,对药物研发全流程进行系统性优化的新兴领域。其核心逻辑是利用算法对海量生物医学数据进行挖掘、分析与建模,实现药物研发各环节的精准预测与高效决策,打破传统研发模式的效率瓶颈。
AI制药并非替代传统制药产业,而是通过技术赋能重构药物研发的底层逻辑,属于制药行业的 “产业升级引擎”。其定位体现在三个维度:一是作为研发模式的革新者,推动药物研发从 “经验驱动” 向 “数据驱动” 转型;二是作为产业协同的连接器,打通基础研究、临床开发与产业转化之间的壁垒;三是作为全球医药创新的核心赛道,成为衡量一个国家生物医药产业核心竞争力的关键指标。与传统制药模式相比,AI制药以 “精准、高效、低成本” 为核心特征,正在重塑全球医药产业的竞争格局。
发展AI制药的重要意义
AI制药的核心价值首先体现为对传统研发模式效率瓶颈的突破性破解,重构 “高投入、长周期、低产出” 的行业逻辑。与传统制药相比,AI制药能显著优化新药研发的效率及质量,将药物发现、临床前研究的时间缩短近40%,临床新药研发成功率可从12%提高到约14%。
在靶点发现、化合物筛选等核心环节,AI通过多组学数据整合与深度学习建模,替代传统依赖经验的试错式研发,大幅压缩早期研发周期。进入临床试验阶段,AI优化试验设计、实现精准患者招募,显著缩短招募周期并降低试错成本。这种全流程优化不仅减少无效实验与资源浪费,更推动研发模式从串行向并行协同转型,为行业节约巨额研发投入。
AI从根本上提升新药研发成功率,通过多维度数据挖掘与精准预测,降低靶点选择、化合物成药性评估等关键环节的决策风险,使临床阶段成功率显著高于传统水平。更重要的是,AI突破传统技术壁垒,解锁不可成药靶点的研发潜力,如转录因子、蛋白质 - 蛋白质相互作用等此前难以攻克的领域。同时,AI为中药现代化、个性化医疗等新方向提供支撑,通过解析复杂成分作用机制、适配个体特征设计方案,拓展药物研发的应用边界与创新空间。
传统新药研发周期长、资金投入高、研发失败率高。将AI技术应用于药物研发各环节,较传统新药研发可显著缩短研发周期、降低研发成本,同时提升研发成功率和投资回报率。
人工智能赋能新药开发,参与药物开发各个环节,包括靶点发现、化合物合成、化合物筛选到患者招募、临床试验设计等,通过 AI 技术的运用有效解决传统新药研发痛点,缩短研发周期,提高研发成功率,降低研发成本。根据 DPI 援引英矽智能数据,通过AI技术能将 ISM001分子发现时间由传统手段的2年降至11个月,总费用从4.14亿美元降低至20万美元,极大降低了新药研发负担。
各类大模型正广泛应用于药物发现的各个环节。药物发现领域的大模型包括三类,一种是使用专门针对蛋白质(如 ProGen 和 ESM3)、DNA(如 DNABERT 和 Evo)、单细胞数据(如 scGPT)和小分子(化学语言模型)等特定科学领域的tokens序列表示进行训练的特定基础模型。另一种是调整经过良好训练的通用大型语言模型以适应特定的科学领域,例如用于小分子的 Tx-LLM 和用于蛋白质的 ProLLAMA。第三种涉及从头开始训练科学数据增强的 LLM,主要使用文本数据和少量科学数据,例如 BioGPT 和 Galactica。利用大模型可以加速潜在药物候选物的识别,预测药物的安全性、有效性和药代动力学性质,优化先导化合物,并预测合成途径,通过自动化和加速药物发现的各个阶段,帮助研究人员更有效、更高效地识别有希望的药物候选物,从而显著缩短药物开发时间并降低成本。
应用在制药环节的AI技术主要包括机器学习中的深度学习、大数据及自然语言处理,通过训练数据库内目标信息,搭建精准模型,实现药物分子的筛选、预测及分析、用药安全的试验、评估等研发目标。
(一)基础支撑技术
1)机器学习与深度学习:作为AI制药的核心算法基础,机器学习通过构建数据驱动模型,实现靶点预测、活性筛选等任务的自动化分析;深度学习则依托神经网络结构,处理多组学数据、分子结构数据等复杂高维信息,提升预测精度与泛化能力。
2)自然语言处理(NLP):专注于解析生物医学文献、专利文本、临床记录等非结构化数据,挖掘潜在的疾病 - 靶点 - 药物关联关系,为研发决策提供文献支撑与知识发现。
(图片来源:行行查数据库)
(二)核心应用技术
1)生成式AI:聚焦药物分子的“从头设计”,通过生成对抗网络、变分自编码器等模型,在庞大的化学空间中自主生成符合成药性要求的分子结构,并可根据靶点结合特性、代谢稳定性等指标进行定向优化,大幅拓展药物分子的筛选范围。
2)蛋白质结构预测技术:借助深度学习算法破解蛋白质折叠难题,精准预测蛋白质三维结构及其与配体的相互作用模式,为靶点验证与药物分子设计提供核心结构基础。相关技术已实现从单靶点预测向多靶点相互作用分析的升级,部分平台已具备前瞻性实验验证能力。
3)多模态融合技术:整合基因组学、转录组学、蛋白质组学等多维度数据,构建“基因型-表型-药物活性”的关联模型,实现跨尺度数据的协同分析,提升研发决策的全面性与准确性。
AI制药的算力需求源于海量数据处理与复杂模型训练的双重诉求。药物研发涉及的分子结构数据、生物实验数据、临床数据等规模庞大且维度复杂,而深度学习模型的训练过程需要持续的高强度计算支持,算力性能直接决定模型训练效率与预测精度。
算力是AI制药的 “动力核心”,其核心作用体现在破解海量复杂数据处理与高精度模型训练的双重难题。AI制药依赖基因组学、蛋白质组学、分子结构等多维度数据,这些数据格式多样、维度极高,需通过算力支撑的深度学习模型挖掘潜在关联。在靶点发现环节,算力保障全基因组范围内的关联分析与靶点验证;化合物设计阶段,依托算力实现虚拟筛选与生成式AI的分子设计,快速锁定符合成药性的结构。同时,算力支撑模型的持续迭代优化,通过反复训练提升预测精度,缓解 AI “黑箱” 问题带来的可靠性顾虑,为研发决策提供可信依据。
(图片来源:行行查数据库)
AI工厂是算力价值释放的 “转化载体”,通过整合算力、数据、算法与研发流程,构建标准化的AI研发体系。其核心作用在于实现AI制药的规模化与流程化:一方面搭建统一数据管理平台,完成原始数据的清洗、标准化与安全存储,破解 “数据孤岛” 困境,为模型训练提供高质量数据输入;另一方面构建 “数据预处理 — 模型训练 — 推理部署 — 应用验证” 的自动化闭环,将靶点发现、化合物优化等研发环节转化为标准化流程,大幅缩短技术从实验室到产业应用的周期。
(一)上游
在产业链上游,制药数据为重要核心。辅以实验验证、申报辅助等其他功能。 围绕可用的制药数据,将产生专门的数据库/数据联盟、数据处理软件、相关辅助工具,特别是用于高通量产生数据的智能实验室等。数据问题目前是AI制药行业普遍面临的问题之一,头部公司已开始纷纷搭建自己的相关团队,但由于AI制药所需要的数据高度复杂,能否在产业链上发展出相应的第三方,也会在很大程度上影响行业后续的 整体发展与进入门槛。
(二)中游
产业链中游是 AI 制药主体,包括 AI 制药初创企业、传统药企/CRO公司以及互联网企业三大类,不同企业掌握不同资源禀赋在竞争中具有不同优劣势,对于 AI 初创公司来说,其优势在于拥有较强的技术和算法能力,但在药物开发数据积累和资金上存在不足,药企/CRO公司拥有丰富的药物开发经验和数据以及资金实力,但AI技术能力较弱,对于互联网企业来说,算力和技术资源丰富,但存在行业经验不足的问题,目前更多的情况是药企/CRO、AI Biotech和互联网公司开展更多的合作,取长补短共同推进AI药物的研发。
(三)下游
下游为药品的销售环节,包括传统药企销售和医药外包等渠道。传统药企销售凭借深厚的市场根基、广泛的销售网络以及成熟的营销团队,能迅速将AI研发的新药推向各级医疗机构与药店,覆盖庞大患者群体。而医药外包渠道,如合同销售组织(CSO),凭借专业化的销售能力与灵活的运营模式,为AI制药企业提供定制化销售服务,助力新药快速打开市场。此外,随着互联网医疗的兴起,线上销售渠道也逐渐成为重要补充,通过电商平台、在线问诊平台等,实现药品的便捷配送与精准营销。
根据MedMarketInsights预测,2023年全球AI制药行业市场规模为12.93亿美元,预计到2031年,市场规模增长到85.02亿美元,2022-2031年复合增长率约为27.2%。据智药局统计,目前AI相关药物获批临床的管线约90条,其中有约40条推进到II期临床,占总数的44%;推进到III期的管线接近10条。根据智药局,预计2017年之后,随着当前处于临床 II、III 期的AI药物进入上市阶段,AI制药市场或将迎来第一个小高峰;第二个高峰预计出现在2030-2031年,当前处于临床前、临床 I 期和 II 期药物的推进到药物上市阶段,将会带来新的增量。
随着人工智能技术的快速发展,国内的AI制药市场规模也正在同步扩大。AI技术在制药行业的应用,能够加速药物研发过程、提高生产效率、优化药物配方等,极大地推动了整个行业的发展。生物技术和人工智能技术的快速发展,以及 AIDD、AlphaFold2及 ChatGPT 等创新产品的出现,国内Al制药产业迎来高速发展的长期。2021年,在疫情驱动、资本加持下,国内Al制药企业投产获取第一轮成效,预计2030年市场规模将达到93.05亿元。
当前国内外AI制药市场的主要玩家主要有三类,即大型药企、AI制药初创企业和互联网头部企业,其中大型药企又分为传统药企和CRO企业。
1)传统药企和CRO企业:跨国药企如辉瑞、赛诺菲、默沙东等继续扩大AI合作,合作模式从早期研发向临床阶段延伸。
2)互联网巨头:华为、腾讯、阿里巴巴等通过技术平台和算力优势深化布局。
3)初创企业:尽管部分初创企业面临融资压力和管线进展缓慢的挑战,但头部公司如英矽智能、冰洲石生物等已有管线进入临床阶段。
(一)AI+SaaS:药物研发的标准化工具平台
AI+SaaS模式通过云端软件服务为药企提供模块化AI工具,覆盖靶点发现、分子模拟、晶型预测等环节。例如,薛定谔的物理模拟平台支持药物分子与靶点的动态结合预测,药企可按需订阅功能模块,无需自建算力基础设施。这类平台通常采用“订阅制 + API 调用”收费,如微软Azure AI for Pharmaceuticals提供的药物设计接口,按使用量计费。其核心优势在于降低技术门槛,使中小型药企也能快速接入 AI 能力,但面临数据隐私和工具同质化挑战。目前,AI+SaaS已从单一功能向多模态整合升级,如华为云盘古药物分子大模型集成靶点预测、ADMET性质分析等全链条工具,帮助西交大一附院团队在数月内发现新型抗生素靶点,研发周期缩短70%。
(二)AI+CRO:数据驱动的研发外包服务商
AI+CRO模式将AI技术深度嵌入传统合同研究服务,通过算法优化实验设计、加速数据解析。例如,晶泰科技与辉瑞合作开发新冠药物Paxlovid时,利用AI预测晶体结构,仅用6周完成传统需6个月的工作。这类企业通常采用“首付款+里程碑付款+销售分成”模式,如英矽智能为美迪西提供AI辅助的肿瘤项目临床前研究,根据项目进展分阶段收费。其核心竞争力在于通过大量合作积累数据,反哺模型迭代,形成“数据 - 算法”闭环。例如,药明康德的Chemistry42平台已训练超10亿分子数据,在分子设计效率上领先行业3倍。AI+CRO可覆盖从靶点验证到临床试验的全流程,如泰格医药用AI优化患者招募策略,使罕见病试验入组间缩短40%。
(三)AI+Biotech:全链条自研的创新药企
AI+Biotech企业以AI为核心驱动力自建研发管线,从靶点发现到临床申报全程自主把控。例如,英矽智能的TNIK抑制剂ISM001-055通过生成式AI平台Pharma.AI完成靶点识别、分子设计和临床前验证,仅用18个月进入IIa期,研发成本较传统模式降低99%。这类企业的商业模式以“授权合作 + 自研上市”为主,如英矽智能将临床前抗肿瘤管线授权给美纳里尼,交易总额达5.5亿美元,包含首付款、里程碑付款及销售分成。其技术壁垒在于算法原创性和数据质量,如Exscientia的Centaur Chemist平台通过强化学习生成全新分子,在慢性阻塞性肺疾病药物开发中使临床前成功率提升至60%。AI+Biotech需长期资本投入,但一旦管线成功上市,回报远超传统药企。
(一)技术层面的核心瓶颈
技术层面的难点集中于模型实用性与落地适配性。当前主流深度学习模型多存在 “黑箱” 特性,仅能输出预测结果却无法清晰阐释其背后的生物学机制,这种可解释性缺失导致研发人员难以判断结果的科学合理性,也降低了监管机构对AI研发成果的认可程度。更关键的是,AI设计与实际落地存在脱节,模型可生成理论上符合成药性的分子结构,但部分结构存在合成难度极高或无法通过现有工艺制备的问题,形成“设计可行、合成不可行”的研发断层。此外,复杂疾病建模能力不足,多数疾病发病机制涉及多基因、多通路交互,现有模型难以全面捕捉个体差异与疾病动态演化特征,限制了在复杂疾病研发中的应用。
(二)数据层面的三重困境
数据层面,面临“质、量、享”三重困境。高质量标注数据稀缺是行业普遍痛点,生物医学数据的采集需经过严格实验验证,周期长、成本高,且不同实验室的实验方法、检测标准存在差异,导致数据质量参差不齐。数据标准化程度低进一步加剧困境,多组学数据、临床数据、文献数据等格式各异,缺乏统一整合规范,难以形成大规模训练数据集。数据共享与隐私保护的矛盾更显突出,医疗健康数据、基因组数据涉及敏感信息,跨机构、跨区域共享面临严格合规约束,而分散的小体量数据又无法支撑高精度模型训练,形成“数据孤岛”难题。
(三)政策法规层面的不足
法规与知识产权体系的适配性不足构成关键壁垒。现有药品监管框架基于传统研发模式构建,对AI驱动的研发流程缺乏明确规范,例如AI模型的验证标准、数据可靠性评估方法、模型迭代后的重新审批流程等均无统一指引。知识产权界定更显复杂,AI生成的分子结构、靶点序列等成果,其发明权归属存在争议,部分地区要求人类需对发明构思作出 “重大贡献”,而AI生成的简单序列类化合物可能因合成可预测性高,被认定缺乏人类核心贡献,导致专利申请受阻,影响企业创新积极性。这些挑战需技术突破、制度完善与行业协同共同破解,方能推动AI制药稳健发展。
来源:行行查
