AI“算命”,提前20年预测上千种疾病

B站影视 电影资讯 2025-09-22 17:00 1

摘要:9月17日,德国癌症研究中心(DKFZ)、欧洲分子生物学实验室、欧洲生物信息学研究所(EMBL-EBI)、哥本哈根大学的研究团队在《自然》(Nature)发表论文,Learning the natural history of human disease wi

9月17日,德国癌症研究中心(DKFZ)、欧洲分子生物学实验室、欧洲生物信息学研究所(EMBL-EBI)、哥本哈根大学的研究团队在《自然》(Nature)发表论文,Learning the natural history of human disease with generative transformers,介绍了一款AI模型Delphi-2M,可高精度预测未来20年中超过1000种疾病的发生率。

团队将ICD-10编码(WHO制定的国际统一疾病分类标准),再加上参与者的性别、BMI(体重指数),以及与健康相关的习惯(例如吸烟和饮酒情况),共计1258个信息作为tokens。

模型训练采用英国生物库(UK Biobank)40.2万参与者的数据,80%的数据作为训练数据,20%作为验证和优化数据;之后还在丹麦193万人群的外部数据集上实现了无参数调整的有效迁移,展现出跨人群与医疗体系的适配性。

Delphi是一种改进的GPT架构,对健康轨迹进行建模。图片来源:nature。

研究团队将Delphi-2M预测验证队列中各种疾病结果的准确性,与作为流行病学基线的性别和年龄分层发病率进行了比较。Delphi-2M预测效果良好,能有效识别不同疾病的年龄和性别分层的发生趋势,年龄性别分层AUC均值达0.76,其中死亡预测AUC高达0.97,且97%的疾病预测AUC超过0.5。(AUC,即模型预测的曲线下面积,取值范围在0.5到1之间,0.5表示与随机猜测无异,越接近1模型的分类能力越强。)

基于个人医疗史,Delphi-2M能预测超过1000种疾病的发生率,还能模拟个体未来几十年的健康变化轨迹。根据过往健康信息,Delphi-2M能模拟未来20年的健康变化路径,为潜在疾病的评估提供有效工具。

目前,该模型仍需进一步验证,尚未准备应用于临床。研发人员提醒,所使用的数据集并不具有完全的代表性,存在与年龄、种族和医疗保健获取相关的偏差。

近两年,众多研究机构和企业纷纷投身于利用AI进行疾病预测的探索。

2025年8月,阿尔托大学研究人员开发了一款新型AI工具survivalFM,能精确预测个体患常见疾病(心血管疾病、糖尿病或肝脏疾病等)的风险。(见《2025科创要闻No.35》)

2025年7月,温州医科大学、北京大学等研究团队合作开发了多模态集成AI模型LUCID,通过多模态临床信息整合,实现了对肺癌分子的表型分析及预后预测。

复旦大学团队在2024年11月也研发了一套“人类健康与疾病蛋白质组图谱”,通过AI算法的辅助,只需通过简单的血浆蛋白组检测,就能提前诊断和预测包括心脏病、糖尿病、阿尔茨海默病等上百种疾病的患病风险。(见《2024科创要闻No.44》)

阿斯利康2024年9月发布疾病预测AI开源模型MILTON,该模型分析以67种数量性状(包括血液化学、尿液分析等),针对三千多种疾病建立预测模型。

随着越来越多的企业投入AI预测疾病,AI真的可以“算命”了。你会愿意依据AI的预测,健康但按部就班地度过这一生吗?个性化疾病预防与健康管理又将朝着什么方向演进呢?

人工智能

01 DeepSeek登上《自然》封面

9月17日,由DeepSeek团队共同完成、梁文锋担任通讯作者的论文DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning在《自然》发表并登上封面,表明LLM推理能力可通过纯强化学习 (RL) 来激励,无需人工标记推理轨迹。

《自然》封面,Volume 645 Issue 8081, 18 September 2025。图片来源:nature。

论文指出,DeepSeek-R1使用强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。当DeepSeek-R1得到问题的优质答案后,会获得一个模板产生推理过程,核心在于奖励信号仅基于正确答案,而不对推理过程施加限制。

结果显示,DeepSeek-R1在数学、编码竞赛以及STEM(科学、技术、工程和数学)等领域的可验证任务上表现优异,超越了通过传统监督学习的LLM模型。此外,R1的训练成本仅为29.4万美元,远低于同类模型动辄数千万美元的花费。

• 点评:过去,LLM在多种任务上展现出强大的推理能力,主要依赖大量人类标注的推理示例,而DeepSeek颠覆了这一路径。同时,与2025年1月发布的预印本相比,本次论文披露了更多模型训练的技术细节和安全性问题,是AI向着科学化、公开化和透明化迈进的重要标志。《自然》称之为“里程碑式论文”(landmark paper),指出目前几乎所有主流的大模型都还没有经过独立的同行评审,这一空白终于被DeepSeek打破。(曹妍)

02 华为发布全球最强算力超节点和集群

9月18日,华为发布最新超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先,为全球算力最强的超节点。

基于超节点,华为同时发布全球最强超节点集群,分别是Atlas 950 SuperCluster和Atlas 960 SuperCluster,算力规模分别超过50万卡和达到百万卡,为全球最强算力集群。

同时,华为率先把超节点技术引入通用计算领域,发布全球首个通用计算超节点TaiShan 950 SuperPoD,结合GaussDB分布式数据库,能够彻底取代各种应用场景的大型机和小型机以及Exadata数据库一体机。

• 点评:华为轮值董事长徐直军在发布会上表示,“基于中国可获得的芯片制造工艺,华为努力打造‘超节点+集群’算力解决方案,来满足持续增长的算力需求。”显然,通过系统性创新,华为已经突破了大规模超节点的互联技术的挑战。围绕AI发展最为关键的基础设施,中国企业也开始有了与世界科技企业一争高下的雄心。(李一跞)

03 英伟达以50亿美元收购英特尔股份

9月18日,英伟达和英特尔宣布合作,共同开发多代定制数据中心和PC产品,以加速超大规模、企业和消费者市场的应用程序和工作负载。英伟达将以每股23.28美元向英特尔普通股投资50亿美元,约占后者总股本的4.9%,成为继美国政府、贝莱德、先锋领航之后的第四大股东。该投资还有待监管层批准。

对于数据中心,英特尔将构建定制的x86(一种主流芯片设计架构,另一种为ARM)CPU,将其集成到英伟达AI基础设施平台;在个人计算领域,英特尔将推出集成NVIDIA RTX GPU芯片组的x86系统级芯片。

• 点评:英特尔是美国本土头部芯片制造商,也是美国“制造业回流”计划的重要一环。过去一个月,英特尔累计获得三笔公开投资(美国政府、软银集团、英伟达),共计得到159亿美元。相比美国政府和软银的现金投资,英伟达与英特尔在技术和产品层面达成更为深入的合作,有望从根源缓解后者全年亏损、代工业务低迷的困境。英伟达则以较小代价获得了与行业巨头深度绑定的机会,强化了自身的计算生态竞争力。(曹妍)

生物医药

04 罗氏以35亿美元收购89bio

9月18日,罗氏宣布收购美国生物制药公司89bio(ETNB.O),交易总价值最高约为35亿美元,获得其核心产品、全球首创FGF21类似物pegozafermin。该产品目前正处于针对中度和重度纤维化(F2/F3期)以及及肝硬化(F4期)代谢功能障碍相关的脂肪性肝炎(MASH,俗称脂肪肝)患者的III期临床阶段。该交易预计将于2025年第四季度完成。交易完成后89bio将成为罗氏制药部门的一部分。

• 点评:MASH是最常见的肥胖合并症之一,可导致肝纤维化、肝硬化甚至肝癌,目前靶向性药物仅有美国生物制药公司Madrigal的Rezdiffra™(通用名:resmetirom)获批(2024年3月获FDA批准,2025年8月获欧盟批准)。pegozafermin是一种长效FGF21类似物,既能抗炎症也能抗纤维化,每周一次皮下注射,具有“best-in-disease”的潜力。罗氏积极布局下一代治疗方案,包括更有效的药物、更方便的给药方式以及针对并发症的治疗手段。随着项目的推进,患者有望获得更多治疗选择。(罗仙仙)

05 脑机接口动态电极“神经蠕虫”

9月17日,中科院深圳先进技术研究院联合东华大学在《自然》(nature)发表论文A movable long-term implantable soft microfibre for dynamic bioelectronics,介绍了一种仿蠕虫结构的动态、柔软、可拉伸的纤维神经接口NeuroWorm(神经蠕虫)。

研究团队在一根头发丝粗细(约200微米)的纤维上,沿轴向分布60个(是传统方式的15倍)离散化的电极和应变传感器;随后在电极的一端增加了微小的磁头,通过结合高精度磁控系统和即时影像追踪技术,使电极能在体内自主调控前进方向,并能稳定记录高质量的生物电信号。

在实验中,通过外部磁场操控,NeuroWorm可在肌肉的表面上实现游走,植入后的一周内每天变换位置进行监测。它在大鼠腿部肌肉内稳定工作超过43周,展现了优异的长期生物相容性。

• 点评:传统的全植入式脑机接口监测能力相对较强,但植入后无法动态调整植入位置,也无法对周边环境作出响应性调整。上述研究利用卷曲技术将二维生物电子设备转化为一维NeuroWorm,代表生物电子学的重大进步——从固定在原位的静态探头,转变为用于长期、微创且可移动的神经系统评估的主动、智能的活体设备。(曹妍)

06 AI设计病毒,能够感染并杀死耐药细菌

9月17日,斯坦福大学Brian Hie等人在预印本平台bioRxiv上(尚未经过同行评审)发表论文Generative design of novel bacteriophages with genome language models,首次报告了利用基因组语言模型设计生成一种新型的可存活噬菌体(一种攻击细菌的病毒)基因组,能够感染并杀死耐药细菌。

研究团队之前开发的AI模型Evo1和Evo2,已基于超过200万个噬菌体基因组进行了训练,本次利用监督学习方法再次对这两个模型进行训练,以裂解噬菌体ΦX174为设计模板,生成具有真实遗传架构和理想宿主嗜性的全基因组序列。其中,有16种具有显著进化新颖性的可存活噬菌体,有多株噬菌体在生长竞争和裂解动力学方面均展现出优于ΦX174的适应性。由这些噬菌体组成的混合制剂能快速攻克三种大肠杆菌株对ΦX174的耐药性,证明该方法在设计对抗快速进化细菌病原体的噬菌体疗法方面具有应用潜力。

• 点评:该研究有望新增一种针对耐药菌感染的治疗手段。更重要的是,AI此前已能用于生成DNA 序列、单个蛋白质以及多组分复合物,现在又可以设计生成基因组,朝着生成生命的方向迈出了重要一步。(李一跞)

07 成功构建功能性人类肾脏类器官

9月17日,南加州大学凯克医学院的研究团队在《细胞》(Cell)子刊Stem Cell发表论文Spatially patterned kidney assembloids recapitulate progenitor self-assembly and enable high-fidelity in vivo disease modeling ,报告他们首次在实验室利用人类多能干细胞(hPSC)构建出具有复杂三维结构的人类肾脏类器官。这些类器官的体外体内均展现出主要的肾脏功能,移植后可产生类尿液体液。另外,研究团队利用基因组编辑、体内培养的人类肾脏复合类器官,构建了人类常染色体显性遗传多囊肾病模型,精准重现疾病特征。

• 点评:人类肾脏由百万肾单位与集合管系统构成,现有类器官因难重现其结构功能而受限。该成果为人工肾移植、肾脏疾病模拟及药物研发提供了关键支撑。(付烁畦)

08 破解“植物细胞全能性”机制之谜

9 月 16 日,山东农业大学、荷兰拉德堡德大学、北京华大生命科学研究院的研究团队联合在《细胞》(Cell)发表论文Time-resolved reprogramming of single somatic cells into totipotent states during plant regeneration,首次完整揭示了单个植物体细胞如何通过基因重编程“改变命运”、最终发育为完整植株的全过程。

研究团队利用单细胞测序、显微切割转录组测序和活体成像等前沿技术,完整记录了细胞命运重塑的完整路径,揭示了关键的命运分岔点:一条路径是气孔前体细胞继续分化为气孔;另一条路径是在大量合成内源生长素的推动下,单个体细胞被重编程为全能干细胞,走上胚胎发育之路。研究人员将这一关键过渡状态命名为“GMC-auxin”中间态。在GMC-auxin中间态下,大量转录因子形成高度耦合的调控网络,进而激活下游的胚胎发生程序。

模式图展示气孔前体细胞的两条发育路径。图片来源:cell。

• 点评:2005年,《科学》(Science)杂志将“单个体细胞如何发育成完整植株”列为最具挑战的125个关键科学问题之一。上述研究不仅回答了这道世纪之问,也为精准调控植物再生和定向改良作物性状提供了全新思路。(罗仙仙)

中国与世界

9 中国推进面向东盟的人工智能创新合作

9月16日,科技部在2025面向东盟国际技术转移与创新合作大会发布《面向东盟人工智能赋能发展科技能力提升行动三年工作方案(2025-2027)》,提出要实施一批人工智能技术联合研究项目,合作开发基于本地语言的大模型;在工业制造、农业、医疗、交通、教育等重点领域打造东盟国家特色人工智能应用场景;建设一批中国—东盟人工智能联合实验室和面向东盟国家的人工智能专业技术服务平台;支持东盟国家人工智能领域科学家来华进行学术交流和科研合作,促进人工智能人才的交流互通;联合东盟国家推进智能化基础设施建设,推动小语种语料库及各类数据集共建共享,成立中国—东盟人工智能算力联盟,为东盟各国提供普惠便捷的算力服务。

• 点评:该方案聚焦AI技术联合研发,有助于提升区域的整体技术水平,推动AI在不同领域的创新应用。更重要的是,开放合作是科技创新发展的内在要求,通过人才流动和知识共享,缩小技术差距、促进技术的普惠应用。(卫酉祎)

10 英美签署《科技繁荣协议》

9月16日,英国与美国签署《科技繁荣协议》(Tech Prosperity Deal),旨在加强两国在人工智能、量子计算和民用核能等领域的合作。英格兰东北部地区将成为新的人工智能增长区,有望创造超过5000个就业岗位及数十亿英镑的私人投资。

以微软为首的美国科技公司承诺将向英国投资310亿英镑。其中,英伟达将在英国部署12万颗GPU芯片;微软计划投资220亿英镑拓展人工智能基础设施;谷歌宣布投资50亿英镑打造全新的数据中心。此外,英国公司Nscale与OpenAI达成协议,计划打造英国版“星际之门”项目。

• 点评:史无前例的英美科技协议,美国寻求巩固全球科技领导地位、强化盟友关系,英国则寻求在AI、能源等领域的发展,以及创造新的工作岗位。(曹妍)

南方周末科创力研究中心

责编 黄金萍

来源:南方周末

相关推荐