人工智能重塑生命科学研究的双刃效应

B站影视 内地电影 2025-05-19 19:18 1

摘要:生命科学领域的人工智能应用相较于传统实验方法,有望更快速、高效地推动生物发现和设计取得进展。与此同时,为有益应用而开发的人工智能生物工具也有可能被滥用于有害目的。尽管制造生物武器并非新概念或新风险,但过去十年来,人工智能生物工具对此类风险的影响已引发人们的担忧

生命科学领域的人工智能应用相较于传统实验方法,有望更快速、高效地推动生物发现和设计取得进展。与此同时,为有益应用而开发的人工智能生物工具也有可能被滥用于有害目的。尽管制造生物武器并非新概念或新风险,但过去十年来,人工智能生物工具对此类风险的影响已引发人们的担忧。

应美国国防部要求,美国国家学院(NASEM)于2025年3月31日发布报告《人工智能生物工具的赋能应用与风险规避》(The Age of AI in the Life Sciences: Benefits and Risks),评估了人工智能生物工具如何对生物安全风险产生独特影响,以及如何缓解这些风险。报告回顾了人工智能生物工具的功能,提出了用于识别不同风险因素的框架。启元洞见节选了该报告的部分关键点,以供参考。

一、人工智能赋能生物设计

合成生物学是指有针对性地设计、制造和部署生物系统,以实现有益目标,如生产抗旱或抗虫害作物、可再生能源或先进药物等。合成生物学过程通常采用“设计—构建—测试—学习”(DBTL)循环,这是一种设计、构建和评估生物系统的迭代方法,内置反馈回路可根据实验数据改进设计。

人工智能生物工具可以为实验验证提供数据驱动的指导,不仅能够助力科研人员产生具有前瞻性的新假设与创新想法,还能高效挖掘大型数据集中潜藏的模式与规律,进而加速并优化设计与发现流程。药物研发应用就是一个例子,人工智能工具可在数天内生成数千个候选药物分子,而如果没有人工智能方法,这一过程可能需要数年时间。

人工智能模型还能促进数据分析,在学习阶段提高对实验数据的洞察力,从而在反馈回路中不断完善DBTL循环和知识生成。

二、人工智能生物工具的潜在风险

迄今为止,专注于评估人工智能生物工具潜在安全风险的经验数据和研究有限。该报告考虑了三种潜在风险,反映了人们对人工智能生物工具可能被滥用来设计具有引发流行病或大流行风险的可传播生物制剂的担忧

(一)设计毒素等生物分子

当前,人工智能生物工具能够设计毒素等有害分子,或者使用不同的氨基酸构建块重新设计已知毒素,从而绕过简单的基于同源性的DNA筛选。

目前的人工智能生物模型存在局限性,难以生成能够满足有效生物分子所有要求的输出。这些局限性意味着潜在威胁的规模可能仅限于地方病层面,而非流行病或大流行层面。

(二)改造现有病原体以增强毒性

人工智能生物模型已展现出对特定特征进行建模的能力,这些特征可预测与毒力有关的特性。然而,该报告指出,当前模型的性能和能力存在数据集不足等局限性。

(三)从头设计病毒

要设计新的病毒病原体,生成式人工智能模型需要准确预测病毒的结构、毒性和传播性决定因素,这是一项重大的能力提升。目前还没有任何人工智能生物工具具备从头设计病毒的能力。此外,也不存在可用于训练此类模型的生物数据集。不过,如果能开发出这种能力,那将是人工智能最显著的能力提升。

重要的是,人工智能生物工具并不能减少跨越数字物理鸿沟、在实验室构建生物分子的瓶颈和障碍。未来,自动化实验室的改进或许能够缓解DBTL循环中构建和测试阶段的一些问题。

三、人工智能生物工具的安全应用

人工智能生物工具在多个方面都有助于生物安全,包括通过流行病学追踪和预测来改进传染病监测,以及加快应对措施的设计,如诊断检测等。研究项目若能提供传染源生物学知识并建立相关数据集,将有助于支持此类应对措施的开发。该报告建议继续支持研究项目,以更好地了解传染源的生物学特性,开展生物监测计划,并探索使用人工智能工具开发医疗应对措施。

在其他领域,人工智能能够直接生成用于造成危害(例如,用于制造虚假信息或深度伪造)的恶意产品,而与人工智能相关的生物威胁风险只有在生物制剂生产出来后才会在现实世界中显现。人工智能工具有可能增强现有的核酸筛查方法,而要使这一机制成为有效的控制点并降低潜在生物安全风险,还需要更多的研究。

四、持续评估的指导原则

为了避免过度地限制或阻碍生物学研究,在考虑潜在的生物安全风险时,区分能力和意图至关重要。目前,无论是用于有益还是有害的应用,人工智能生物工具都受到生物知识和数据集稀缺的限制。

该报告建议美国国防部和美国人工智能安全研究所制定“如果—那么”(If-Then)策略,持续评估数据的可用性和质量,以及随之而来的人工智能支持能力,以预测风险格局的变化。“如果—那么”策略将使用现实世界的威胁模型,该模型将考虑多种因素,如技术的可用性、其作为武器的可用性以及风险缓解潜力等。如果超过特定阈值,则可以采用风险评估和缓解策略。

五、优化数据资源和基础设施

生物数据可以成为生命科学领域人工智能能力崛起的领先指标。然而,除了核酸序列和结构数据之外,生命科学领域的数据较为零散,缺乏稳健、可靠且精心整理的可用于模型训练的数据。为了最大限度地发挥人工智能在生物学领域的应用优势,该报告建议资助相关工作和基础设施,以便为生物学应用创建和管理与人工智能兼容的数据和训练集。这包括自上而下生成高质量数据集和自下而上聚合多样化的小型数据集,以及数据协调工具和解决生物数据稀缺问题的有效方法。

此外,标准化的上下文信息对于数据复用也至关重要。蛋白质数据库(Protein Data Bank,PDB)就是一个例子,它是一个宝贵的资源,为Alpha Fold奠定了基础,因为它标准化、经过精心整理并向公众开放。该报告建议,拥有或资助生物数据库的美国联邦机构应将其视为战略资产,并实施数据溯源机制,以保持最高水平的数据质量。

数据资源库的生成、整理和保存需要对实验室、计算基础设施能力以及学科专业知识进行大量的长期投资。该报告认为,建立新的国家数据资源并战略性地收集可用于人工智能的生物数据集,应成为美国保持科学竞争力和创新能力的研究重点。

转自丨启元洞见

研究所简介

国际技术经济研究所(IITE)成立于1985年11月,是隶属于国务院发展研究中心的非营利性研究机构,主要职能是研究我国经济、科技社会发展中的重大政策性、战略性、前瞻性问题,跟踪和分析世界科技、经济发展态势,为中央和有关部委提供决策咨询服务。“全球技术地图”为国际技术经济研究所官方微信账号,致力于向公众传递前沿技术资讯和科技创新洞见。

地址:北京市海淀区小南庄20号楼A座

_er

来源:全球技术地图

相关推荐