全球首个专为水稻生物育种打造的大语言模型“丰登·水稻”向全球开放网站

B站影视 韩国电影 2025-05-29 01:07 1

摘要:5月28日,崖州湾国家实验室和上海人工智能实验室联合中国农业大学发布了全球首个种业大模型“丰登·水稻”。模型深度融合水稻生物学知识图谱,在信息检索与知识理解等方面展现出显著优势。该成果为水稻生物学研究提供全新的人工智能工具,有望加速智能决策育种技术体系构建。目

南海网、新海南客户端5月30日消息(记者 利声富)5月28日,崖州湾国家实验室和上海人工智能实验室联合中国农业大学发布了全球首个种业大模型“丰登·水稻”。模型深度融合水稻生物学知识图谱,在信息检索与知识理解等方面展现出显著优势。该成果为水稻生物学研究提供全新的人工智能工具,有望加速智能决策育种技术体系构建。目前,丰登模型已开放注册入口,面向全球育种科研人员免费使用。

近年来,随着大语言模型加速发展,人工智能在信息提取、问答生成等方面展现出强大能力,显著提升了科研信息获取效率。农业领域也开始尝试将大模型应用于育种研究,但多数仍停留在初步探索,缺乏系统开发与严谨验证。主要堵点在于能否构建一个真正理解作物生物学、具备专业推理能力的智能模型,以实质性提升生物育种研究的效率与质量。2024年4月问题得到突破,国家实验室和上海人工智能实验室联合中国农业大学发布了中国首个种业大模型“丰登”。

作为“丰登”的后续学术成果,2025年5月28日,Molecular Plant在线发表的研究论文,以水稻为例,详细解释了“丰登”的技术和实现原理,系统展示了该研究团队最新研究成果,并正式向全球开放了网站。该论文由上述单位完成,构建了全球首个专为水稻生物育种打造的大语言模型“丰登·水稻”。该成果为水稻生物学研究提供了全新的人工智能工具,有望加速智能决策育种技术体系的构建。

水稻是全球近半人口赖以为生的主粮作物,其生物学研究在推动粮食安全和农业可持续发展中具有战略意义。随着基因组测序、高通量组学等技术的广泛应用,水稻领域积累了规模庞大、类型复杂的科研数据,相关知识日益呈现碎片化特征。科研人员在检索、整合和理解这些信息时仍严重依赖人工处理,效率低下、成本高昂,成为制约知识获取和科研创新的主要瓶颈。

大语言模型凭借强大的语言理解与知识推理能力,有望成为支撑水稻研究与智能育种的关键工具。该团队率先构建了全球最大规模的水稻科研语料库RiceCorpus,系统整合了全球超过140万篇中英文文献,覆盖该领域公开发表成果的98%以上。

在此基础上,团队以通义千问模型为基础,通过续训练与精调流程,成功开发了丰登水稻种业大语言模型。为全面评估模型能力,研究团队构建了一个大模型自动生成的水稻知识问答数据集SeedBench。此外,研究团队还联合水稻领域专家,设计了一个高质量人工评测数据集HumanDesignRiceQA。

为进一步提升模型的科研实用性,团队构建了全球首个水稻多组学知识图谱,整合了1879篇关于水稻转录组和蛋白质组的文献数据,系统汇聚基因表达水平、蛋白丰度与基因组功能注释信息。

目前,丰登模型已开放注册入口,面向全球育种科研人员免费使用。模型的发布打通了从文献到数据再到知识的关键环节,为构建智能决策育种技术体系奠定了智能基础。

来源:海南网信办代录

相关推荐