时隔六年,OpenAI方面日前发布两款开源模型

B站影视 电影资讯 2025-08-07 18:53 1

摘要:日前,OpenAI方面正式发布并开源两款推理模型gpt-oss-120b、gpt-oss-20b。据悉,oss是Open Source Series的缩写,意为开源系列。

日前,OpenAI方面正式发布并开源两款推理模型gpt-oss-120b、gpt-oss-20b。据悉,oss是Open Source Series的缩写,意为开源系列。

对此OpenAI CEO 山姆·奥尔特曼表示,这是该公司耗资数十亿美元的研究成果,“gpt-oss是一个重大突破……我们相信这是全球最佳且最实用的开放模型”。

据了解,这也是继2019年的GPT-2后,OpenAI时隔6年再次推出开源模型。目前这两款模型均以Apache 2.0许可证发布,企业在商用前无需付费或获得许可。

而对于推出开源模型的原因,OpenAI方面表示,“开放模型与我们的托管模型相辅相成,为开发者提供了更广泛的工具,以加速前沿研究、促进创新,并在广泛的用例中实现更安全、更透明的AI开发。这些开源模型还降低了新兴市场、资源受限行业以及中小型组织进入AI的门槛”

据悉,gpt-oss-120b、gpt-oss-20b均基于MoE(混合专家)架构,并采用预训练和后训练技术进行训练,特别关注推理、效率和在广泛部署环境中的实际可用性。在训练数据方面,OpenAI方面在一个主要为英文的纯文本数据集上训练了这两款模型,训练内容特别强调 STEM 领域知识、编码能力和通用知识。

其中,gpt-oss-120b总参数量为1170亿、激活参数量为51亿,可在单张80GB GPU上运行,在核心推理基准测试中的表现与 OpenAI o4-mini 几乎持平。gpt-oss-20b的总参数量为210亿、激活参数为36亿,可在16GB内存的消费级设备上运行,在常见基准测试中表现与OpenAI o3-mini相似。

据OpenAI方面介绍,这两款模型在工具使用、少样本函数调用、链式思考推理以及HealthBench上表现强劲,甚至超越了包括OpenAI o1和GPT‑4o在内的专有模型。,

此外OpenAI方面强调,安全性是该公司发布所有模型的前提,尤其对开源模型至关重要。据悉,除全面的安全训练和评估测试外,OpenAI方面还基于自身的准备框架(Preparedness Framework)对gpt-oss-120b的对抗性微调版本进行了测试。相关结果显示,gpt-oss在内部安全基准测试中的表现与OpenAI的前沿模型相当,并提供与其近期专有模型相同的安全标准。

值得一提的是,日前山姆·奥尔特曼还预告本周晚些时候OpenAI将会发布一项“重大更新”。对此有观点认为,鉴于OpenAI方面近期曾多次披露GPT-5相关信息,这一“重大更新”或与其有关。

【本文图片来自网络】

来源:小隐看科技

相关推荐