时隔六年，OpenAI方面日前发布两款开源模型

摘要：日前，OpenAI方面正式发布并开源两款推理模型gpt-oss-120b、gpt-oss-20b。据悉，oss是Open Source Series的缩写，意为开源系列。

日前，OpenAI方面正式发布并开源两款推理模型gpt-oss-120b、gpt-oss-20b。据悉，oss是Open Source Series的缩写，意为开源系列。

对此OpenAI CEO 山姆·奥尔特曼表示，这是该公司耗资数十亿美元的研究成果，“gpt-oss是一个重大突破……我们相信这是全球最佳且最实用的开放模型”。

据了解，这也是继2019年的GPT-2后，OpenAI时隔6年再次推出开源模型。目前这两款模型均以Apache 2.0许可证发布，企业在商用前无需付费或获得许可。

而对于推出开源模型的原因，OpenAI方面表示，“开放模型与我们的托管模型相辅相成，为开发者提供了更广泛的工具，以加速前沿研究、促进创新，并在广泛的用例中实现更安全、更透明的AI开发。这些开源模型还降低了新兴市场、资源受限行业以及中小型组织进入AI的门槛”

据悉，gpt-oss-120b、gpt-oss-20b均基于MoE（混合专家）架构，并采用预训练和后训练技术进行训练，特别关注推理、效率和在广泛部署环境中的实际可用性。在训练数据方面，OpenAI方面在一个主要为英文的纯文本数据集上训练了这两款模型，训练内容特别强调 STEM 领域知识、编码能力和通用知识。

其中，gpt-oss-120b总参数量为1170亿、激活参数量为51亿，可在单张80GB GPU上运行，在核心推理基准测试中的表现与 OpenAI o4-mini 几乎持平。gpt-oss-20b的总参数量为210亿、激活参数为36亿，可在16GB内存的消费级设备上运行，在常见基准测试中表现与OpenAI o3-mini相似。

据OpenAI方面介绍，这两款模型在工具使用、少样本函数调用、链式思考推理以及HealthBench上表现强劲，甚至超越了包括OpenAI o1和GPT‑4o在内的专有模型。，

此外OpenAI方面强调，安全性是该公司发布所有模型的前提，尤其对开源模型至关重要。据悉，除全面的安全训练和评估测试外，OpenAI方面还基于自身的准备框架（Preparedness Framework）对gpt-oss-120b的对抗性微调版本进行了测试。相关结果显示，gpt-oss在内部安全基准测试中的表现与OpenAI的前沿模型相当，并提供与其近期专有模型相同的安全标准。

值得一提的是，日前山姆·奥尔特曼还预告本周晚些时候OpenAI将会发布一项“重大更新”。对此有观点认为，鉴于OpenAI方面近期曾多次披露GPT-5相关信息，这一“重大更新”或与其有关。

【本文图片来自网络】

来源：小隐看科技

标签：模型开源奥尔特曼 openai 山姆

本文地址：http://news.43b.com.cn/a/710876.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!