破天荒!OpenAI重新“开源”,还和亚马逊云科技合作上了

B站影视 内地电影 2025-08-06 12:08 1

摘要:今日,OpenAI 宣布,推出了两款全新的开放权重(open‑weight)AI推理模型:gpt-oss-120b和gpt-oss-20b纯文本模型,不支持图像或视频,能力与此前推出的o系列模型相近。

【TechWeb】8月6日消息,没等到GPT-5,先等来了OpenAI的“开源”。

今日,OpenAI 宣布,推出了两款全新的开放权重(open‑weight)AI推理模型:gpt-oss-120b和gpt-oss-20b纯文本模型,不支持图像或视频,能力与此前推出的o系列模型相近。

这两款模型均以 Apache 2.0 授权发布,允许免费下载、商业使用及二次开发,用户可通过知名开发平台Hugging Face进行下载。

OpenAI 称,这两款模型在多个公开基准测试中表现出了“顶尖水平”。

与此同时,有意思的是,亚马逊云科技宣布,OpenAI的开放权重模型首次可通过Amazon Bedrock和Amazon SageMaker AI访问,帮助客户快速构建生成式人工智能(生成式AI)应用。

至此,亚马逊云科技算终于集齐了包含OpenAI大模型在内的行业顶尖主流大模型。

在此之前,OpenAI的相关模型主要和微软等合作,并未上架亚马逊云科技。亚马逊曾两年80亿美元投资OpenAI强劲竞争对手Anthropic,Anthropic的Claude最新系列模型都会第一时间上架亚马逊云科技。

现在随着OpenAI大模型也上线亚马逊云科技这一全球最大云平台,大模型领域的竞争或将迎来新的变化。

6年来再“开源”

尽管业内认为,OpenAI此次发布的这两个模型均为开放权重(open‑weight)类型,类似于Meta的Llama模型。这里所说的“权重”是指AI模型的参数。OpenAI公开了训练过程中模型获取并调校的众多数值参数,以便开发人员更好地定制模型。不过,OpenAI没有公开强化学习的技术细节、用于训练模型的数据,数据来源等信息,让开源社区难以从中借鉴,因此并未达到真正意义上的开源AI模型。

但这已是 OpenAI 自2019年发布开源GPT-2以来,首次推出新的“开源”大语言模型。

近年来OpenAI 逐渐转向闭源策略,通过API向企业和开发者出售访问权,建立了商业模式。

不过,今年一月,OpenAI CEO 山姆•奥特曼(Sam Altman)曾表示,在开源问题上,OpenAI 可能“站错了历史的一边”。当前,中国的 DeepSeek、阿里巴巴的通义千问、Moonshot AI 等开源模型迅速崛起,逐渐占据主导地位。

有外媒认为,特朗普政府在7月呼吁美国 AI 开发商更多地开源技术,推动全球采用符合美国价值观的 AI 技术。通过推出 gpt-oss,OpenAI 希望同时赢得开发者和特朗普政府的认可,以应对来自中国 AI 实验室的竞争压力。

对于这次开源2款大模型,奥特曼表示:“回到我们 2015 年创办公司的初衷,OpenAI 的使命始终是确保通用人工智能(AGI)惠及全人类。因此,我们十分期待全球开发者基于美国创造的、基于民主价值观的开源 AI 堆栈构建技术,让所有人免费使用,造福大众。”

性能比肩o4‑mini和o3‑mini

gpt‑oss‑120b 适用于需要高推理能力的生产级和通用型场景,拥有约 1170 亿参数,每个 token 启用 51 亿参数,推理性能接近o4‑mini,能在单张 80GB显存的GPU上高效运行(如Nvidia H100)。

gpt‑oss‑20b 适用于低延迟、本地或专业化场景,约 210 亿参数、可在拥有16GB内存的普通笔记本电脑上运行,表现与o3‑mini 相当 。

具体来看,gpt-oss-120b在编程竞赛(Codeforces)、通用问题解决(MMLU和HLE)以及工具调用(TauBench)方面超越了o3-mini,达到甚至超越o4-mini的水平。

除此之外,两款模型在工具使用、少样本函数调用、CoT推理以及HealthBench评测中也表现强劲,甚至比OpenAI o1和GPT-4o等专有模型还要更强。

其他亮点包括:

• 宽松的Apache 2.0许可证:可自由用于构建,无copyleft限制或专利风险——是实验、定制和商业化部署的理想选择。

• 可配置的推理投入:可根据用户的具体用例和延迟需求,轻松调整推理投入(低、中、高)。

• 完整的思维链:可完整访问模型的推理过程,从而简化调试并提升输出结果的可信度。

• 支持微调:支持参数级微调,可根据您的特定用例对模型进行完全定制。

• 智能体能力:两款模型已经与OpenAI的Responses API兼容,可用于Agent工作流,具备较好的指令遵循能力、网页搜索或Python代码执行等工具使用能力以及推理能力,还支持调整模型推理长度。

• 原生MXFP4量化:在训练时,模型的混合专家(MoE)层便采用了原生的MXFP4精度,使得gpt-oss-120b在单张H100 GPU上即可运行,而gpt-oss-20b仅需16GB内存。

OpenAI还特地准备了一个playground网站供用户在线体验。

已上架亚马逊云科技,性价比是DeepSeek-R1的5倍

随着OpenAI开放权重模型的发布,亚马逊云科技也第一时间宣布,OpenAI的开放权重模型首次可通过Amazon Bedrock和Amazon SageMaker AI访问,帮助客户快速构建生成式人工智能(生成式AI)应用,借助全球覆盖最广、被客户广泛采用的亚马逊云科技服务,将OpenAI的影响力扩展至亚马逊云科技数百万客户。

亚马逊云科技产品总监Atul Deo表示:“开放权重模型将在生成式AI的未来发展中扮演重要作用,我们致力于将亚马逊云科技打造为运行模型的最佳平台,这是我们此次推出OpenAI模型的原因。OpenAI成为我们最新的开放权重模型提供方,这是亚马逊云科技持续将前沿AI带给全球各个组织的自然延伸。亚马逊云科技广泛的客户基础也将为OpenAI先进技术的获取方式带来变革性的转变。”

据介绍,在Amazon Bedrock上运行的两个开放权重模型中的大尺寸模型,在性价比方面是同类Gemini模型的3倍、DeepSeek-R1的5倍以及OpenAI o4模型的2倍。

亚马逊云科技称,此次发布进一步体现了其在模型选择上对客户的承诺,不仅拓展了Amazon Bedrock已支持的广泛的托管模型,也通过Amazon SageMaker JumpStart为客户提供更多接入选择,进一步体现了亚马逊云科技在生成式AI技术领域的持续创新,以满足客户需求。

亚马逊云科技还特别谈到,OpenAI的开放权重模型具备先进的推理能力,非常适合用于AI Agent场景,重塑企业的业务运营方式。借助Amazon Bedrock AgentCore,客户可部署并运行高效Agent,并借助在Amazon Bedrock上的OpenAI模型,为企业提供符合生产级需求的扩展性与安全性。客户还可将gpt-oss-120b与gpt-oss-20b无缝集成至Amazon Bedrock企业级安全架构中,利用如Guardrails(通过可配置安全策略可拦截高达88%的有害内容)等强大工具,未来还将支持自定义模型导入、知识库与个性化定制等功能。在Amazon SageMaker AI中,客户可结合OpenAI开放权重模型与完善的工具链,实现模型的预训练、评估、微调与部署。(果青)

来源:TechWeb一点号

相关推荐