首发,Higress AI 网关率先支持 QwQ-32B,推理成本可再降 90% QwQ-32B 已在 Hugging Face[1]和 ModelScope[2]开源,采用了 Apache 2.0 开源协议。技术管理者们开始紧锣密鼓的重新梳理大模型业务的 ROI,工程师们开始在后端大模型添加 QwQ-32B 的版本,并切换为主力模型进行测 网关 推理 api higress higressai 2025-04-01 17:40 2