智谱发布首个基于扩展强化学习技术训练的推理模型“GLM-Zero-Preview”

B站影视 2024-12-31 15:11 2

摘要:12月31日,北京智谱华章科技有限公司(以下简称“智谱”)发布其首个基于扩展强化学习技术训练的推理模型GLM-Zero-Preview。

本报讯 (记者谢岚 见习记者梁傲男)12月31日,北京智谱华章科技有限公司(以下简称“智谱”)发布其首个基于扩展强化学习技术训练的推理模型GLM-Zero-Preview。

据智谱方面介绍,该模型专注于增强AI推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。在逻辑推理方面,GLM-Zero-Preview善于识别逻辑漏洞,能够模拟多种假设和可能性。在数学方面,GLM-Zero-Preview具有强大的归纳与演绎能力,能够快速处理复杂的数学运算,解答包括代数、微积分、概率统计等领域的问题。在代码方面,GLM-Zero-Preview能够熟练使用多种编程语言,帮助开发者快速编写代码。

智谱方面对《证券日报》记者表示:“目前的GLM-Zero-Preview在部分评测集中效果与OpenAI的o1-preview相当,但与OpenAI的o3模型还有差距。未来,我们将持续优化迭代强化学习技术。很快,我们将会推出正式版GLM-Zero,将深度思考的能力从数理逻辑扩展到更多更通用的技术,继续向AGI迈进。”

(编辑 张伟)

来源:证券日报

相关推荐