摘要:今年9月,OpenAI正式推出o1大模型,可针对科学、代码和数学等领域的复杂问题解答,不过,彼时仅推出o1-preview、o1 mini两个版本,未解锁o1模型的全部能力。而此次发布会推出的o1模型,在智能化、多模态输入、思考速度等方面均有所提高。OpenA
今年9月,OpenAI正式推出o1大模型,可针对科学、代码和数学等领域的复杂问题解答,不过,彼时仅推出o1-preview、o1 mini两个版本,未解锁o1模型的全部能力。而此次发布会推出的o1模型,在智能化、多模态输入、思考速度等方面均有所提高。
OpenAI联合创始人、首席执行官Sam Altman表示,相对o1-preview,o1模型的重大错误率相比o1-preview减少了约 34%,而思考速度提升了约 50%。
他介绍,o1之所以与众不同,是其每次在回答之前都会思考,这使得它能够提供比其他模型更详细、更正确的答案。
o1的智能化体现在数学等复杂问题具备更高的准确率。据悉,o1模型在解答AIME 2024数学竞赛、博士级科学问题的准确率分别达到78.3%、75.6%,比o1-Preview的准确率分别高出28.3%,1.5%。
回答速度方面,o1也有所提升。在离线测试情况下,o1的平均响应速度比 O1 预览版快了约 60%。OpenAI员工在直播中提出一个问题,分别要求o1、o1-Preview列举公元2世纪的罗马皇帝,并简述他们的生平。结果显示,o1只花了约14秒解答,而o1-Preview耗费33秒。
OpenAI还注意到模型之前对所有问题都有较长的相应时间,他们已经修复这一问题。现在,如果你提出一个简单的问题,o1会快速作答;如果提出了一个复杂的问题,它会花更长的时间思考。
此外,o1新增多模态输入能力,能同时处理图片和文本内容,并进行推理。
OpenAI展示了一张手绘草图的A4纸,画有太阳、冷却系统等物体,以及不同数值,拍照上传给o1。o1在没有任何提示的情况下,生成用户可能想问的问题,并自动解答。接着在不到10秒的时间,o1不仅成功理解了草图的问题要求,还意识到没有提供的参数,自我推理给出了正确答案。
考虑到用户希望不受调用限制使用模型的需求,OpenAI此次推出了新的订阅机制ChatGPT Pro,用户每月付费200美元即可无限制使用更强的o1模型——o1 Pro。
OpenAI展示了o1-Preview、o1、o1 Pro在数学竞赛、代码竞赛、博士级科学问题的回答差异,在每个问题询问四次后,o1 Pro的可靠准确率最高,分别为80.0%、74.9%、74.2%。
OpenAI
来源:大力财经