o1

重新理解推理模型(o1/o3、DeepSeek R1)

「Z计划」是智谱面向未上市初创企业与优秀独立开发者/团队,提供 Tokens 赞助、投资支持和技术支持等资源的创新加速计划。是智谱联合生态伙伴设立的大模型生态投资基金,侧重早期,管理规模 15 亿元人民币。

deepseek o1 r1 o3 deepseekr1 2025-02-13 08:27  4

DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了

为了跟踪 AI 的发展进度,适当的基准必不可少。但现在,由于 AI 发展的速度实在太快,已有的基准已经开始不够用了。比如在常用的基准 MMLU 上,当今前沿的 LLM 已经能达到超过 90% 的准确度了!这就限制了对前沿 LLM 能力的精确度量能力。

考试 llm o1 2025-02-08 10:59  5

o1 不是聊天模型

自 o1 于 10 月发布、o1 pro/o3 于 12 月发布以来,许多人都在努力厘清自己的看法,有积极的,也有消极的。在 人们对 o1 Pro 的情绪跌至谷底时,我们采取了一种非常积极的态度,并描绘了 OpenAI 若推出每月 2000 美元的代理产品可能

模型 聊天 o1 2025-02-07 14:56  8

训练1000样本就能超越o1,李飞飞等人画出AI扩展新曲线

今年 1 月,DeepSeek R1 引爆了全球科技界,它创新的方法,大幅简化的算力需求撼动了英伟达万亿市值,更引发了全行业的反思。在通往 AGI(通用人工智能)的路上,我们现在不必一味扩大算力规模,更高效的新方法带来了更多的创新可能。

训练 o1 aime 2025-02-05 14:41  6

物理测试暴击AI圈,DeepSeekR1稳超o1、Claude

我让 R1 详细解释勾股定理。这一切都是 AI 在不到 30 秒时间里一次性完成的,没出任何错。简单来说,its over.在国内外 AI 圈,普通网友发现了神奇的强大新 AI(还开源),学界专家纷纷喊出「要奋起直追」,还有小道消息称海外的 AI 公司已经如临

claude 物理 o1 2025-01-25 17:21  8