DeepSeek-R1横空出世,能否成为OpenAI o1的强劲对手?
在人工智能界掀起波澜的DeepSeek团队,于近日震撼发布了其最新力作——DeepSeek-R1模型。这款开源模型一经问世,便在Github平台上迅速积累了超过4000颗星的瞩目成绩,成为大模型领域的一颗璀璨新星。
在人工智能界掀起波澜的DeepSeek团队,于近日震撼发布了其最新力作——DeepSeek-R1模型。这款开源模型一经问世,便在Github平台上迅速积累了超过4000颗星的瞩目成绩,成为大模型领域的一颗璀璨新星。
在OpenAI连续12天的技术发布会上,一项名为RFT(Reinforcement-based Fine-Tuning,基于强化学习的微调)的新型训练方法引发全球关注。该方法通过结合强化学习与监督微调,仅需少量标注数据即可显著提升模型在特定场景下的性能。2月2
千帆 openaio1 rft 千帆modelbuilder 2025-03-14 17:01 4
在OpenAI连续12天的技术发布会上,一项名为RFT(Reinforcement-based Fine-Tuning,基于强化学习的微调)的新型训练方法引发全球关注。该方法通过结合强化学习与监督微调,仅需少量标注数据即可显著提升模型在特定场景下的性能。2月2
千帆 openaio1 rft 千帆modelbuilder 2025-03-14 14:28 3
过去12个月,大型语言模型 (LLM) 的重头戏是增强其推理能力,以弥补与通用人工智能 (AGI) 的差距。DeepSeek R1 和OpenAI o1是引领这一发展的两个著名模型,旨在出色地完成复杂的推理任务。
deepseek openaio1 deepseekr1 2025-02-10 08:23 7
科技媒体testingcatalog发布博文,报道称xAI官方虽然尚未公布,但Grok-3已短暂现身独立平台和X平台,开启内部测试,有望下周正式发布。
2025年1月20日,杭州深度求索人工智能基础技术研究有限公司正式发布了其最新研发的高性能AI推理模型——DeepSeekR1。该模型在数学、代码和自然语言推理等任务上表现卓越,性能直接对标OpenAI的o1正式版,同时以开源形式向全球开发者开放,并使用MIT
deepseek openaio1 deepseekr1 2025-01-27 14:59 8
科技媒体 testingcatalog 今天(1 月 27 日)发布博文,报道称 xAI 官方虽然尚未公布,但 Grok-3 已短暂现身独立平台和 X 平台,开启内部测试,有望下周正式发布。
就在本周,DeepSeek正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1遵循 MIT License,允许用户通过蒸馏技术借助R1训练其他模型。
上期图文内容,我们分享了深度求索公司发布的DeepSeek-V3 大模型,而在过中国新年之前,深度求索正式推出新一代人工智能助手DeepSeek-R1大语言模型。官方宣称其综合性能对标OpenAI的GPT-4o(o1正式版),并在逻辑推理、数学计算、编程辅助等
距离国产大模型做考研数学题“过线”刚过两个月,月之暗面在春节前一周,又扔出了一个分量十足的“王炸”——这一次,他们拿出了能媲美Open AI 满血版 o1(Full Version,而非 preview)的K1.5多模态模型,在文字和视觉两大领域实现了“超英赶
在人工智能领域,一场悄无声息的革命正在上演。1月20日,DeepSeek团队震撼发布了其最新开源模型——DeepSeek-R1,该模型一经推出,便在GitHub上迅速收获了超过4000个星标,成为大模型领域的焦点。
昨日 1 月20 号,DeepSeek 团队推出了全新开源模型 DeepSeek-R1,一夜之间模型就在 Github 上收获了 4k+star,引爆大模型领域。
1 月 20 日,DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1,在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平,同时将应用程序编程接口(API,Application Programming Interfac
1 月 20 日,DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1,在数学、编程和推理等多个任务上达到了与 OpenAi o1 相当的表现水平,同时将应用程序编程接口(API,Application Programming Interfac
1月20日晚间,月之暗面(Kimi)和深度求索(DeepSeek)这两大备受瞩目的AI大模型创业公司,几乎是同时发布了新模型,并均声称新模型的性能对标OpenAI的o1模型。值得注意的是,在DeepSeek发布新模型后的两小时后,Kimi紧随其后也推出了新模型
即使是像应对气候变化这样看似有益的目标,AI系统也可能选择有害的方法来实现这些目标——甚至可能得出令人惊悚的暴论,即认为消除人类才是最有效的解决方案。此刻,我们站在AI发展的十字路口。在这一场与时间的赛跑中,多考虑一些总不会有错。因此,尽管AI价值对齐是一项难
在与专用国际象棋引擎Stockfish测试中,只因提示词中包含能力「强大」等形容词,o1-preview入侵测试环境,直接修改比赛数据,靠「作弊」拿下胜利。这种现象,表明AI安全任重道远。
今天是2024年最后一个月的第一天,我们讲两个方面的内容,使用大模型进行标书写作的一个简单开源项目,以及再看openai O1进展及LLM-Self-Correction机制。
如果LLM两次考试的分数差不多,就证明人家是真会;要是后者的成绩明显低于前者,那就有作弊嫌疑了。
今日,月之暗面国产大模型Kimi发布视觉思考模型k1,k1基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。