aime资讯_B站影视

免费使用GPT-5！一手实测案例，代码能力强的离谱

经过几天调试，从今天开始，免费版ChatGPT可以正式使用GPT-5了，下面「AIGC开放社区」就基于免费版为大家展示一下GPT-5强大的功能。

代码免费艾梅 aime 导航栏 2025-08-12 12:25 3

智谱终于发布GLM-4.5技术报告，从预训练到后训练，细节大公开

就在上个月底，智谱放出重磅炸弹 —— 开源新一代旗舰模型GLM-4.5以及轻量版GLM-4.5-AIr。其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合，还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。这个成绩在所有国产模型和开

训练智能体 sonnet rl aime 2025-08-11 15:24 3

GPT-5发布引热议：博士级AI表现究竟如何？

然而，发布会上的一个小插曲却让这场盛宴略显尴尬。在展示Benchmark时，一张图表意外地将52.8的成绩显示得比69.1还要高，这一明显的失误迅速引发了网友的热议。网友们纷纷质疑，为何在全球直播的重要场合，会出现如此低级的错误。甚至有人调侃道，这博士水平的A

编程 openai 博士 benchmark aime 2025-08-08 20:00 3

MiniMax-M1：让AI推理不再昂贵的革命性突破

这项由MiniMax公司研究团队发表于2025年6月的突破性研究，介绍了世界首个开源的大规模混合注意力推理模型MiniMax-M1。这份发表在arXiv平台的论文（编号：arXiv:2506.13585v1），为有兴趣深入了解的读者提供了完整的技术细节和实验数

模型推理词汇 aime ai推理 2025-06-20 21:43 6

微软团队：如何让AI推理效率提升9倍？

在人工智能的世界里，有一个非常重要的发现正在改变我们对AI推理能力的理解。这项由微软研究院牵头，联合香港大学、华中科技大学、北京大学和清华大学的研究团队于2025年6月发表的突破性研究，为我们揭示了如何让AI模型在进行复杂推理时变得更加高效。感兴趣的读者可以通

quest 微软推理 aime ai推理 2025-06-16 17:08 7

OpenAI发布o3-pro，解决复杂问题效果好，但回复“Hi”也需三分钟

OpenAI 正式发布了其最新模型OpenAI o3-pro，这是其旗舰模型 o3 的专业增强版。o3-pro 专为需要“更长时间思考”的复杂任务而设计，其核心亮点在于极致的可靠性和准确性，尤其在数学、科学和编程等专业领域表现卓越。根据OpenAI引入的全新“

模型 openai 评测 diamond aime 2025-06-11 09:07 10

超越80/20法则：少数高熵词决定了大模型推理能力的提升

大模型的推理能力在近年来取得了显著进步，但这些进步背后的机制我们却知之甚少。来自阿里巴巴Qwen团队和清华大学LeapLab的研究人员在2025年6月的最新研究中，通过探索一个全新视角——词元（token）熵模式，揭示了强化学习在提升大模型推理能力过程中的工作

模型推理 aime 熵值低熵 2025-06-05 23:44 9

当你的母语说不出口：解锁AI多语言思维的权衡与挑战

近日，由荷兰格罗宁根大学的Jirui Qi和Arianna Bisazza，哈佛大学的Shan Chen和Zidi Xiong，阿姆斯特丹大学的Raquel Fernández，以及麻省总医院和波士顿儿童医院的Danielle S. Bitterman联合发表

推理语言泰语 aime 母语 2025-06-04 16:15 9

DeepSeek-R1-0528：学术写作的新纪元

2025年，人工智能在学术领域的应用迎来了新的突破。DeepSeek发布的最新版本模型——DeepSeek-R1-0528，在数学推理、代码生成等关键领域实现了飞跃式提升。该模型不仅在AIME 2025测试中准确率从70%飙升至87.5%，其推理深度也翻倍增长

aigc 学术写作 aime 段落 2025-06-04 11:12 8

o3崛起，但推理模型离“撞墙”只剩一年？

o1在AIME测试中的表现与训练计算资源的关系但推理算力一旦摸到天花板，增长速度可能就会从「几个月翻10倍」掉到「每年翻4倍」。如果推理训练和整体前沿算力差距只有几个数量级（如小于三个数量级），估计一年内增速就得放缓。推理真能Scaling吗？现实没那么简单。

模型推理显卡 aime o3 2025-05-31 17:42 10

国产模型推理暴涨87.5%，接近国际顶尖，AI解题多写23页草稿…..

日前，国内领先的大模型公司深度求索（DeepSeek）近日宣布，其旗舰模型DeepSeek R1已完成一次重要更新，新版命名为“DeepSeek-R1-0528”。此次升级在多个关键维度上实现了显著优化，尤其是在模型的推理深度、逻辑能力及内容生成质量方面，标志

模型推理赫拉 deepseek aime 2025-05-30 11:29 11

DeepSeek-R1-0528重磅升级！深度思考与创造力全面提升

DeepSeek R1模型近期迎来了其发展历程中的又一重要里程碑，全新版本DeepSeek-R1-0528正式亮相。此次迭代通过深度优化训练流程，显著增强了模型的逻辑推理与深度思考能力，使其在多个测试场景中均展现出了前所未有的高水平表现。

模型 deepseek 创造力逻辑推理 aime 2025-05-29 23:33 9

DeepSeek-R1-0528更新了什么？官方公布细节了

近日，DeepSeek R1模型迎来重要升级，最新版本DeepSeek-R1-0528正式发布。此次更新通过强化后训练过程，显著提升了模型的思维深度与推理能力，在多个领域展现出更优异的性能。

模型官方推理 aime cnmo 2025-05-29 21:02 6

DeepSeek-R1-0528更新了什么？官方说明：思考更深

近日，DeepSeek R1模型迎来重要升级，最新版本DeepSeek-R1-0528正式发布。此次更新通过强化后训练过程，显著提升了模型的思维深度与推理能力，在多个领域展现出更优异的性能。

模型官方推理 aime cnmo 2025-05-29 21:14 6

DeepSeek-R1-0528升级解析：深度思考与推理能力跃升新高度

昨日，深度求索公司宣布其DeepSeek R1模型已完成最新的小版本迭代，新版本被命名为DeepSeek-R1-0528。用户现在可以通过官方网站、App以及小程序进入对话界面，并启用“深度思考”功能，来体验这一最新版本。同时，API接口也已同步更新，且调用方

模型推理 api api接口 aime 2025-05-29 20:32 7

DeepSeek-R1 更新，思考更深，推理更强

据DeepSeek官方公众号透露，DeepSeek R1 模型已完成小版本升级，当前版本为 DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后，开启“深度思考”功能即可体验最新版本。API 也已同步更新，调用方式不变。

模型推理开源 api aime 2025-05-29 20:38 8

DeepSeek-R1-0528 更新官方详解：思考更深、推理更强

DeepSeek R1 模型昨日宣布完成小版本升级，当前版本为 DeepSeek-R1-0528。用户通过官方网站、App 或小程序进入对话界面后，开启“深度思考”功能即可体验最新版本。API 也已同步更新，调用方式不变。

官方推理开源 api aime 2025-05-29 20:16 8

华为攻克AI推理「想太多」问题！推理提速60%，准确率还高了

通过“串行分组 + 衰减奖励”的设计，在保证推理准确性的前提下，让模型学会提前终止思考，推理提速60%，生成更精确有用的答案。

华为推理 aime cot vanilla 2025-05-29 17:11 7

北大杨仝团队发布FairyR1模型：百分之五参数量数学和代码能力超越满血DeepSeek

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特定任务上实

模型代码数学 deepseek aime 2025-05-26 15:20 8

北大杨仝团队发布FairyR1模型：5%参数量数学和代码能力超越满血DeepSeek

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特定任务上实

模型代码数学 deepseek aime 2025-05-25 20:52 10