token资讯_B站影视

谷歌杀疯！百万token神器免费开源，Claude和Codex都顶不住了？

谷歌扔下重磅炸弹：AI编程工具Gemini CLI，开源！免费！权限拉满！百万token上下文、千次调用额度、VS Code+终端全打通，谷歌彻底掀桌子：开发者的终端，要定了！

谷歌 claude 开源 token codex 2025-06-27 14:49 3

苹果出手！改进GRPO，让dLLM也能高效强化学习

不同于基于 Transformer 的自回归式语言模型，dLLM 基于掩码式扩散模型（masked diffusion model / MDM），此前我们已经报道过 LLaDA 和 Dream 等一些代表案例，最近首款实现商业化的 dLLM 聊天机器人 Mer

苹果 token 掩码 grpo dllm 2025-06-27 14:32 1

AI需要「像人类」那样思考？AlphaOne揭示大模型的「思考之道」

本文共同第一作者为张均瑜与董润沛，分别为伊利诺伊大学厄巴纳-香槟分校计算机科学研究生与博士生；该研究工作在伊利诺伊大学厄巴纳-香槟分校张欢教授与 Saurabh Gupta 教授，加州大学伯克利分校 Jitendra Malik 教授的指导下完成。

模型推理厄巴纳 token alphaone 2025-06-23 17:36 3

Token Pocket钱包的未来展望：技术与市场的趋势

Token Pocket作为多个区块链平台的数字资产钱包，已经构建了一个强大的用户基础，与众多去中心化应用(D App)和服务紧密相连。随着区块链和加密货币市场的迅猛发展，Token Pocket未来的发展具有广阔的前景。以下是关于Token Pocket未来

pocket token tokenpocket pocke 2025-06-21 18:00 5

14款大模型能耗爆炸：DeepSeek竟然第一

生成式AI正以前所未有的速度渗透进我们的日常生活，但鲜少有人关注其背后的环境代价。OpenAI CEO Sam Altman曾透露，ChatGPT单次查询平均消耗0.34瓦时能源，相当于烤箱运行1秒多的耗电量，但凭借AI公司偶尔披露的零星数据，研究者无法对模型

模型 deepseek token 碳排量抽象代数 2025-06-20 20:46 6

推理走向舞台中央，自主可控大势所趋，Agent及多模态加速

1) 受益于大厂加速AI与业务结合、Agent及多模态加速渗透，AI算力消耗开始从训练走向推理，并带来显著的算力增量。建议重视海外算力新技术以及增量变化，尤其是随着机柜式方案放量，重点关注液冷、PCB、铜连接等领域。

模态推理自主 agent token 2025-06-18 02:30 7

Hugging Face集成Groq，三行代码实现10个开源模型推理速度超每秒800 token

美国AI芯片创企Groq昨天宣布，其已正式成为Hugging Face Hub支持的推理服务提供商，推理服务已无缝集成至Hugging Face的JS和Python客户端SDK，开发者可便捷地将各类模型与优选服务提供商对接使用。

推理三行 token groq 三行代码 2025-06-17 19:56 5

为什么混合专家模型（MoE）如此高效从架构原理到技术实现全解析

在人工智能技术快速演进的背景下，大型语言模型的架构设计始终围绕仅解码器（decoder-only）的Transformer结构展开。自第一个GPT模型发布以来，该架构已成为主流设计范式。尽管研究人员在效率优化方面进行了诸多改进，但核心架构结构保持相对稳定。

模型架构路由 moe token 2025-06-12 07:08 5

KAIST团队：如何让AI模型更高效？

想象一下，如果你的手机能够在处理复杂任务时既快速又节能，那该多好？韩国科学技术院（KAIST）的研究团队刚刚在2025年3月的《机器学习研究汇刊》上发表了一项令人兴奋的研究成果，他们开发出了一种让人工智能模型变得更高效的全新方法。这项研究的第一作者是宋佑民（W

模型 mamba token kaist kaist团队 2025-06-11 17:28 7

「Next-Token」范式改变！刚刚，强化学习预训练来了

在 2016 年的一次演讲中，Yann LeCun 曾将强化学习比喻成蛋糕上的樱桃。他提到，「如果把智能比作一块蛋糕，那么无监督学习就是蛋糕的主体，监督学习就是蛋糕上的糖霜，而强化学习则是糖霜上的樱桃。我们已经知道如何制作糖霜和樱桃，但却不知道如何制作蛋糕本身

训练范式 llm token rpt 2025-06-11 12:39 4

刚刚，OpenAI最强推理模型o3-pro诞生！碾压Gemini 2.5 Pro击穿底价

最强推理模型一夜易主！深夜，o3-pro毫无预警上线，刷爆数学、编程、科学基准，强势碾压o1-pro和o3。更惊艳的是，o3价格直接暴降80%，叫板Gemini 2.5 Pro。

gemini openai opus 底价 token 2025-06-11 09:15 5

QwenLong-L1横空出世：强化学习让大模型“长记性”，长文档推理新王者？

各位AI圈的老铁们，今天咱们来聊点硬核又不失风趣的话题——长上下文推理大模型的新晋王者：QwenLong-L1。别急着划走，这不是广告，而是一次技术圈的“吃瓜”现场，瓜保熟，技术干货管够！

模型推理 llm rl token 2025-06-10 08:31 4

Token纪元：从「马力」到「人天」再到「兆字元时」的认知革命

马力神话：瓦特用“马力”将蒸汽机抽象为直观生产力符号，0.9 马力的奔驰汽车开启了机器替代牛马的时代。人天困境：知识经济用“人天”量化脑力劳动，但效率参差、996 文化暴露其本质缺陷——无法衡量真实价值。AI 冲击：当 AGI 完成“30 人天”任务仅需“1

纪元马力革命 token token纪元 2025-06-09 16:36 6

AI七个月突破数学家“围剿”反超人类！14数学家深挖原始推理token

从只能答对2%的题目，到在超难数学题集中刷下22%得分，甚至超过人类团队平均水平，大模型需要多长时间？

模型推理 token 推理token frontierma 2025-06-09 16:25 4

ICML 2025 | 全局池化+局部保留，CCA-Attention为LLM长文本建模带

琶洲实验室、华南理工大学联合推出关键上下文感知注意力机制（CCA-Attention），实现超长文本的高效上下文建模。在 128K 超长序列上下文建模任务中，CCA-Attention 的推理速度是标准自注意力机制的 7.9 倍，同时键值缓存（KV Cache

llm 建模 icml token cache 2025-06-09 12:35 5

别把AI当助理了，5个日常场景让它当你的“助理教练”

把AI当助理，这个说法其实藏着一个问题——大多数人其实并没有真正拥有过助理，所以根本不知道怎么更好地使用一个“助理”。很多人对助理的印象，可能是来自影视剧：老板一个眼神、一句话，助理就能立刻心领神会，知道接下来要做什么。

gemini 教练蓝军 token 助理教练 2025-06-08 12:52 4

别再乱用401！权限判断不清楚，系统体验直接拉垮！

我以前在项目里整合权限控制模块时，刚好遇到过 HTTP 状态码 401 和 403 的那些坑，真的是一不小心就给自己挖个大洞，权限逻辑一写错，整个接口响应就乱套。所以今天就来聊聊这俩状态码到底咋回事，它们长得像，但用错了真的会让前端和后端互相甩锅。

user mess token json forbidden 2025-06-06 18:39 5

哈佛大学等团队：Token压缩技术如何重塑生成式AI

在2025年5月发表于arXiv的一篇前沿研究论文中，来自哈佛大学、东北大学、中国科学院、武汉大学、麻省理工学院和北京大学的多位研究者联合提出了一个颠覆性观点：Token压缩不仅仅是提高AI模型运行效率的工具，更应该成为生成式AI模型设计的核心原则。这项由Zh

模态推理哈佛大学 cot token 2025-06-03 16:41 5

哈佛等顶尖学府研究Token压缩，重塑生成式AI未来

在2025年5月发表于arXiv的一篇前沿研究论文中，来自哈佛大学、东北大学、中国科学院、武汉大学、麻省理工学院和北京大学的多位研究者联合提出了一个颠覆性观点：Token压缩不仅仅是提高AI模型运行效率的工具，更应该成为生成式AI模型设计的核心原则。这项由Zh

模态研究哈佛学府 token 2025-06-03 11:51 6

基于内存高效算法的 LLM Token 优化：有效降低 API 成本的技术方案

在使用 OpenAI、Claude、Gemini 等大语言模型 API 构建对话系统时，开发者普遍面临成本不断上升的挑战。无论是基于检索增强生成（RAG）的应用还是独立的对话系统，这些系统都需要维护对话历史以确保上下文的连贯性，类似于 ChatGPT 对历史对

llm 算法 api 内存 token 2025-06-01 18:49 5