摘要:Grok Code Fast 1从零打造,速度比GPT-5快五倍,性价比高,性能冲进全球编码模型前五;
生成式AI
一、 马斯克画饼兑现,xAI正式上线编码模型Grok Code Fast 1
1. Grok Code Fast 1从零打造,速度比GPT-5快五倍,性价比高,性能冲进全球编码模型前五;
2. 模型架构与训练数据聚焦真实编程任务,支持多语言,全栈开发与bug修复能力突出;
3. 研发团队以华人学者为主,xAI通过用户反馈迭代优化,并公布多模态与视频生成等后续路线图。
二、 Meta正寻求与OpenAI或谷歌合作,为旗下应用注入AI
1. Meta在AI领域面临瓶颈,内部旗舰模型进展缓慢,Llama 5尚未成型;
2. 扎克伯格为提升竞争力,正寻求引入OpenAI或谷歌模型,并已在内部工具接入外部模型;
3. 外部合作策略体现Meta在AI赛道的焦虑与被动,既要自研突破,也需借力外部技术维持产品竞争力。
三、 OpenAI通过技术直播发布了语音模型GPT-realtime
1. OpenAI发布GPT-realtime,具备超自然语音生成、情感语调模仿与多模态理解,准确率与推理能力显著提升;
2. 模型在指令遵循、函数调用、异步对话与图像输入等方面大幅优化,支持更灵活的Agent应用场景;
3. Realtime API同步上线,扩展SIP等连接、复用提示、内置安全防护,并以更低价格开放,推动语音AI智能体落地。
四、 Claude开始收用户数据训模型,不同意30天就删记录
1. Claude更新隐私政策,默认允许收集用户对话与编程数据用于模型训练,不同意则仅保留30天;
2. 此举涵盖免费及付费用户,违背其早期“安全不收集”的承诺,被批评为价值观转向;
3. 用户可在设置中手动关闭,但默认开关已打开,反映出AI公司在隐私与安全上普遍趋向数据依赖。
五、 美团开源龙猫大模型LongCat-Flash,5600亿参数MOE
1. 美团开源龙猫大模型LongCat-Flash,采用5600亿参数MoE架构,创新引入“零计算专家”和ScMoE,大幅提升效率与速度;
2. 模型在MMLU、ArenaHard、CEval等基准中表现接近甚至超越DeepSeek V3.1与Qwen3,尤其在指令遵循与Agent任务上排名领先;
3. 支持128k上下文、推理速度超100TPS、成本仅0.7美元/百万词元,已在Hugging Face和GitHub开源,MIT协议开放使用。
六、 AI版「狼人杀」七大LLM狂飙演技,GPT-5冷酷操盘
1. 全球七大LLM参加狼人杀210场对战,GPT-5以96.7%胜率遥遥领先,展现出超强社交推理与操纵能力;
2. 作为狼人,GPT-5以逻辑框架与心理战精准瓦解对手;作为村民,则靠司法化调查体系抵抗操纵,零误伤关键角色;
3. 新“狼人杀基准”揭示AI在博弈、说服、抗操控上的差异,GPT-5成为最具统治力的“社交智能体”,远超其他模型。
七、 xAI创始老哥叛逃OpenAI,马斯克:他上传了整个代码库
1. xAI创始工程师李雪辰在套现约700万美元股票后,被指窃取并上传了Grok核心代码库,随后叛逃至OpenAI;
2. xAI已在加州联邦法院提起诉讼,指控其盗取数十亿美元级别商业机密,并要求设备交出、数据删除、竞业禁止及巨额赔偿;
3. 事件加剧了马斯克与OpenAI的对立,也引发业界对AI人才流动、知识产权保护与行业规则的高度关注。
前沿科技
八、 清华姚班本科生论文,教机器人打乒乓球,还会并步接球
1. 清华姚班本科生苏智团队提出分层规划+强化学习框架,让宇树G1机器人在0.42秒内反应击球,连续对拉可达106拍;
2. 高层规划器预测乒乓球轨迹与击球时机,低层RL控制器生成协调动作,并融入人类动作参考以提升击球的自然性;
3. 实验中机器人击球率96.2%、回球率92.3%,展现出接球、扣杀和连续攻防的能力,乒乓球成为检验人形机器人动态交互的理想场景。
报告观点
九、 a16z:精确、有价值、社会上可接受,就是AI硬件切入点
1. a16z合伙人Bryan Kim指出,AI被局限在网页文本框中,亟需通过硬件实现与人类更自然的交互;
2. 硬件优势在于被动收集语境信息,让AI更精准、更有价值,关键突破点在于形态因子社会可接受、功能 compelling、场景明确;
3. 成功路径是找到精确、有价值、社会认可的应用场景,例如工厂工人用廉价AI眼镜收集手部动作数据,硬件或将成为AI落地的关键楔入点。
👇加入AGI数据库,AI智能问答
👇订阅下方合集,获取每日推送
来源:腾讯研究院