摘要:谷歌推出DiLoCo训练方法,比传统数据并行方式更稳健、高效,可在多数据中心大规模训练大语言模型;
生成式AI
一、 谷歌全新Scaling Law!DiLoCo被证明更好、更快、更强
1. 谷歌推出DiLoCo训练方法,比传统数据并行方式更稳健、高效,可在多数据中心大规模训练大语言模型;
2. DiLoCo在大模型训练中表现出色,能降低带宽需求、容忍更大批处理,随模型规模增大优势更明显;
3. AI行业面临发展岔路:继续Chinchilla路线增加算力与数据,或转向推理模型等轻量级替代方案,差距或达3万亿美元。
二、 谷歌Gemini全新升级!深度研究全球免费体验,可定制
1. 谷歌Gemini重大升级,推出2.0 Flash Thinking功能,拥有1M超长上下文窗口,能自动拆解复杂问题提高推理能力;
2. Deep Research功能全球免费开放,支持45种语言,与OpenAI每月200美元的同类服务形成鲜明对比;
3. Gemini新增应用互联能力和Gems自定义功能,可实现多应用协作完成复杂任务,用户可量身定制各类AI专家。
三、 破解国产芯片部署难题,清华开源“赤兔Chitu"大模型引擎
1. 清华大学与清程极智联合开源"赤兔Chitu"大模型推理引擎,首次实现在非英伟达H系列GPU和国产芯片上原生运行FP8精度模型;
2. 该引擎解决了DeepSeek等FP8模型对英伟达Hopper架构依赖问题,测试显示在A800集群中可减少50%GPU使用量同时速度提升3.15倍;
3. 赤兔引擎支持低延迟、高吞吐、小显存三方面优化,加速"国产大模型+国产引擎+国产芯片"技术闭环形成,降低企业部署AI模型门槛和成本。
四、 0行代码打造3D游戏,「vibe coding」开发30分爆赚28万
1. 氛围编程(vibe coding)让开发者通过自然语言描述实现游戏开发,无需编写代码;
2. 借助Claude Sonnet 3.7和Three.js等AI工具,可快速制作3D游戏,包括赛车、飞行等多类型;
3. 有开发者30分钟内完成类微软模拟飞行的3D游戏并获利28万,但过度依赖AI可能带来维护问题。
五、 米哈游创始人蔡浩宇的AI游戏,刚刚终于正式曝光了
1. 米哈游创始人蔡浩宇创立AI公司Anuttacon,推出AI智能体语音交互游戏《Whispers from the Star》;
2. 游戏采用动态叙事模式,玩家通过语音与角色Stella互动,影响剧情发展;
3. Anuttacon目标不仅是开发单款游戏,而是打造AI平台,实现可定制化的智能体交互体验。
六、 OpenAI 正式提案要求禁用 DeepSeek,呼吁打压中国 AI
1. OpenAI向美国政府提交15页提案,呼吁禁止DeepSeek,指控其极度不安全且侵犯知识产权;
2. 建议政府为AI公司提供州级法规豁免权,以应对中国AI竞争,维持美国领先地位;
3. 提出五大建议:预防措施、出口管制、版权改革、基础设施建设和政府AI应用。
前沿科技
七、 「品尝」电影里的蛋糕?智能「电子舌头」或将满足你的愿望
1. 美国俄亥俄州立大学等研发e-Taste系统,通过传感器和无线化学分配器实现远程味觉感知;
2. 系统可识别并复制五种基本味道(甜、酸、咸、苦、鲜),通过电信号远程传输实现虚拟美食体验;
3. 技术可应用于VR/AR、远程食品品鉴、医疗康复等领域,有望帮助味觉障碍患者。
八、 马斯克公开时间表称“星舰”明年登陆火星!将搭载“擎天柱”
1. 马斯克宣布"星舰"将于2026年底搭载"擎天柱"机器人登陆火星;
2. 载人火星任务预计2029年至2031年间实施,时间表多次调整;
3. "星舰"火箭全长120米,由"超级重型"助推器和"星舰"飞船组成,可重复使用。
报告观点
九、 对话Manus肖弘:Manus和Monica,创始人的完整思考
1. 模型能力正在外溢,AI应用公司可以吃掉它,应用公司需要快速创新并抓住机会;
2. 创业者应该预判下一个能力是什么,提前做好应用准备,等待模型能力变强,而不是等模型能力出现再开始;
3. 创业者应该用博弈而非逻辑推理的方式思考,当意识到自己在创新和领先时要更激进,并且要积极全球化。
十、 对话 LOOI:硬件作为内容,像设计生命一样设计机器人
1. LOOI是一款基于手机终端的AI机器人,将手机作为"大脑"与用户交互,团队将其定位为有生命感的硅基生命体,而非单纯的工具;
2. 团队旗帜鲜明地拒绝用户自定义LOOI性格,而是通过与用户的互动逐渐形成独特性格,希望用户将其视为真实的生命体而非可随意改变的角色;
3. 团队将硬件视为内容本身而非终端,强调物理形态与交互形式的统一性,注重体验而非功能,并具备丰富的内容带宽。
来源:腾讯研究院