摘要:Mamba核心作者提出两种专为推理定制的注意力机制GTA和GLA,可将解码速度和吞吐量最高提升2倍;
生成式AI
一、 Mamba作者之一提出2种专为推理量身定制的注意力机制
1. Mamba核心作者提出两种专为推理定制的注意力机制GTA和GLA,可将解码速度和吞吐量最高提升2倍;
2. GTA是GQA的替代品,能减少约50%KV缓存使用,而GLA比DeepSeek使用的MLA解码速度更快;
3. 这些机制通过优化内存使用和计算逻辑,在不牺牲模型生成质量前提下提升大语言模型推理效率。
二、 Flowith的Agent Neo已全面开放,首个无限执行 Agent
1. Flowith推出Agent Neo,声称是全球首个支持无限执行、无限产出的AI Agent,已全面开放无需邀请码;
2. Agent Neo具备百万级token上下文能力,能完整记住整个知识图谱,解决AI"前说后忘"问题;
3. 该Agent支持3D、语音、音乐、视频、图像、游戏、网页等多模态内容生成和管理功能。
三、 FLUX.1 Kontext案例教程,这次真的解决主体一致性了?
1. FLUX.1 Kontext是一个统一框架解决多种图像任务的工具,特别擅长保持角色一致性,能在多轮编辑中保持人物外观;
2. 其核心优势包括出色的角色一致性保持、快速生成速度(10秒左右)和良好的风格迁移能力,可用于物体修改、背景替换等多种场景;
3. 目前存在的局限包括多轮编辑后质量退化、无法参考多图像、改变元素过多会报错,使用时应遵循"明确保留内容"的提示词原则。
四、 Fairies新通用AI Agent,可执行1000个操作,无邀请码
1. 北大校友开发的通用AI Agent"Fairies"支持执行深度研究、代码生成、发邮件等1000种操作,无需邀请码即可下载使用;
2. Fairies支持多款主流模型(GPT 4.1、Gemini 2.5 Pro、Claude 4),界面简洁,可实现文件管理、PDF转换等任务,并在进行重要操作前有用户确认环节;
3. 该工具由Fundamental Research实验室开发,团队成员多为北大校友,免费版支持无限聊天,专业版每月20美元可使用更多功能。
五、 ElevenLabs发布Conversational AI 2.0,让语音助手更懂人心
1. ElevenLabs发布Conversational AI 2.0,实现了自然转换对话能力,能识别语气词判断用户意图,避免尴尬停顿和不当打断;
2. 新系统集成了多语言自动识别功能和检索增强生成(RAG)技术,支持多模态交互,一个AI助手可同时处理文本和语音;
3. 该系统面向企业级应用,提供HIPAA合规、EU数据驻留等安全措施,支持批量呼叫和第三方系统集成,适用于客服、医疗等多个行业场景。
六、 谷歌低调上线AI Edge Gallery,开源的手机本地AI运行器
1. 谷歌发布实验性Alpha版本应用Google AI Edge Gallery,允许用户在手机上本地运行来自Hugging Face的AI模型;
2. 该应用目前支持Android平台,即将登陆iOS,所有模型均离线运行,无需互联网连接,直接使用手机处理器完成计算;
3. 应用提供图像生成、问题解答、代码编写等功能,采用Apache 2.0许可证开源,可通过GitHub下载,性能表现取决于设备配置和模型大小。
前沿科技
七、 250美元、开源,Hugging Face 发布史上最亲民人形机器人
1. Hugging Face发布两款开源人形机器人:全尺寸HopeJR(约3000美元)和桌面级Reachy Mini(约250-300美元),预计年底开始发货;
2. HopeJR拥有66个驱动自由度,可行走和移动手臂,人类可通过专用手套远程控制它,目前仅能在3D模拟环境中行走;
3. Reachy Mini外形类似乌龟,采用矩形外壳设计,特点是可伸缩颈部,适合用于开发和测试AI应用,这些机器人完全开源,任何人都能组装和了解其工作原理。
报告观点
八、 340页AI报告:AI「太空竞赛」、下一个10亿用户机会
1. 互联网女皇Mary Meeker暌违六年后发布340页AI趋势报告,指出AI推理成本两年内已暴降99.7%,中国模型正以极低成本崛起;
2. OpenAI估值达3000亿美元(收入33倍)但面临成本挑战,中国AI模型成本或仅为GPT-4.5的0.2%,DeepSee等正在明显后来居上;
3. 印度成为其第二大市场(13.5%)超过美国(8.9%),报告预测下一个10亿用户将跳过传统应用层,直接进入以AI智能体为中心的生态系统。
九、 OpenAI COO Lightcap首度披露下一代 AI 入口的若干判断
1. OpenAI COO Lightcap披露AI正从对话模型向全能智能体转变,企业服务ChatGPT Enterprise已拥有超300万付费席位,比2月增长50%;
2. OpenAI正推进"OpenAI for Countries"国家级AI架构,与阿联酋合作建设"Stargate"超级基础设施,将AI从企业需求扩展到国家级应用;
3. OpenAI与Jony Ive合作开发下一代AI设备,目标是创造超越手机App的"个人化"计算体验,强调环境化交互模式,将重新定义硬件交互范式。
十、 LeCun新作:AI连「鸟」都搞不懂,拿什么超越人类?
1. 图灵奖得主LeCun与斯坦福团队最新研究表明大语言模型在粗分类任务表现优秀,但在精细语义任务中失效,无法理解概念典型性;
2. 研究通过信息论框架揭示LLM与人类认知的本质差异:LLM追求极致统计压缩,而人类追求适应性语义丰富度,导致两者在理解"鸟"等概念时有根本错位;
3. 这一发现质疑了当前LLM通往AGI的路径,表明简单增大模型规模可能无法实现真正的类人理解,需要重新思考优化目标和方法。
👇加入AGI数据库,AI智能问答
👇订阅下方合集,获取每日推送
来源:腾讯研究院