腾讯研究院AI速递 20250603

摘要：Mamba核心作者提出两种专为推理定制的注意力机制GTA和GLA，可将解码速度和吞吐量最高提升2倍；

生成式AI

一、 Mamba作者之一提出2种专为推理量身定制的注意力机制

1. Mamba核心作者提出两种专为推理定制的注意力机制GTA和GLA，可将解码速度和吞吐量最高提升2倍；

2. GTA是GQA的替代品，能减少约50%KV缓存使用，而GLA比DeepSeek使用的MLA解码速度更快；

3. 这些机制通过优化内存使用和计算逻辑，在不牺牲模型生成质量前提下提升大语言模型推理效率。

二、 Flowith的Agent Neo已全面开放，首个无限执行 Agent

1. Flowith推出Agent Neo，声称是全球首个支持无限执行、无限产出的AI Agent，已全面开放无需邀请码；

2. Agent Neo具备百万级token上下文能力，能完整记住整个知识图谱，解决AI"前说后忘"问题；

3. 该Agent支持3D、语音、音乐、视频、图像、游戏、网页等多模态内容生成和管理功能。

三、 FLUX.1 Kontext案例教程，这次真的解决主体一致性了？

1. FLUX.1 Kontext是一个统一框架解决多种图像任务的工具，特别擅长保持角色一致性，能在多轮编辑中保持人物外观；

2. 其核心优势包括出色的角色一致性保持、快速生成速度(10秒左右)和良好的风格迁移能力，可用于物体修改、背景替换等多种场景；

3. 目前存在的局限包括多轮编辑后质量退化、无法参考多图像、改变元素过多会报错，使用时应遵循"明确保留内容"的提示词原则。

四、 Fairies新通用AI Agent，可执行1000个操作，无邀请码

1. 北大校友开发的通用AI Agent"Fairies"支持执行深度研究、代码生成、发邮件等1000种操作，无需邀请码即可下载使用；

2. Fairies支持多款主流模型（GPT 4.1、Gemini 2.5 Pro、Claude 4），界面简洁，可实现文件管理、PDF转换等任务，并在进行重要操作前有用户确认环节；

3. 该工具由Fundamental Research实验室开发，团队成员多为北大校友，免费版支持无限聊天，专业版每月20美元可使用更多功能。

五、 ElevenLabs发布Conversational AI 2.0，让语音助手更懂人心

1. ElevenLabs发布Conversational AI 2.0，实现了自然转换对话能力，能识别语气词判断用户意图，避免尴尬停顿和不当打断；

2. 新系统集成了多语言自动识别功能和检索增强生成(RAG)技术，支持多模态交互，一个AI助手可同时处理文本和语音；

3. 该系统面向企业级应用，提供HIPAA合规、EU数据驻留等安全措施，支持批量呼叫和第三方系统集成，适用于客服、医疗等多个行业场景。

六、谷歌低调上线AI Edge Gallery，开源的手机本地AI运行器

1. 谷歌发布实验性Alpha版本应用Google AI Edge Gallery，允许用户在手机上本地运行来自Hugging Face的AI模型；

2. 该应用目前支持Android平台，即将登陆iOS，所有模型均离线运行，无需互联网连接，直接使用手机处理器完成计算；

3. 应用提供图像生成、问题解答、代码编写等功能，采用Apache 2.0许可证开源，可通过GitHub下载，性能表现取决于设备配置和模型大小。

前沿科技

七、 250美元、开源，Hugging Face 发布史上最亲民人形机器人

1. Hugging Face发布两款开源人形机器人：全尺寸HopeJR(约3000美元)和桌面级Reachy Mini(约250-300美元)，预计年底开始发货；

2. HopeJR拥有66个驱动自由度，可行走和移动手臂，人类可通过专用手套远程控制它，目前仅能在3D模拟环境中行走；

3. Reachy Mini外形类似乌龟，采用矩形外壳设计，特点是可伸缩颈部，适合用于开发和测试AI应用，这些机器人完全开源，任何人都能组装和了解其工作原理。

报告观点

八、 340页AI报告：AI「太空竞赛」、下一个10亿用户机会

1. 互联网女皇Mary Meeker暌违六年后发布340页AI趋势报告，指出AI推理成本两年内已暴降99.7%，中国模型正以极低成本崛起；

2. OpenAI估值达3000亿美元(收入33倍)但面临成本挑战，中国AI模型成本或仅为GPT-4.5的0.2%，DeepSee等正在明显后来居上；

3. 印度成为其第二大市场(13.5%)超过美国(8.9%)，报告预测下一个10亿用户将跳过传统应用层，直接进入以AI智能体为中心的生态系统。

九、 OpenAI COO Lightcap首度披露下一代 AI 入口的若干判断

1. OpenAI COO Lightcap披露AI正从对话模型向全能智能体转变，企业服务ChatGPT Enterprise已拥有超300万付费席位，比2月增长50%；

2. OpenAI正推进"OpenAI for Countries"国家级AI架构，与阿联酋合作建设"Stargate"超级基础设施，将AI从企业需求扩展到国家级应用；

3. OpenAI与Jony Ive合作开发下一代AI设备，目标是创造超越手机App的"个人化"计算体验，强调环境化交互模式，将重新定义硬件交互范式。

十、 LeCun新作：AI连「鸟」都搞不懂，拿什么超越人类？

1. 图灵奖得主LeCun与斯坦福团队最新研究表明大语言模型在粗分类任务表现优秀，但在精细语义任务中失效，无法理解概念典型性；

2. 研究通过信息论框架揭示LLM与人类认知的本质差异：LLM追求极致统计压缩，而人类追求适应性语义丰富度，导致两者在理解"鸟"等概念时有根本错位；

3. 这一发现质疑了当前LLM通往AGI的路径，表明简单增大模型规模可能无法实现真正的类人理解，需要重新思考优化目标和方法。

👇加入AGI数据库，AI智能问答

👇订阅下方合集，获取每日推送

来源：腾讯研究院

标签：腾讯 llm 速递 agent fairies

本文地址：http://news.43b.com.cn/a/448400.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐