腾讯研究院AI速递 20241206

B站影视 2024-12-06 00:01 2

摘要:从12月5日起,OpenAI将举行为期12天的活动,发布多个新产品,包括Sora、ChatGPT语音增强、GPT-4o图像功能等;

生成式AI

一、 OpenAI圣诞大礼包连更12天!满血版o1、Sora确认亮相

1. 从12月5日起,OpenAI将举行为期12天的活动,发布多个新产品,包括Sora、ChatGPT语音增强、GPT-4o图像功能等;

2. 奥特曼确认AGI将在2025年初步实现,但强调其影响将较小,不会立即改变世界经济;

3. OpenAI对与微软的合作进行策略调整,计划在AGI实现时解除与微软的商业协议。

二、 谷歌 Genie 2 世界模型发布,还要和马斯克一起做AI游戏

1. Google DeepMind发布Genie 2,基于单张图像生成无限3D环境,支持人类与AI互动;

2. Genie 2支持动态交互、动作控制、长跨度记忆和多样环境生成,推动3D世界模型广泛应用;

3. 与李飞飞的World Labs对比,Genie 2侧重视频扩散和像素预测,而World Labs更注重物理世界建模。

三、 英伟达全新Star Attention,10倍加速推理,登顶HF论文榜

1. Star Attention显著提高LLM推理速度,在长上下文任务中加速比高达11倍,同时精度损失极小;

2. 通过将上下文分块处理,Star Attention有效降低计算成本,支持边缘设备处理更长序列;

3. Star Attention无缝集成至现有大模型,减少内存需求,实现更高效的推理,适用于本地和云端部署。

四、 AI Pin 失利后,Humane 公司押注 CosmOS AI 生态系统

1. Humane发布的CosmOS是由多个智能代理组成的AI驱动操作系统,专为智能设备和复杂任务设计;

2. CosmOS支持多种输入方式,代理能自主学习和协作,实时适应用户需求,确保任务相关性;

3. 核心组件Ai Bus协调任务分配和数据共享,确保代理高效协作,自动寻找替代方案应对问题。

五、 央企 AI 视频模型发布,2032年全球视频类规模将超180亿

1. 中国电信发布首个全自研的AI视频生成模型,支持全流程视频制作,涵盖脚本编写、拍摄、剪辑等;

2. 该模型在VBench评测中排名第一,展现出高水平的画面稳定性、语义一致性和动作流畅度;

3. 预计2032年全球AI视频生成市场将达180亿美元;TeleAI致力于推动AI产业应用,并与多家企业合作推进技术发展。

六、 Lilian Weng加盟Fellows Fund,助力AI探索与下一代创业者

1. 前OpenAI副总裁Lilian Weng加盟Fellows Fund,担任Distinguished Fellow,推动AI研究与投资;

2. Weng在OpenAI期间,推动AI安全技术进步,尤其在大型语言模型和对抗鲁棒性方面;

3. Fellows Fund专注于早期AI投资,已支持30余家初创企业,并致力于为创业者提供资源与资本支持。

七、 谜底揭晓!David Mayer等名字,ChatGPT死活都不说的原因

1. ChatGPT拒绝说出“David Mayer”名字,因其涉及隐私保护措施;

2. 该名字与几个申请“被遗忘权”的人相关,OpenAI出于避免法律诉讼而屏蔽了这些名字;

3. 通过UI输出和API调用等方式,仍可绕过这一限制,OpenAI已确认并修复该问题。

前沿科技

八、 Nature重磅:DeepMind GenCast,8分钟预测15天全球天气

1. DeepMind的AI模型GenCast能在8分钟内提供15天全球天气预报,且精度超过现有最先进的天气系统;

2. GenCast通过条件扩散模型生成多种天气场景,特别在极端天气、热带气旋和风能预报中表现突出;

3. 相比传统预报方法,GenCast在预报速度、准确性和不确定性量化方面实现显著突破,推动天气预报领域向AI化发展。

报告观点

九、 红杉美国:2025 年AI 智能体将进入“群体协作”的Agent元年

1. 2025年起,AI智能体将进入“群体协作”时代,多个智能体将协作或对抗,完成复杂任务;

2. 医疗和教育等领域将成为AI技术的关键战场,AI能有效降低成本,提高社会效率;

3. AI的潜力巨大,智能体将在增强人类能力的同时,也能独立完成任务,推动各行业的变革。

十、 对话DeepMind资深科学家:大模型时代AlphaZero依然重要

1. 强化学习仍然是AI领域的重要研究方向,尤其在大语言模型和通用AI(AGI)实现中起到关键作用;

2. AI对医疗等领域具有巨大潜力,但要投入使用需要谨慎设计和长期验证;

3. AGI是远期目标,当前大语言模型虽然具备通用能力,但仍有局限性,未来的进展取决于AI社区的创造力和灵感。

来源:腾讯研究院

相关推荐