2025人工智能十大趋势

B站影视 内地电影 2025-08-31 09:49 1

摘要:强化学习(Reinforcement Learning, RL)正在大语言模型领域引发一场深刻的范式变革。当前,强化学习在大语言模型中的应用正从最初的人类反馈强化学习(RLHF)⸺主要旨在使模型输出符合人类偏好⸺向基于可验证奖励的强化学习(RLVR) 大规模演

前言

在2025世界人工智能大会(WAIC)腾讯论坛上,腾讯研究院联合腾讯优图、腾讯云智能和腾讯科技正式发布《「共生伙伴」2025人工智能十大趋势报告》。

Part I 基础模型的跃迁

趋势01

强化学习:引领大模型推理和行动能力新突破

强化学习(Reinforcement Learning, RL)正在大语言模型领域引发一场深刻的范式变革。当前,强化学习在大语言模型中的应用正从最初的人类反馈强化学习(RLHF)⸺主要旨在使模型输出符合人类偏好⸺向基于可验证奖励的强化学习(RLVR) 大规模演进。RLVR将奖励信号直接绑定到客观、可验证的结果上(例如编程或数学问题的正确答案),从而将优化目标从“听起来 正确”转向“确实正确”,显著提升了大模型的核心推理能力。这种转变正推动大模型超越简单的内容生成,向解决实际问题、实现复杂目标的高级智能迈进。这一进展背后,隐藏着一个深刻的洞察:许多复杂任务的“验证不对称性”(Asymmetry of Verification)⸺即验证解决方案远比找到解决方案本身容易。正如“验证者定律”所揭示的,AI训练的效率与任务的可验证性成正比,可验证性为强化学习提供了高效、高质量的反馈信号。基于此,本报告提出强化学习驱动大模型演进的四大关键趋势:从对齐到创造:强化学习重塑大模型推理能力;智能体飞跃:强化学习构筑连接模型与物理及数字世界的桥梁;深耕垂直领域:强化学习协助克服数据与安全瓶颈,赋能专业化模型;涌现集体智能:强化学习驱动多智能体协作解决复杂系统性问题整体来看,强化学习正通过利用任务的可验证性,全面驱动大模型从语言智能迈向行动智能、具身智能与集体智能,预示着AI在解决现实世界问题上的巨大飞跃。

趋势02

原生多模态生成:统一感知与生成的新时代

人工智能的早期发展主要聚焦于单一模态,如计算机视觉专注于图像理解,自然语言处理专注于文本分析。面对多模态任务,传统方法多采用“后期融合”或“拼接式”策略,即分别训练模态独立的模型,再通过额外模块简单组合其输出。这种方式虽然在一定程度上实现了多模态信息的利用,但各模态间的交互浅层,信息在传递过程中容易丢失,难以捕捉跨模态间深层次的语义关联,也无法实现真正意义上的“联合生成”。进入深度学习时代,特别是随着Transformer架构的突破性成功,为彻底的多模态整合铺平了道路。这催生了“原生多模态模型”(Natively Multimodal Models),其核心理念在于从架构设计之初就将多种模态(如文本、图像、音频、视频)视为一个统一的输入空间。通过共享或紧密耦合的表示层,模型能够实现跨模态信息的深度交互、对齐与融合。这种“原生”设计让模型能在单一框架内同时完成多模态的联合感知,并基于模态间深度关联的理解进行多模态生成。从OpenAI 的 GPT-4o 实现文本、图像、音频的无缝交互,到 Sora、Veo3 等模型在视频生成领域的突破,这些标志性成果无不预示着统一感知与生成新时代的全面到来,即将改变多个行业的范式。

趋势03

声音模型广进化:迈向通情达义的情感智能

声音模型正快速迈向具备情感智能的新阶段,成为推动人机交互自然化、个性化的核心技术力量。从早期的机械朗读发展到具备语境理解和情感表达能力的语音合成系统,再到可创作完整音乐作品和驱动视觉内容生成的多模态声音智能,AI声音技术正在实现从“工具”到“伙伴”的跃迁。声音的实时性与情感表达优势,使其在未来的VoiceAgent、沉浸式内容创作、教育与医疗辅助等领域具备广阔应用前景。随着模型个性化、低延迟和端侧部署的进步,声音智能将走向更贴近用户、更普惠的交互形态,开启“人人皆可创、处处能互动”的智能新时代。

智能行动者的崛起

趋势04

智能体双轨进化:编排类与端到端的分途并进

AI Agent作为人工智能领域的重要发展方向,正经历着从概念验证向生产应用的关键转变。自2023年探索性发展至今,AI Agent已逐渐分化为两条主要技术路线:编排类Agent(Orchestration-based Agents)和端到端Agent模型(End-to-End Agent Models)。编排类Agent采用"外挂式"架构,将大语言模型作为中央决策器,通过预定义的代码路径编排LLM与外部工具、API的交互,实现复杂任务分解与执行。端到端Agent模型则采用"内化式"架构,通过强化学习等技术将推理、规划、工具使用等能力直接训练到模型内部,让模型能够动态指导自己的过程和工具使用。以OpenAI的o3、DeepResearch等为代表,这一路线仍处于早期阶段,但在特定专业领域已展现出突破性效果。两条路线各有优势和适用场景,将在未来长期并行发展,共同推动AI Agent技术向更加实用和强大的方向演进。

趋势05

LifeOS: AI成为个性化生活的操作系统

随着生成式AI技术的快速成熟,人工智能正从辅助工具逐渐演化为人类生活深处的“共生伙伴”。OpenAI创始人Sam Altman最近提出了一个前瞻性的愿景:"LifeOS"描绘了一个超越传统工具范畴的AI未来。他指出,人们对AI的使用方式正在从偶发性的单一任务转变为持续性的智能交互,AI不再只是回答问题的工具,而是贯穿用户一生、主动提供帮助的智能伴侣。这一愿景预示着AI将更深层次地融入我们的日常生活,成为一个具备终身记忆、个性化推理和主动行动能力的"生活操作系统"。这一趋势背后的技术基础,包括长序列记忆模型、上下文理解引擎和主动决策引擎,正在不断突破和完善。深入理解LifeOS的发展方向,不仅帮助我们洞察下一代人工智能应用的演变轨迹,更将重新定义人与机器的关系,深刻影响未来人类生活与社会运行模式。

趋势06

智力即服务:智能化工作流赋能产业升级

随着AI能力从"智力驱动"迈向"智力驱动",企业正进入“智力即服务”阶段,Agent逐步成为企业知识系统、流程结构与组织角色的原生组成。在与知识的关系上,企业正从“有知识”走向“能调用”。RAG、数据飞轮和知识结构化机制的演进,使企业知识从“沉默资产”转变为被智能体实时调度的认知系统。在与人的关系上,Agent正从被动工具向数字员工演化。它们开始承担闭环流程、具备权限边界,并成为流程体系中的原生节点。企业不再部署AI功能,而是部署具备行为责任的"数字岗位"。在与流程的关系上,智能化不再依赖单一Agent,而依赖系统性的Agent网络与调度平台。组织开始围绕任务流、感知流与控制流量新编排流程边界,迈向由Agent协作驱动的系统智能时代。

趋势07

游戏智能体:AI在虚拟世界的沉浸式进化

游戏智能体正在重新定义虚拟世界中AI与人类的交互边界。从早期简单的脚本化NPC到如今具备深度学习能力的自主智能体,这一演进不仅体现了技术的飞跃,更预示着虚拟世界正在向着一个充满生命力的数字生态系统转变。当代游戏智能体通过强化学习、大语言模型、多模态感知等前沿技术,已经能够理解复杂的游戏环境、学习玩家行为模式、生成个性化的互动内容,甚至展现出类似人类的情感反应和社交能力。这种沉浸式进化使得AI不再是虚拟世界的配角,而是成为推动游戏叙事、创造涌现式玩法、构建动态社交网络的核心驱动力。随着技术的持续突破,游戏智能体正在为元宇宙时代的到来奠定坚实基础,让虚拟世界真正成为人类生活、工作、娱乐的第二空间。

AI走向物理世界

趋势08

具身智能的“GPT-2时刻”:基础模型、数据工程与软件平台协同进化

从生成式人工智能特别是GPT展现出的历程来看,具身智能领域正通过规模效应蓄积飞跃动能:2025年极有可能成为具身智能领域的“GPT-2时刻”。以VLA(视觉-语言-动作)多模态大模型突破为代表的诸多进展标志着具身智能从专用场景和单一任务向更通用、更智能、更具自主性的机器智能迈出了关键一步,其影响将进一步激活机器人在人居环境的应用潜能。具体来说:一是强大的端到端多模态基础模型正在被构建,它们将赋能机器人大小脑向更高级认知与执行能力跃升,并展现出一定到泛化性;二是大规模的真实与合成数据正在以前所未有的规模被生成和利用,为模型的训练提供支撑;三是跨模态跨本体的软件平台正在统一开发流程;腾讯、英伟达等互联网公司通过构建机器人模拟和训练平台,加速技术的落地,激活万亿级的上下游生态。

趋势09

空间智能:从会聊天到真正懂世界

随着AI技术的不断突破,智能的应用正在从语言智能走向空间智能。空间智能的兴起意味着AI从处理词元(Token)进化到理解体系(Voxel),具备了理解和处理三维世界的核心能力,包括3D环境的感知、推理、交互和生成。这一技术突破让AI能够像预测下一句文本一样去预测三维空间并涌现。空间智能正在重塑自动驾驶、机器人制造、XR混合现实、医疗手术、建筑设计、智慧城市等领域的工作方式,为AI走向通用人工智能(AGI)提供关键的物理常识和因果推理能力,推动AI从"会聊天"到真正"懂世界"的跨越式发展。

趋势10

测试转量产,应用推动具身智能本体加速成熟

2025年3月发布的《2025年国务院政府工作报告》,首次将智能机器人定位为"新一代智能终端和智能制造装备",其纳入"人工智能+"行动计划。同时《工作报告》还明确提出"培育具身智能等未来产业",这标志着具身智能已上升至国家战略高度。随着技术突破和应用场景的不断拓展,具身智能本体 - 机器人正从实验室走向产业化,迎来从测试到量产的关键转折点,在硬件配置、能力提升和产业影响三个维度均有突破:在硬件配置方面,“运动、感知和基础”三系统配置基本定型,大规模量产和应用在即;在能力提升方面,应用推动机器人协调和协作能力更强,综合素质进入“小学生”水平;在产业影响方面,多形态、多协作的具身智能机器人将成为未来劳动力市场的有力补充。

来源:AI观察室

相关推荐