AI智能体元年来了!从“说”到“做” 将有趣的“灵魂”装入实用的“皮囊”

B站影视 2025-02-24 16:51 2

摘要:就在过去的不到两个月时间里,国内AI初创公司DeepSeek发布了新一代开源大语言模型DeepSeek-V3,训练成本只有ChatGPT-4o的二十分之一,贡献了AI竞赛中的中国力量;随后,AI巨头OpenAI发布了名为Operator(操作员)的智能体(ag

AI行业的发展速度真的日新月异,几乎每天一睁开眼,就有让业界震撼的新技术消息发布。

就在过去的不到两个月时间里,国内AI初创公司DeepSeek发布了新一代开源大语言模型DeepSeek-V3,训练成本只有ChatGPT-4o的二十分之一,贡献了AI竞赛中的中国力量;随后,AI巨头OpenAI发布了名为Operator(操作员)的智能体(agent),“一种能够独立为你工作的人工智能——你给它一个任务,它就会执行”;几天后的除夕春晚,杭州宇树科技的机器人表演技惊四座,在人形机器人领域掀起了巨大的波澜,投资界认为其将开创具身智能发展新纪元。

更让人目眩神迷的是,一旦将ChatGPT、DeepSeek这样的大模型,移植结合到宇树、优必选、波士顿动力等的硬件性能强大的机器人身上,那会发生什么?

业界认为,2025年将成为AI智能体元年。

2月18日,汇丰环球私人银行及财富管理宣布将中国股票评级从中性上调至偏高,成为继高盛、瑞银、摩根大通等机构后,又一家看多中国市场的外资巨头。汇丰此次评级调整,直接指向中国人工智能领域的自主创新突破及其商业化潜力,且同时将对亚洲新兴市场股票的整体观点也上调至偏高。

■廖木兴/图

从“说”到“做”

大模型走向现实世界的第一步

AI智能体(AI agent)的科学定义,是一种具备自主感知、决策和执行任务能力的智能系统。它就如同拥有“智慧大脑”的虚拟存在,能够像人类一样,依据周围环境的变化做出合理判断与行动。在人工智能的宏大版图中,AI智能体是极为关键的一环,是实现复杂智能任务的核心载体。

在最新定义中,Operator被定义为“能够为你执行网络任务的AI智能体”。Operator的页面与ChatGPT大致相似,只是输入框的提示词从“我能帮您什么吗?”变为“我能帮您做什么吗?”

用通俗的话来说,AI智能体也就是大模型从“说(Chat)”到“做(Act)”的进化,是AI走向现实世界的第一步。

中国工程院院士邬贺铨预测,2025年将是智能体元年。百度创始人李彦宏认为,智能体是AI应用的最主流形态,即将迎来爆发点,成为内容、信息和服务的新载体。

AI“打工人”

智能助手早已悄然普及

事实上,随着近年大模型技术的迅猛发展,一些功能相对简单的智能体早已悄然普及应用。

在Operator的演示中,当用户想要购买日用品时,它实际上是模拟人类在电脑上的操作行为,通过点击、滚动、输入等操作直接与网页进行交互,完成各种任务。简单来说,Operator 就像你的数字管家,可以浏览网页、填写表格、订购商品以及预订餐厅等,也可以代替我们进行一些甚至复杂的操作。

早在去年11月29日的智谱OpenDay上,智谱CEO张鹏就演示了这样的情景:对手机说“面对面建群,密码是xxxx”以及“给xx群发红包”,AutoGLM自动点开微信,搜索并点开xx群,开始发红包。据介绍,AutoGLM可以自主执行超过50步的操作,也可以跨App执行任务,比如在美团和饿了么比价、在小红书搜攻略然后去携程订酒店。

56岁的自由职业者张忠在百度文心智能体平台上创建了智能体,介绍新疆的风光和美食,并通过在智能体上挂载商品变现。“相比搜索引擎,智能体能给出更清晰、更有深度的答案。”张忠说,他较早接触智能体,目前已经协助企业和个人搭建了十几个智能体。

相较于C端Agent的“网上冲浪”能力,在B端,Agent已经更早融入工作流程,开始“打工人”的一生。

在电商行业,智能客服已成为企业提升客户服务质量的重要利器。以淘宝、京东等电商平台为例,每天都会涌入海量的客户咨询,涵盖商品信息、价格优惠、物流配送、售后服务等各个方面。智能客服凭借自然语言处理和机器学习技术,能够快速理解客户的问题,并从庞大的知识库中提取准确的答案并解答。

一些智能客服还具备引导功能,当客户表达出购买意向时,它可以根据客户的需求和偏好,推荐相关的商品,提高销售转化率。同时,智能客服能够实时记录客户的反馈和问题,为企业优化产品和服务提供数据支持。

还有AI助教,为学生个性化出卷、改卷;AI主播24小时在线,不间断地直播、带货;AI医生能够实现辅助诊疗、报告解读、用药提醒等功能……这些智能助手就是当下备受关注的AI智能体。

“智能体是人工智能发展的重要应用。”邬贺铨表示,未来10年将是AI重塑互联网的时代,AI终端与智能体将改变人机交互方式,解放双手,提升智能体验。

井喷在即

人人都有智能体的时代正加速来临

DeepSeek的横空出世,“改变了AI Agent的发展路径。”达观数据CEO陈运文认为,DeepSeek的开源降低了开发门槛,吸引了更多开发者参与,加速了AI Agent从实验室研究向工业级应用的转变,推动了多主体协同开发,开发者的关注焦点也从注重“语言生成”转变为更重视“任务执行”,让AI Agent“实际做事”的价值更受关注。

在功能上,DeepSeek能实现多模态交互,理解复杂指令,还能在复杂场景里生成最优路径;应用场景也拓宽了,在金融、医疗、制造、媒体娱乐等多个领域都能构建智能Agent,比如智能投顾、诊断辅助、供应链优化、内容创作等;协作集成方面,它预置了常用API,降低了集成成本,还支持多Agent分工协作,适用于供应链管理、智慧城市这些场景。

在过去几天内,腾讯旗下的微信、元宝、企业微信等产品密集宣布接入DeepSeek-R1大模型,其中企业微信更全量上线了“智能机器人”能力,企业可免于开发,仅需配置机器人名称、角色,基于DeepSeek、混元等大模型,一键创建企业专属的“智能机器人”。

据微信团队介绍,在日常办公场景中,智能机器人可化身“7*24小时在线员工助手”,覆盖IT支持、行政答疑、资料检索、报销规则查询等场景,不论是复杂繁琐的产品细节,还是需要推理思考的搭配方案,都能及时给出回答。

有意思的是,DeepSeek和智能机器人连接之后,客户服务将会变得比过去更加智能、人性化。比如,售后场景下,客户情绪激动要求退货,一线客服需要快速安抚客户情绪,同时给出实际解决方案,非常考验一线人员的个人经验与临场反应,而“客户多次询问却迟迟不下单”也是困扰一线销售的难题。在DeepSeek加持下,智能机器人能够快速根据客户情况,给出跟进建议与推导过程,让每一个销售都能提供“更懂客户”“更懂业务”的服务。

当像企业微信这样的连接超过1200万真实企业和组织的生产力工具接入DeepSeek后,AI Agent迎来了梦想的星辰大海,人人都有智能体的时代正在加速来临。

就在过去的一星期里——

深圳市福田区上线福田区政务大模型2.0,率先推出AI数智员工,首批70名已上岗。这些“AI员工”除了具有通用大模型的能力以外,还量身定制了个性化智能体,可满足240个业务场景使用;

超过7家主流手机厂商宣布集成DeepSeek到智能体助手上,包括华为的小艺App、荣耀的YOYO助理、OPPO的小布助手、vivo的蓝心小V等。联想也宣布个人智能体“小天”接入DeepSeek,使用联想AI PC的用户,可以通过小天唤醒DeepSeek;

京东健康旗下AI医生智能体产品完成内测,国内首批医生专家的AI数字分身在京东互联网医院正式上线,其可7x24小时回答患者咨询提问。当患者希望进一步问诊时,医生智能体还可以为患者挂号、预约医生本人的时间,并把之前与患者的对话整理成要点文档,方便医生参考。在诊后环节,数字医生还可为患者提供疾病科普、病程管理、用药提醒、康复指导与营养方案等诊后管理和服务;

FutureLabs未来实验室首席专家胡延平近日表示,AI大模型不再只来自头部少数几家企业,以基座模型为基础,后训练、微调以及与检索增强生成、智能体等结合的个性化垂类模型及其应用场景,很快将成为一个数量庞大的后市场。很快会看到产业腰部的出现和长尾的涌现,生态成型,涌现在即。

据Markets and Markets预测,全球AI Agent市场将从2024年的51亿美元增长到2030年的471亿美元,年复合增长率高达44.8%。

具身智能

连接虚拟和现实空间的桥梁

值得强调的是,AI智能体可以是一个程序,也可以结合物理实体形成“具身智能”(Embodied AI),如自动驾驶汽车、具身智能机器人等。

因此,当春晚宇树机器人技惊四座地亮相后,由DeepSeek构建的有趣“灵魂”(大脑、软件),结合像人形机器人G1、机器狗等这些灵活实用的“皮囊”(躯干、硬件)后,打开了一个举世皆惊的想象空间。

具身智能是连接虚拟和现实空间的桥梁,把AI融入机械人等物理实体,赋予它们像人一样的感知、学习,以及跟环境互动的能力。

想象下,前述的一些AI智能体应用场景,如果得到进一步延伸的话:

未来每个家庭都拥有一个像“大白”一样的机器人管家,它不仅能打扫卫生、洗衣做饭,还能陪伴老人、照顾孩子,甚至在你生病时提供贴心的护理服务;具身智能机器人可以协助医生进行手术操作,提供更精准、更稳定的医疗服务;在工业生产线上,具身智能机器人可以完成更复杂、更精细的装配任务,提高生产效率和产品质量;具身智能机器人可以代替人类进入危险或人类无法到达的环境,例如矿山、深海、外太空等,进行探索和科研工作。

北京具身智能机器人创新中心总经理熊友军曾形容说,“具身智能是人工智能与机器人技术深度结合的产物,它是‘长了身体的智能’,标志着技术发展的一个巨大进步。”他认为,具身智能能够直接与物理世界进行交互,将带来生产力的巨大提升和生活方式的改变。

中银证券认为,智能体时代来临,小型端侧设备无法消化大模型大参数,而具身智能则有望成为最佳载体。

实际上,自2023年人工智能应用爆发以来,具身智能就成为业界公认的一个重要应用方向。

近两年,多地政府都在设立机器人产业发展投资基金,入局者日益增多。

根据智源研究院数据统计,截至2024年底,国内已发布或在研人形机器人接近100家,融资规模超100亿元。

中外一些人形机器人项目也在2024年取得不错的进展:优必选人形机器人Walker聚焦汽车、3C等制造业重点领域,已进入多家车厂实训;宇树科技机器人实现了完全仿人的自然行走;波士顿动力的新版Atlas机器人可在工厂里不同储物柜之间丝滑搬动零件……

进入2025年,Deepseek与宇树机器人的爆红,让具身智能再次成为话题。民生证券最新研报显示,作为AI端侧另一大赛道,人形机器人同样受益于DeepSeek R1带来的成本下降,更“廉价”的人形机器人,即将面临更快的量产和更庞大的需求。

人形机器人第一股优必选透露,正在验证DeepSeek技术在人形机器人应用场景中的有效性,包括多模态人机交互、复杂环境下的指令理解、工业场景中的任务分解与规划等。公司希望借助推理大模型的深度思考能力,破解这些复杂任务的挑战,使人形机器人更接近人类的思维方式和行为表现。

均普智能透露,除V3、R1外,DeepSeek团队也开发了系列大模型,如已具备较好视觉语义对话能力的大型混合专家(MoE)视觉-语言模型系列,这将显著提升人形机器人的“大脑”水平。

行业发展

互联网大厂砸重金布局

日前,某招聘平台信息显示,蚂蚁集团开放招聘具身智能人形机器人系统和应用等岗位,年薪高达百万元,消息让各界对具身智能的关注到达了沸点。

记者梳理公开资料发现,当前大厂主要通过战略投资、大模型接入等方式切入具身智能领域,亲身下场自研的尚属“少数派”。

例如,2024年内,杭州宇树科技相继完成B++轮及C轮融资,美团战略投资部参与宇树科技两轮融资;具身智能机器人公司北京星动纪元科技有限公司10月公布Pre-A轮融资3亿元,阿里巴巴、联想创投等参与本轮融资;腾讯则在更早之前战略投资乐聚机器人,领投深圳市优必选科技股份有限公司C轮融资等。

上周一,具身智能创业公司自变量机器人宣布完成数亿元Pre-A++轮融资。本轮融资由光速光合与君联资本领投,北京机器人产业基金、神骐资本跟投,融资将用于下一代统一具身智能通用大模型的训练与场景落地。

到了周四(2月20日),具身智能初创公司星海图成功完成新一轮A轮融资,总融资额近3亿元人民币。本轮融资由蚂蚁集团独家领投,高瓴创投、IDG资本、北京机器人产业基金、百度风投等老股东持续加码。短短一年内,星海图已完成四轮融资,累计融资额近1亿美元。

有具身智能初创公司内部人士表示,大型科技公司的强项是AI能力,但在硬件上不一定具备优势;并且,大公司更多会从自身业务的结合点考虑机器人的研发,而不是端到端地布局机器人,这将会成为创业公司的竞争点。

某公募基金经理表示,目前,人形机器人整体处于从技术突破向产业化加速迈进的阶段。从需求侧看,劳动力供给将面临短缺,用机器人代替人成为不可逆趋势;从供给端看,以DeepSeek为代表的AI大模型不断迭代,使人形机器人应用场景进一步拓宽。在细分市场有望率先商业化,如工厂生产、安防巡检、物流配送、服务业引导等。从初期功能单一逐步转为成熟通用型机器人,由ToB转为ToC后有望进入家政等市场。

宇树科技CEO王兴兴在接受央视采访时预测:“个人感觉在今年年底之前,整个AI的人形机器人会达到一个新的量级。如果顺利的话,到明年或者后年,一些基础的比如服务业或者工业基本可以推广,但家用可能会稍微慢一点。因为家用可能对安全性的要求更高,会需要技术相对更成熟。”

■新快报记者 郑志辉

来源:新快报新闻

相关推荐