花不到1块钱雇个「AI超人」,Office三件套被卷死

B站影视 港台电影 2025-05-26 17:07 3

摘要:作为人工智能的一种高级实现,智能体比大模型更具实体化、自主性、交互性,已经进化成「会思考、动手强、能串联一切工具的全能战士」。

国产智能体,这次真封神了。

过去这段时间,「智能体」简直杀疯了。

无论是初创公司还是互联网大厂,主流 AI 玩家们都开始围着它转,说它是大模型的下一站也毫不夸张。

作为人工智能的一种高级实现,智能体比大模型更具实体化、自主性、交互性,已经进化成「会思考、动手强、能串联一切工具的全能战士」。

就在 5 月 22 日,这条 AI 赛道迎来了一个足以傲视群雄的「巨无霸」产品,其背后站着的正是一家国产大模型厂商 —— 昆仑万维。

这家位居国内大模型第一梯队的选手,面向全球正式发布了天工超级智能体(Skywork Super agents)(下文简称 Skywork),直接卷出了新高度!

与 Manus、OpenAI deep research、Genspark 等其他智能体相比,Skywork 有三大必杀技:「场景全、能力强与框架开源。

首先是「全」,Skywork 远不是一两个小工具拼凑出来的智能体,而是系统打包了 5 个专家级 AI Agent,可以一键生成专业文档、数据表格、PPT、播客、网页五件套,称得上是内容创作者眼中的黄金搭子。

更炸裂的是,Skywork 还提供了 1 个通用 AI Agent,可以一站式地输出音乐、MV、宣传片、绘本、有声书等多模态内容。

其次是「智商」爆表,跑分成绩给了我们很大惊喜。

Skywork 在多个 AI Agent 基准测试榜单中登顶,比如在 GAIA(最困难、最全面的智能体基准测试)中,面对从初级到高级、从易到难的不同任务(Level 1 到 Level 3),它全面超越了 Manus、OpenAI deep research。

这还没完,Skywork 在 SimpleQA(评测智能体回答事实性问题准确性的基准测试)中的得分(94.5)同样超越了 OpenAI 以及当前 SOTA,解决大模型「胡言乱语」更给力了。

最后是让开发者沸腾的 —— 全球首个开源的 deep research agent 框架,这意味着每个人都可以参与到智能体的定义中来了。

同时,直接开放三大 MCP 接口,供开发者调用文档生成、数据分析、PPT 演示文档三大能力,形成以智能体为核心的「AI 操作系统」,成为开发者们的新基建。

框架开源地址:https://github.com/SkyworkAI/DeepResearchAgentMCP 地址:https://mcp.so/server/skywork-super-agents/Skywork-ai

还有一点特别值得称道,Skywork 不搞现在 AI 圈讨厌的饥饿营销那套,不排队、不抢码、不内测申请,上线即可用。性价比还贼高,单个通用任务成本仅需 0.96 元。

今日,昆仑万维重磅宣布天工超级智能体(Skywork Super Agents)APP 正式上线,这也是全球首款基于 AI Agent 架构的 Office 智能体手机 App。

看起来,想要体验智能体的小伙伴终于有了一个实力更强、价格又便宜的选择。

第一手实测:智能体界的「全能型选手」

从 OpenAI 的 deep research 到 Manus、Genspark 等专精型 Agent,市面上的产品在功能上可以说大同小异,而「谁真正能落地、谁真正好用」成为普通用户最关心的问题。

接下来,我们就搞个一手实测,看看 Skywork 这个「新秀」的实力究竟如何。

全球官网:https://skywork.ai中国官网:https://tiangong.cn

多场景写作

最近 AI 率检测的问题频频登上各大平台的热搜榜。有大学生发帖称,熬秃了头写的毕业论文 AI 率被判了 80%,测试一番后发现朱自清的《荷塘月色》AI 率竟超 60%。为了去 AI 味儿,学生们绞尽脑汁,要么疯狂改标点,要么短句改长句……

对此,我们让 Skywork 生成一份适用于 B 站 3 分钟科技短视频的脚本, 吐槽一下当前 AI 技术的发展带来的魔幻现实。

[ 上下滑动查看更多 ]

不得不说,Skywork 设计的「UP 主台词」很有 B 站特色,如「屏幕前的各位『肝帝们』」、「亿点点变化」、「以前是怕抄袭,现在是怕被 AI」 等语句非常贴合年轻受众,既有梗又有深度。而且它还在合适的位置穿插着柱状图、专家观点的引用,更增强了脚本的传达力与可信度。

可视化数据分析

Skywork 的表格模式类似于 Microsoft Excel 和 Google Sheets,输入主题、需求或者上传原始数据后,它就能智能分析并生成表格、图标等。

我们输入指令:「生成一份图灵奖 2015-2024 年的获奖统计」。

Skywork 并不急于执行,而是通过与用户交互确认任务细节,包括统计维度(如获奖人数、国籍、研究领域、所属机构)和展示方式(如表格、趋势图、占比图等)。这种前置的任务拆解能力,使得整个分析过程具有极高的准确性和可控性。

紧接着,它会自动生成待办清单,调用各种 MCP 工具依次执行任务,整个过程无需用户参与。

Skywork 准确完成了数据整理和分析任务,最终生成四个结构完整、信息翔实的 sheet。在可视化呈现方面,它生成的饼图、柱状图和折线图不仅美观,还极具数据表达力。

[ 上下滑动查看更多 ]

精美 PPT

打工人最怕三件事:加班没有加班费、老板突然 @你、顺便做个 PPT。别的顺便是顺手,这个「顺便」是要命:字体怎么调都不对,图表怎么看都很土,辛辛苦苦熬夜干到凌晨三点,结果老板瞅了一眼:「感觉不太对,你再打磨下」。

现在,Skywork 给每个被 PPT 逼疯的打工人开了张救命的「药方」。只要一句简单的 Prompt:制作《日本镰仓的旅游攻略》PPT,它立马就能生成一份结构清晰、颜值在线的 PPT。

[ 上下滑动查看更多 ]

从最终生成效果来看,该 PPT 不仅有实用信息点,还配了高质量的场景图、路线图和日程表,我们完全可以直接拿来用。

创意网页

今年 2 月份,Andrej Karpathy 提出了 Vibe Coding(氛围编程)的概念,码农们不用逐行写代码,只要用自然语言描述目标功能,专用大模型即可生成对应代码。

Skywork 目前也能实现这一功能,输入需求就能快速生成可溯源、可编辑、可应用的高质量多模态 html 成果。举个例子,我们让它「生成一个开心消消乐的网页小游戏」,几分钟后它啪地甩来一个水果卡通风的成品。

这个网页小游戏不仅界面设计的好看,更重要的是,它真实可玩。在规定的一分钟内,玩家让三个或以上相同的水果图标连成一条直线即可消除,并且它还能根据得分情况增加等级。

智能音频播客

去年谷歌 NotebookLM 曾掀起一股 AI 播客热潮,仅需一个链接或文档,几分钟就能转成接地气的男女对谈。当时,不少 AI 圈的大咖为它「站台」,甚至连「死对头」OpenAI CEO Altman 都认为它很酷。

Skywork 这次上线的播客模式与之有异曲同工之妙。我们输入 Prompt:《面纱》读书对谈播客,它随即就去找资料写稿「录制」,然后一键生成音频播客。

《面纱》读书对谈播客,机器之心,6分钟

AI 男女主播吐字清晰,语音语调自然真实,语气词、说话的气口都把握得相当到位。从内容来看,他俩也不是照本宣科,而是在真正读懂了小说后,针对播客这一媒介形式进行的自我创作。

与谷歌 NotebookLM 不同的是,如果我们对成品有任何调整需求,可以直接在聊天框里提,Skywork 随时修改。比如,我们让播客增加一部分,介绍小说中的男主沃尔特・费恩是个怎样的人,Skywork 立马在原有播客基础上更新了相应的内容。

音乐与视频生成

此前,昆仑万维发布了全球首个音乐推理大模型 Mureka O1,不输 Suno 的惊艳效果让所有人看到了其在音乐生成领域的深厚造诣。

Skywork 的音乐实力同样不俗,比如「生成一段适合清晨独自散步时听的轻音乐」,它以钢琴为主旋律,整体节奏舒缓匀称,给人一种在晨光中漫步的惬意感觉。

音乐生成,机器之心,1分钟

视频生成也不在话下,比如「城市天台夜晚,一群会发光的小鸟从霓虹灯上起飞,汇聚成一个漂浮的时间钟表」,这种复杂 Prompt 的目标场景都能 hold 住,你就说赞不赞吧?!

Skywork 还能生成带背景音乐的视频,如下「generate a video with music: a man raps to the camera」。下一步的升级方向可能就是直接生成指定对白、语气的音画同步视频了,就像谷歌 Veo 3 所能做到的那样。

这一波实测下来,我们切身的感受是:强,太强了!

无论是生成内容的丰富性、专业性、准确性,还是界面设计的美观程度和布局的合理性,Skywork 都展现出了一个「全能型」智能体该有的样子,甩开了现有竞品。

人无我有,打造差异化竞争优势

在体验过程中,我们发现,Skywork 在任务协同、多模态生成、结果可信度和个人知识库上,具备了真正的「差异化实力」,克服了 Manus、OpenAI deep research 等竞品的痛点,实现了「人无我有」的后发优势。

超能 Office 三件套 —— 高效内容创作与生产力输出

当代打工人,谁没被文档、表格和 PPT 这工作「三件套」逼疯过?

如今,Skywork 把文档、表格、PPT 这三大办公工具整合在了一起,生成的内容不仅更详细、更条理,还能做出各种清晰好看的图表,甚至还能插入 Youtube 视频。

[ 上下滑动查看更多 ]

当然,如果你想对生成的内容进一步细化调整,Skywork 提供了在线编辑功能,通过「编辑」按钮直接在界面上修改文字、调整结构,像使用在线协作工具一样自然流畅。

导出格式也非常灵活,包括 PPTX、PDF、HTML、Google Slides 等多种格式,满足我们在决策讨论、版本迭代、二次创作中的不同需求。

生成酷炫内容 —— 多模态内容融合

在日常创作中,我们往往需要在文字、图片、音频、视频等多个工具之间来回切换,才能把一个想法完整呈现。

Skywork 在通用对话任务上打破传统 Agent 任务执行的边界,接入网页搜索、思考分析、图片生成、图片理解、语音生成、音乐生成、视频生成等十余个 MCP,让创作者无需奔波于不同平台,就能一键生成宣传片、MV、有声书、绘本等多种形式的内容。

比如我们仅用一个 Prompt,就让它混搭出一个小猫的旅行 vlog,不仅准确生成出各大地标,还让小猫在每一个场景中自然入镜,整个过程无需人工干预。

这种「Agent+MCP 多工具融合」的架构,有望引领下一代内容生产的范式革命。

信源可追溯 —— 向可验证内容创作演进

在如今这个内容泛滥的时代,信息可靠性反倒成了稀缺资源。大模型虽然擅长高效生成,但它们一本正经地胡说八道早就不是什么新闻。

Skywork 试图解决的正是这个痛点。它生成的每一段文字、每一张图片都不是凭空捏造,而是能清晰追溯到具体出处。输出文本可以关联原文段落,图片也能标注出溯源网页或知识库来源,甚至还附上完整的信源列表。

这种将信息溯源融入创作流程,让用户在生成内容的同时随时验证,大大降低了大模型「满嘴跑火车」的风险,真正让每一次产出都有据可查。

个人知识库 —— 打造私有化智能内容循环

如今,市面上的智能体普遍存在的一大痛点在于:素材零散、成果不可持续,缺乏系统性积累机制。

为了解决这些挑战,Skywork 上线了个人知识库。我们可以上传 pdf、doc、ppt、xls 等多种格式的文件,也可以上传录音、url 和 youtube 视频播放地址。每个知识库支持上传最多 50 个文档,并可根据不同主题创建多个知识库,实现清晰有序的知识管理。

更重要的是,Skywork 不只是一个信息存储工具,更是一个智能创作引擎。基于知识库内容,我们可以一键生成 多模态内容,它们又能反向存入知识库,形成「素材 - 创作 - 再积累」的正向循环,打造真正可生长的个人知识系统。

以上这些差异化功能,构成了 Skywork 的核心竞争力,使之成为真正「有用、敢用、好用」且更具性价比的 AI 智能打工人。

从信息发现到结构化内容输出

全链路流程被打通

为了实现通用化、性能更强的智能体,Skywork 在底层技术上祭出了多项自研,打造全链路智能内容引擎,从深度搜索到高效生成,一站式解决复杂任务。

首先自研一个 deep research 模型,通过依托「深度思考 + 推理」的信息检索,不仅查得更广与更准,还能更快找到高质量源信息;强化学习能力的加持又进一步增强模型面向各种搜索任务的泛化性,性能上全面对标 OpenAI 竞品。

接下来是一套自研的 agent workflow 框架,在高效完成传递信息、拆解任务之外,还能灵活调用基座大模型,使智能体能力得以延伸。效果也非常显著,在开源的 deep research 排行榜上拿下了 SOTA 成绩。

此外还自研一个生成物模型,实现高质量数据的生成、收集和训练,使生成内容更丰富、更真实且可读性更强;配合自研的在线编辑系统,无缝兼容常见办公软件,实现一站式内容生成与修改,并能一键导出成稿,效率与友好性绝对是拉满了。

最后,面对特别复杂的任务也有诀窍 —— 「化整为零、各个击破」,即将复杂任务拆分为多个小任务,每个小任务单独进行深度研究、互不干扰,有效突破了模型上下文长度的限制,支持超复杂任务协同解决。

正是技术上的一系列突破,Skywork 才有了如今敢于叫板一切对手的实力。

Office 的下一次革命来了?

自大模型技术爆发以来,人们一直在寻找应用的突破方向,最先开启自动化革命的恰恰是写代码本身。

现在,很多人都知道自然语言驱动的编程工具 Cursor,它正在吸引越来越多的程序员。人们写代码的方式已经发生了变化:先让 AI 写一个 readme 列出项目设计思路、功能逻辑,然后再让 AI 一步一步地实现就可以了。

Cursor 也让编程门槛降到了一个前所未有的低点,号称让非程序员也能参与开发。只要你能描述清楚需求,Cursor 就能帮你生成专业级的代码。

同样地,超级智能体带来的能力,就像是 Office 版本的 Cursor。无论是制作文档、表格、PPT,还是生成网页或播客,它都可以根据你提出的需求快速进行生成,节省你大量的工作时间。

随着智能体成为 AI 产业界的核心关键词,它已过了秀概念的阶段,并开始了从技术展示向场景落地、从工具层向系统层的过渡。此次,Skywork 的推出不仅印证了中国 AI 企业在智能体领域具备了与国际对手抗衡乃至超越的实力,而且预示了接下来在该 AI 方向上「技术 + 场景 + 生态」全面交锋的趋势。

对于昆仑万维来说,这是一次具有战略意义的突破。在未来更大的应用前景铺开之前,它用一款全栈自研的超级智能体为自己在市场上赢得了先机。从上手体验来看,这款产品已经越过了实用化的门槛。

或许过不了多久,大量的工作就会由智能体接手,这何尝不是办公全家桶的一次进化?你只需要提出需求,投喂文件资料,确认好细节后,坐等 AI 交作业!

来源:晚晚的星河日记一点号

相关推荐