字节跳动:一口气曝光了 3 款 AI Agent

B站影视 港台电影 2025-03-30 20:04 1

摘要:近期,字节团队在 AI Agent 方向的探索更是成果斐然,一口气曝光了 3 款相关产品,其中开源的 TARS 项目更是堪称全网最像 manus 的存在。

近期,字节团队在 AI Agent 方向的探索更是成果斐然,一口气曝光了 3 款相关产品,其中开源的 TARS 项目更是堪称全网最像 manus 的存在。

一、字节跳动 AI Agent 布局:多点开花

字节内部多个团队都在 AI Agent 轨道上加速前行,一周内发布了3 款产品:2款开源、1款闭源,这种多点开花的布局展现出字节在 AI 应用落地上强大的执行力。

1、开源项目:langmanus

开源地址:https://github.com/langmanus/langmanus

先说开源项目一 langmanus,它基于 langgraph 以及诸多开源组件打造。

从项目 README “源于开源,回馈开源” 的宣言就能看出其定位是助力新手入门,降低大众进入 AI Agent 领域的门槛,让初学者能站在字节团队的肩膀上,更快熟悉相关技术架构与开发流程。

2、闭源的 Dev Agent

闭源的 Dev Agent 则处于团队内测阶段,功能与 Manus 类似,深度集成内网知识库和多种内部工具,聚焦于调研、开发、数据分析等复杂任务。

显然是为字节内部的研发流程提效赋能,属于那种养在深闺的高生产力工具,暂时还披着神秘面纱。

二、TARS:复刻 manus 的开源力作

开源地址:https://github.com/bytedance/UI-TARS-desktop

TARS 这款开源多模态 AI Agent,有着自主浏览网页、集成命令行和文件系统的强大能力,能灵活调用浏览器完成各类操作,无论是信息收集、任务处理还是跨平台协作,都能轻松驾驭,堪称数字化世界里的智能瑞士军刀。

1、核心特性亮点

①智能任务处理 :TARS 拥有精心设计的 Agent 框架,能规划和执行复杂任务,例如:深度研究、电脑操作。

“深度研究” 功能,面对一个专业且复杂的调研需求,它不是简单罗列信息,而是能像专家一样抽丝剥茧,从不同维度深挖,给出系统性分析;

“电脑操作” 功能更是让 TARS 能在本地数字化环境里自由穿梭,帮用户处理各种电脑端的繁琐事务,从文件整理到软件操作都能一手包办。

②丰富工具集成 :内置搜索、文件编辑、命令行等常用工具,覆盖了我们日常知识工作的大半场景。

更厉害的是支持 MCP(模型上下文协议),这就像是给不同工具之间搭建了一座高效沟通的桥梁,让它们能协同作战,处理复杂工作流程时如行云流水般顺畅,大大提升了任务执行的连贯性和效率。

2、实测场景展现实力

旅游规划场景,当用户提出 “2025 年清明节假期从杭州去威海旅游,规划旅游计划,用详细的 markdown 输出” 这样一个需求时:

TARS 能迅速整合交通、景点、美食、住宿等多维度信息,按照时间线、区域分布等逻辑,梳理出一份条理清晰、内容详实的旅游攻略,并且以美观易读的 markdown 格式呈现,无论是自己出行前做攻略,还是分享给朋友参考,都十分实用。

金融分析场景,面对 “从技术面分析下特斯拉未来的股价走势” 这种专业度较高的金融问题时:

TARS 能调用历史股价数据、行业趋势报告、公司财报等多源信息,结合经典的技术分析指标与量化模型,给出有理有据的分析报告,即使是金融小白也能从中获取关键洞察,辅助投资决策。

三、未来展望:潜力无限

字节跳动这次开源的 TARS 项目,让我们看到了 AI Agent 从前沿概念走向普罗大众日常工具的无限可能。

对于技术爱好者、知识工作者以及广大开发者来说,这都是一份极具价值的礼物,值得我们深入探索、大胆尝试。

更多干货见:PMKG-每日精进1%

已经看到这儿了,那就点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

来源:鼠meme

相关推荐