颠覆互联网的下一波浪潮：Agentic Web来了！

摘要：这一转折，来自一种全新的范式设想 ——Agentic Web，一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中，用户不再手动浏览网页、点击按钮，而是通过自然语言向智能体发出一个目标，AI 会自主规划、搜索、调用服务、协调其他智能体，最终完成复

你不会再「上网」，而是说出一个目标，然后由一群 AI 自动完成。

——未来互联网使用场景设想

过去三十年，互联网经历了从静态网页到智能推荐的深刻演变。如今，我们正站在互联网的另一个重大转折点上。

这一转折，来自一种全新的范式设想 ——Agentic Web，一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中，用户不再手动浏览网页、点击按钮，而是通过自然语言向智能体发出一个目标，AI 会自主规划、搜索、调用服务、协调其他智能体，最终完成复杂任务。

这不是幻想，而是由 UC Berkeley、UCL、上海交通大学、上海创智学院等机构的研究者联合提出，并在论文中系统论述的 Web 重构方案。

论文标题：Agentic Web: Weaving the Next Web with AI Agents作者：Yingxuan Yang, Mulei Ma, Yuxuan Huang, Huacan Chai, Chenyu Gong, Haoran Geng, Yuanjian Zhou, Ying Wen, Meng Fang, Muhao Chen, Shangding Gu, Ming Jin, Costas Spanos, Yang Yang, Pieter Abbeel, Dawn Song, Weinan Zhang, Jun Wang单位：上海交通大学，University of California, Berkeley，University College London，上海创智学院等链接：https://arxiv.org/abs/2507.21206Github：https://github.com/SafeRL-Lab/agentic-web

这是一次对互联网底层逻辑的全面「改写提案」：人类不再是唯一的网络使用者，智能体将成为 Web 的主要操作者。任务由人类发起，但由 AI 执行。在这个新架构中，网页、服务、平台不再是面向人的交互界面，而是为智能体而生的协作接口。

本文将从技术架构、理论模型、系统协议、典型应用与挑战五个方面，深度解析这场关于「智能体驱动互联网」的范式革命。

一、三次范式跃迁：Web 正在走向「自动化」

互联网的演化是一部「人–信息」关系的技术史。过去三十年，Web 主要经历了三次范式转变：

PC Web：关键词驱动的「目录网络」

在 PC Web 时代，网页以静态内容为主，信息由机构集中生成，并通过人工分类和超链接构成一个「数字黄页」。用户必须主动发起搜索、点击浏览，任务执行线性、明确但效率不高。

商业模式以关键词搜索广告为主，代表性系统如 Google AdWords，依赖点击率 (CTR) 和每次点击成本 (CPC) 来衡量效果，形成了基于「人类意图」的搜索营销生态。

Mobile Web：推荐驱动的「内容爆炸」

伴随社交平台、短视频、电商 UGC 的激增，信息量呈指数增长。传统搜索引擎难以应对如此庞大的内容分发压力，取而代之的是推荐系统主导的信息分发范式。

用户逐渐从「搜索者」变为「消费者」，算法根据行为数据动态推荐内容，平台从内容聚合器变为算法中介。商业模型转向精准推荐与信息流广告，强调停留时间、转化率和千次展示成本 (eCPM)。

Agentic Web：智能体驱动的「行动网络」

如今，我们正步入第三次变革浪潮：AI 智能体成为主角，Web 从「人读内容」转向「智能体执行任务」。信息不再静态储存在网页中，而是被嵌入 LLM 参数中，被智能体调用、组合与再加工。

Web 的角色不再是信息仓库，而是一个充满「可行动资源」的生态系统，供智能体发现、协调、调用。任务不再依赖用户逐步操作，而是由 AI 智能体全流程完成，从发现信息到调用服务再到反馈结果。

这一趋势预示着：未来的 Web，将由 AI 智能体构建、运营与使用。我们需要重新理解什么是「网页」、什么是「流量」、甚至什么是「用户」。

互联网不再只是人类的空间，它正逐步变成一个由智能体共同参与、协作、创造价值的生态系统。

二、什么是 Agentic Web？

论文中的定义指出：

Agentic Web 是一个分布式、交互式的互联网生态系统，其中由大语言模型 (LLMs) 驱动的自主软件智能体，能够持续规划、协调、执行目标导向的任务。在这个范式中，网络资源和服务不仅可供人类使用，还可以供智能体访问，使得智能体与智能体之间 (Agent-to-Agent) 的互动成为常态。

简言之，它是一个由 AI 来「上网」、执行任务、人类只是「发出指令」的网络形态。

Agentic Web 的核心在于「委托 + 执行」

在 Agentic Web 中，用户不再需要手动搜索、点击、复制或粘贴内容，而是可以通过与智能体的对话来委托任务。比如用户只需说：

「帮我规划一个周末东京行程，预算 3 千元，要避开台风。」

之后，剩下的所有工作都由智能体自动完成—— 从查询天气、搜寻航班、比对价格，到预定酒店、整合日程，整个过程完全自动化。而且，这些智能体可以与其他智能体 (如航司 API、酒店 API、旅游数据智能体等) 协作与谈判，实现任务目标。这不仅仅是像 ChatGPT 那样的单轮问答，而是通过多个步骤和多智能体协作来完成的，代表着 AI 真正参与到了Web 的操作层面。

Agent 在系统中的身份是「双重」的：

Agent-as-User (作为用户)

如同人类访问网页一样，智能体可以模拟点击、填写表单、读取接口，进行市场分析、数据抓取、自动交易等任务。

Agent-as-Interface (作为接口)

智能体也可以作为「超级助手」，接收用户的自然语言指令，自动解析、调用多个服务、整合结果，执行多步流程。

一个完备的智能体，常常同时具备这两个角色：既能代表人类与系统交互，也能作为系统对人类的接口，真正实现「意图—执行」的闭环。

三、理解 Agentic Web 的「三个核心维度」

论文从三个核心维度全面理解 Agentic Web 的结构：

智能维度 (Intelligence)AI 智能体需要具备真正的「认知能力」，包括：上下文理解：能读懂网页、结构化数据、自然语言长程规划：能分解复杂任务，生成执行计划适应性学习：通过经验不断优化策略多模态整合：同时处理文本、图像、API、数据表格等

这些能力意味着智能体不是被动的「响应工具」，而是具有持续学习和自主策略的「数字行动体」。

交互维度 (Interaction)Agentic Web 打破了「人类点击网页」的操作范式，转向基于语义的智能交互：使用 MCP (Model Context Protocol)、A2A (Agent-to-Agent) 协议，实现智能体之间的发现、能力描述、状态共享支持多步任务语境保持 (如购物流程、问诊流程)实现 Agent-to-Agent 协作与任务拆解

智能体之间不是「调用」，而是协商、协同执行，如一个旅游智能体主动向天气智能体请求数据，再联动地图与订票工具，完成任务。

传统广告模型追求「人类点击」；Agentic Web 中，资源方争夺的对象变成「AI 智能体的调用」。

这意味着未来将出现：

面向智能体的推荐系统；为智能体投放的广告；服务市场中按「智能体调用率」竞价；

智能体的调用频次、完成率、效率将成为新的「流量指标」，商业竞争的重心也将从争夺用户注意力，转向争夺智能体「注意力」。

四、应用场景：从搜索替代到智能事务系统

为了更好地理解它的实际价值，我们可以将 Agentic Web 的核心能力拆解为三大类：事务型 (Transactional)、信息型 (Informational) 和交流型 (Communicational)。它们共同构成了智能体参与数字世界的三种基本方式。

事务型：从「点击下单」到「全自动完成任务」

传统 Web 中，用户需要逐页浏览、搜索信息、逐步操作才能完成一项任务，例如订酒店、买机票、办签证。而在 Agentic Web 中，你只需告诉智能体一句话：

「帮我订一个下周三从上海到东京的往返机票，经济舱，避开台风。」

剩下的 —— 查询航司、比价、确认时间、填写资料、支付确认 —— 都由智能体自主完成。它不仅调用航司 API，还能根据你过往偏好 (如信用卡积分、环保航线) 进行权衡，甚至在发生变更时自动重订。

这种智能化的事务处理能力，正在由「Mobile Agents」「App Agents」进一步延展到设备层。例如，智能体可以在你的手机上同步日程、修改会议安排、甚至整合多个应用自动执行跨平台任务。

信息型：从「搜索引擎」到「持续知识发现」

今天的信息检索依赖搜索引擎和社交推荐，但在数据过载的背景下，我们获取的是信息洪流。

Agentic Web 支持的「信息型智能体」，则更像是一个长期陪伴式研究助理。以「Deepresearch Agent」为例：

它可以持续追踪一个研究领域的新论文；自动梳理引用网络和方法论差异；合理推断趋势、生成研究摘要；甚至根据你的研究兴趣，推荐潜在合作者。

这种智能体并不是一次性地「查一查」，而是具备长期「认知记忆」和动态「学习能力」的信息分析引擎。它们协作构成一个持续进化的知识网络，大大提升了信息筛选和洞察能力。

交流型：智能体之间能沟通、协作、谈判

相比以人为中心的传统 Web，Agentic Web 真正的变革在于让智能体可以与其他智能体协作，形成类似「数字组织」的多体系统。

在科研领域，一个跨国研究项目中，不同学校的智能体可以：

自动同步实验时间表；共享数据集；生成联合成果；自动分配署名与经费比例。

在制造业或供应链中，不同企业的智能体可实时对接需求、响应变化、自主协商条款。这种跨智能体协同工作流，依赖于一整套新型通信协议 (如 MCP、A2A)，支持语义对齐、任务协同与多方自治。

简而言之：Web 不再是人和机器之间的桥梁，而是智能体之间的操作舞台。

五、挑战：Agentic Web 的复杂难题与未来瓶颈

虽然 Agentic Web 展现出令人兴奋的前景，但要真正落地为现实中的下一代互联网，它面临的是一组系统性、相互交织、跨学科的复杂挑战—— 远不只是提升 AI 智能体的能力，更关乎整个网络基础设施、经济体系与人机协作范式的重构。

这不仅是个技术性难题，更是一个需要全局观的系统性工程。构建Agentic Web的难题，远不仅仅是提高个体智能体的能力，而是如何在现有互联网基础上，架构出一个可靠、安全、可信的全新计算层。这些挑战跨越了多个领域，彼此之间存在深刻的相互依赖与关联。接下来，我们将逐一解析这些挑战。

智能体基础能力：推理、记忆与安全性

🧠推理与规划的脆弱性

多步骤推理是 Agentic Web 的核心能力之一，它能够让智能体分解复杂问题、评估多个解决方案、做出合适的决策。然而，目前的推理系统仍然脆弱，容易出错，难以进行长远规划和持续反思。

🧠记忆与上下文管理

记忆是智能体能否有效执行长时任务的基础。传统的大语言模型 (LLM) 是无状态的，智能体需要外部机制来保留上下文、历史记录和学习到的知识。然而，如何高效管理这些记忆，尤其是在复杂任务中有效衔接不同阶段的内容，依然是亟待解决的难题。

🧠工具使用的安全性

智能体依赖外部工具 (如 API、数据库、搜索引擎) 来与现实世界互动。然而，这也带来了极大的安全隐患：工具如果被黑客篡改或受到攻击，智能体可能会受到影响，甚至引发连锁反应。解决这个「工具使用悖论」，需要构建「零信任」架构，确保所有外部输入都经过严格验证。

学习与自我改进：从静态模型到动态学习者

🎓奖励设计难题

强化学习 (RL) 是训练智能体的核心方法之一，它通过与环境的交互来优化决策过程。然而，设计一个既能引导智能体正确行为又不容易被滥用的奖励机制，依然是目前的瓶颈。

🎓持续学习与灾难性遗忘

智能体需要具备持续学习的能力，以便随着时间积累新技能。但在学习新任务时，智能体常常会忘记之前学到的知识，这就是所谓的「灾难性遗忘」问题。如何让智能体在不忘记旧知识的情况下学习新内容，是目前面临的重大挑战。

🎓任务交互学习的困难

通过与环境的互动来学习复杂任务是智能体成长的关键。然而，如何避免智能体过度依赖某一特定环境，或者过度拟合特定的输入，保持任务的灵活性和广泛适应性，仍是一个悬而未解的问题。

多代理协作：协调与信任的挑战

🤖协作与沟通：结构设计难题

当多个智能体协同工作时，如何组织它们的结构成了关键问题：是采取平等对等的协作方式？还是分层领导？每种结构都有其利弊，如何找到最优解，仍需深入研究。

🤖通信协议的统一性

为了让全球的智能体能够有效沟通与协作，我们亟需统一的通信协议。这类似于互联网早期对 HTTP 协议的依赖。当前，像IBM ACP、Google A2A、Anthropic MCP等协议正在试图解决这一问题。如何建立一个既能满足复杂交互需求，又具备开放性、易扩展性的标准，将是 Agentic Web 成功的关键。

🤖去中心化的信任体系

在去中心化的智能体生态中，如何确保代理之间的信任？如何构建去中心化的信任体系，让智能体在没有人工干预的情况下高效合作，是另一个亟待解决的问题。

人机交互：确保智能体与用户目标一致

🧑💼用户意图模糊

人类语言本身就常常模糊不清，很多时候用户的指令包含不明确的目标或信息。智能体必须能够解读这种模糊的意图，并将其转化为可执行的目标和任务。

🧑💼偏好发现与引导

用户的偏好常常是变化的，甚至很多时候用户自己都不完全了解自己真正的需求。智能体需要通过与用户的互动，不断引导用户发现并明确自己的偏好。

🧑💼人类监督机制

尽管智能体在很多任务中表现出色，但对于关键任务或高风险决策，人类监督 (HITL)依然是不可或缺的。如何设计有效的监督机制，以确保智能体的决策能符合人类的最终目标，是一个至关重要的问题。

安全与鲁棒性：确保智能体系统的安全性与稳定性