推倒重来！Notion新版本底层地震级变化，架构全变！

摘要：“我们不想在旧架构上硬塞智能体。相反，我们希望发挥推理模型的优势。我们重建了整个系统，因为智能体的工作方式和传统工作流完全不同。”

许多公司会对彻底重建自己的技术栈犹豫不决。但 Notion 就是那个例外。

据了解，为了推出今年9月发布的 Notion 3.0，这家公司几乎没有犹豫就决定——彻底重建底层架构。

Notion 作为业界知名的AI应用，开始舍弃原有底层架构，这一点特别不同寻常。

近日，Notion 的 AI 建模负责人 Sarah Sachs 在采访中透露了背后的原因：

“我们不想在旧架构上硬塞智能体。相反，我们希望发挥推理模型的优势。我们重建了整个系统，因为智能体的工作方式和传统工作流完全不同。”

言外之意，他们意识到，如果要在企业级别支持 Agentic AI（自主智能体），这是必要的一步。

这背后隐藏着一个重要信号：新旧两代AI应用的技术构建逻辑发生了变化。

与传统 AI 工作流通常依赖显式的、一步步的指令和少量示例（few-shot learning）不同，新一代推理模型驱动的 AI 智能体能自己理解可用的工具、规划下一步行动，并具备更强的自主性。

所以，“我们重建了一个新架构，因为工作流程与 agent 不同。”

而重建过程中有哪些宝贵的规模化AI应用构建的经验呢？小编这就为大家整理了下来。主要有以下这五点。

如今，Notion 被 94% 的《福布斯 AI 50》公司采用，总用户超过 1亿，客户包括 OpenAI、Cursor、Figma、Ramp、Vercel 等。

在快速变化的 AI 时代，Notion 意识到：仅仅让 AI 完成单一任务已经不够。

企业真正需要的是以目标为导向的推理系统，让智能体能在多个互联环境中自主选择、编排并执行工具。

Sachs 指出，如今推理模型在学习工具使用和遵循 Chain-of-Thought（思维链）方面“已经强太多了”。

“它们能更独立地完成一个完整流程中的多次决策，所以我们必须重构系统去匹配这种能力。”

从工程角度看，这意味着要抛弃僵硬的 prompt 流程，转而采用一个统一的“编排模型”。

这个核心模型由一系列模块化子智能体支撑，这些子智能体能搜索 Notion 与网页、查询或更新数据库、编辑内容等。

每个智能体会根据上下文决定使用什么工具，比如先判断是要在 Notion 内部查找，还是去 Slack 等外部平台。模型会连续检索，直到找到最相关的信息，然后自动执行后续动作：将笔记转成提案、生成跟进消息、追踪任务、更新知识库等。

在 Notion 2.0 时，AI 还需要通过 prompt 精确指定每一步的操作。

但在 3.0 中，用户可以直接把任务交给智能体——它会自主选择工具，并能并行完成多项任务。

Sachs 总结道：

“我们让它具备自选工具的能力，而不是靠 few-shot 提示一步步教它怎么做。目标是：凡是你能做的事，Notion 的智能体也能做。”

Notion 一直奉行“更好、更快、更省”的研发哲学。在技术上，他们通过向量嵌入微调与弹性搜索优化平衡延迟与准确性。

Sachs 团队建立了一套严谨的评估体系：结合确定性测试、语言优化、人类标注数据和 LLM 审核机制，用模型评分定位偏差与错误来源。

“通过把评估流程分层，我们能明确问题来源，从而隔离掉不必要的幻觉，”Sachs 解释说。同时，更简洁的架构也意味着——当模型与技术快速演进时，更新会更轻松。

她补充道：

“我们尽可能优化延迟和并行推理，这显著提升了准确率。”模型的推理基于网页数据与 Notion 自身的知识空间。

最终，这次重构让 Notion 在功能与迭代速度上都得到了显著回报。Sachs 表示：“如果下一个重大突破到来，我们也完全愿意再次推倒重来。”

在模型训练和调优中，Sachs 提出一个关键观点——延迟（latency）是主观的：AI 不应一味追求速度，而要在正确的时间提供最相关的信息。

“你会惊讶地发现，不同客户在‘等待’这件事上容忍度完全不同，” 她说。于是这成了一个实验：到底多慢，用户才会放弃等待？

比如在纯导航式搜索中，用户希望即时响应。

“如果你问‘2+2等于几’，没人想等着看智能体在 Slack 或 JIRA 里搜索，” Sachs 打趣道。

但在更复杂的任务中，等待反而值得。

Notion 的智能体可以自主工作长达20分钟，在成百上千个网页、文件和资料间检索、综合。此时，用户往往乐意让它在后台执行，自己去处理其他任务。

“这其实是个产品问题，”她说，“我们需要在 UI 层明确设定用户期望，并理解他们对延迟的心理预期。”

Notion 深知“吃自己做的狗粮”的重要性——事实上，公司员工本身就是最重度的 Notion 用户。

团队每天在活跃沙盒中生成训练与评估数据，同时还有一个非常活跃的 “点赞 / 点踩”反馈系统。用户毫不客气地提出想改进的地方和希望增加的功能。

Sachs 解释说，当用户点踩一次交互时，就代表他们同意让人工标注员分析那次交互（即便这意味着部分去匿名化）。

“我们每天都在用自己的工具，这让我们能获得极快的反馈循环。”

当然，她也承认，这种“自用视角”可能让团队对产品质量和功能有偏见。

为此，Notion 还邀请了一批 “AI 素养极高”的外部设计合作伙伴提前试用新功能，并提供关键反馈。

“这和内部原型测试同等重要，”Sachs 强调。“开放式实验能获得更丰富的反馈。如果我们只看 Notion 怎么用 Notion，就不可能真正做到用户最佳体验。”

持续的内部测试还能验证模型是否在退化（准确率或性能下降）。

“这样我们能确保一切都保持稳定，延迟在可控范围内，”她补充说。

她指出，许多公司在评估时过于关注历史回顾，结果反而难以理解自己在哪些方面取得了进步。而 Notion 把评估视为衡量“发展方向与可观测性”的试金石。

“很多公司混淆了这两种评估方式，”Sachs 说。“我们同时用两者，但在逻辑上完全区分开。”

如何在一个互联、安全的企业工作空间中，以负责任的方式运行智能体系统？

对希望采用 Agentic AI 的企业而言，Notion 的实践可以说是一份十分值得参考的蓝图。Sachs

当基础能力发生根本变化时，不要害怕重建。Notion 完全重构了架构，以契合推理型模型。将延迟视为“上下文相关”的问题。不是一味追求快，而是针对不同场景优化体验。让所有输出都基于可信、经过整理的企业数据。这是保证准确性与信任度的前提。

她最后总结道：

“要敢于做艰难的决定，敢于站在前沿。只有这样，你才能为用户打造真正最好的产品。”

最后，鉴于大家喜欢让元宝总结下这篇文章，这里小编也给大家总结了一下Notion3这次重构底层架构的五个要点：

让模型能够自主行动（autonomously）

Notion 意识到市场中简单、基于任务的工作流（task-based workflows）已经不能满足要求，需要向能够自主选择、组织、执行工具的“目标导向的推理系统”转变。

在 3.0 版本中，用户可以把任务交给 agent，而 agent 本身能并行执行多个子任务。它们在判断用什么工具的时候是自我选择的，不再依赖显式提示（prompt）设定一系列 scenario。

模块化子 agent 与统一调度模型

架构中包含多个子 agent（sub-agents），这些子 agent 可以在 Notion 内部搜索、在网络上搜索、查数据库、编辑内容等。它们根据上下文决定要用哪个工具（比如在 Notion 内搜索还是去 Slack 等其他平台），直到找到相关信息。

然后，agent 可以把笔记转换为提案、创建跟进消息、跟踪任务、更新知识库等。

减少幻觉（“胡言乱语” / 输出不准）

Notion 在追求“更好、更快、更便宜”（better, faster, cheaper）的过程中，持续迭代，平衡延迟和准确性。他们用微调的向量嵌入（vector embeddings）、弹性搜索优化 (elastic search optimization) 等方法来做到这一点。

评估框架非常严格，包含确定性测试、口语化优化、人工标注数据、还有把大语言模型当作裁判（LLMs-as-a-judge）来做评分。模型还要检测偏差、不一致或不准之处，从而定位问题源头。

理解“延迟”的情境性（Contextual Latency）

延迟并不总是坏事，要看用例。用户在什么情况下能容忍稍微慢一点，什么情况下不能容忍，差别很大。比如查“2+2”等简单问题时，用户期望几乎立刻得到结果；但如果是 agent 要在后台跨多个网站、文件、资料自动工作 20 分钟，那用户可能觉得可以接受。

界面（UI）上要设定好用户的期待（user expectations），让用户知道这个操作可能要多久。

自家用产品 + 快速反馈循环

Notion 自己也是最重度的用户 (“dogfooding”)。内部团队有沙盒环境产生训练和评估数据，还有很活跃的点赞/点踩反馈机制。用户明确不满意某次互动后，可以授权人工审核那次交互，并尽可能去匿名化分析。

同时，公司也与 “非常懂 AI 的设计合作伙伴”合作，让他们提前试用新功能并反馈。这样一方面能内部快速试错，另一方面能获得外部真实场景的反馈。

好了，文章到这里结束了。Notion作为AI办公类应用的代表已经向微软Office发起了冲锋，如今架构底层已经发生了彻底的变化，说明距离规模化的企业落地的AI应用，黎明时分已至！

希望能帮助到正在使用AI开发的各位大佬们。欢迎评论区交流。

参考链接：https://venturebeat.com/ai/to-scale-agentic-ai-notion-tore-down-its-tech-stack-and-started-fresh

来源：51CTO一点号

标签：架构 agent 地震级 notion 底层地震级

本文地址：http://news.43b.com.cn/a/1510431.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐