告别GPT！最强AI编程神器Cursor自研核心模型，速度快4倍

摘要：AI 编程工具 Cursor 背后的初创公司 Anysphere，在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。

这两天真是大事不断。

AI 编程工具 Cursor 背后的初创公司 Anysphere，在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。

Composer 是一款专为生产级环境设计的高性能编程模型，旨在让 AI 能更快、更精准地执行真实软件开发任务。这意味着 Cursor 不再只是调用第三方模型（如 GPT 或 Claude），而是进入了自主构建核心模型的新阶段。

值得注意的是，Composer 已在 Cursor 自家工程团队的日常开发中投入使用，这表明它的稳定性与成熟度已经达到了可生产的水准。

Cursor 表示，Composer 在大多数任务中可在 30 秒内完成响应，同时在复杂代码库中仍保持高水平的逻辑推理与理解能力。

知名开发者、t3.gg的创始人兼CEO Theo在 X 上表示：Composer是我用过最疯狂的模型之一！又快又聪明。

官方介绍Composer“比同类智能模型快 4 倍”，并专为 Agentic 工作流而设计——也就是多个自主代理可协作完成编码、规划、测试与审查等任务。

Cursor 研究员 Sasha Rush 在 X上分享了 Composer 的基准性能图表，展示了其在多个模型类别中的领先表现。

Cursor 为 Composer 构建了名为 Cursor Bench 的内部基准体系，数据来自真实开发者在平台上的代理请求。

该测试不仅评估代码正确性，还考察模型是否遵循项目的既有抽象层次、代码风格与工程实践。

结果显示，Composer 达到了前沿级（frontier-level）编程智能，生成速度高达每秒 250 个 token ——这约是现有“快速推理模型”的两倍，且比同类顶级模型快四倍。

官方将测试模型划分为以下几类：

Best Open（如 Qwen Coder、GLM 4.6）Fast Frontier（如 Haiku 4.5、Gemini Flash 2.5）Frontier 7/2025（年中最佳模型）Best Frontier（GPT-5、Claude Sonnet 4.5）

Composer 在智能水平上接近中端 Frontier 模型，但在生成速度上居所有模型之首。

在此之前，Cursor 以其独特的 “vibe coding” 模式受到欢迎 —— 用户只需用自然语言描述功能，即便不是开发者，也能让 AI 自动生成代码。

旧版 Cursor 主要基于第三方模型，如 OpenAI、Anthropic、Google 和 xAI 等。而 Composer 的出现，标志着 Cursor 拥有了自有核心智能模型，但用户仍可选择这些外部模型进行对比使用。

Cursor 研究员 Sasha Rush 在 X 上透露，Composer 是一个基于强化学习（RL）训练的专家混合模型（MoE）：

“我们使用强化学习训练了一个大型 MoE 模型，使它能在真实编程任务中表现出色，同时保持极高速度。”

Rush 进一步解释说，Cursor 团队在设计 Composer 时，与 Cursor 的开发环境同步共建，以确保模型能在生产级规模下高效运行：

“与其他机器学习系统不同，编程智能体几乎不能抽象出实验环境。我们让模型与产品共同设计，使其能在必要规模下运行。”

Allen Institute for AI的机器学习研究员Nathan Lambert也对 Composer 模型强化学习（RL）训练成果大加赞赏：

“我特别喜欢这种漂亮的强化学习训练缩放曲线图。相比推理阶段的缩放曲线（inference-time scaling plots），这种图往往被忽视了。”

Composer 并非在静态数据集上训练，而是在真实的工程场景中学习。训练期间，模型运行在完整的代码库中，能使用一整套生产工具，包括：

文件编辑语义搜索终端命令

每次训练迭代，模型都会解决一个具体任务 —— 可能是生成代码修改、编写方案、或给出精准解释。

强化学习环节同时优化正确性与效率：
Composer 学会了如何合理使用工具、并行处理任务、减少冗余输出。
在训练后期，模型甚至出现了“自发行为”，例如：

自动运行单元测试修复语法/规范错误进行多步代码搜索

这种设计让 Composer 能在与用户相同的开发环境中运作，完全贴合真实编程场景，支持版本控制、依赖管理与迭代测试。

Composer 的诞生基于早期内部原型 Cheetah，Cheetah 主要用于验证低延迟推理的可行性。

Rush 在 X 上写道：

“Cheetah 是该模型的 v0 版本，主要测试速度。
Composer 的速度与之相同，但智能程度高出许多。”

Cursor（Anysphere）的联合创始人兼 CEO Aman Sanger也表示：Cheetah 是 Composer-1 的早期原型。

Cheetah 的成功让 Cursor 意识到：“响应速度是开发者信任与使用体验的关键。”

Composer 在保持速度的同时，显著提升了推理能力与任务泛化水平。

一位早期测试者表示：

“它快到让我可以一直保持在思考循环中工作。”

Composer 延续了这种实时交互的体验，并拓展到多步骤编码、重构与测试任务。

Composer 深度集成于 Cursor 2.0 的全新多智能体平台中。
用户可最多同时运行 8 个代理，每个代理在独立的工作区（通过 git worktree 或远程机器）中执行任务。开发者可以让多个代理并行尝试同一任务，并对比结果后择优采用。

Cursor内部开发者 Jason Ginsberg 在X上评价：在 Cursor 里运行一个网页 Agent 的感觉，更像是在作画而不是写代码。

此外，Cursor 2.0 还带来了多项配套升级：

内嵌浏览器（正式版）：代理可在 IDE 内直接运行与测试代码，并将 DOM 信息传递给模型。改进的代码审查界面：可跨多文件查看模型修改，提升审阅效率。安全沙盒终端（正式版）：代理运行的 shell 命令在沙盒中隔离执行，确保本地安全。语音模式（Voice Mode）：支持语音指令触发与管理智能体。

为支持大规模 RL 训练，Cursor 自研了强化学习训练架构：

基于 PyTorch + Ray 的异步分布式系统；开发了专用 MXFP8 MoE 内核，结合专家并行与混合分片数据并行；可在上千张 NVIDIA GPU 上低精度原生训练；避免了训练后量化的复杂性，显著提高推理效率。

训练过程中，Composer 在云端运行数十万并行沙盒环境，每个都是独立的开发工作区。
为承载这些动态工作负载，Cursor 重写了虚拟机调度器，使训练环境与生产环境完全打通。

Cursor 针对企业用户也提供了 Composer 的管理与安全功能：

管理员可集中控制终端沙盒策略、Git 访问与网络权限；支持 Hooks 分发、团队规则管理与操作审计日志；提供团队层级的使用监控与性能分析。

价格层级：

个人用户：从免费版（Hobby）到 Ultra（$200/月）；团队版起价 $40/人/月，企业用户可定制合规与访问方案。

不过，开源工具Datasette的创建者、Django 框架联合创始人Simon Willson 以及一些网友都注意到了一个细节，那就是官方说明中并没有解释模型的来源：

他们是否从零开始训练模型？还是基于某个现有的开源模型（例如 Qwen 或 GLM 系列）进行微调？

Sasha Rush 最近在 Hacker News 上回答了一些相关问题，但在谈到模型基础时态度仍然相当含糊。

当有人直接提问：“Composer 是否是在某个开源基础模型上微调得到的？”
Sasha 的回答是：

“我们的主要关注点在于强化学习后的训练（RL post-training）。
我们认为这才是让模型成为强大交互式代理的最佳途径。”

另外，Sasha 还否认了一个流传已久的传闻：
有用户猜测早期的 Cursor 预览模型 Cheetah 是基于 xAI 的 Grok 构建的。
对此 Sasha 回应：

“那完全是假的（Straight up untrue）。”

这种让模型在真实开发环境中训练、运行、验证的思路，是迈向自主软件开发的关键一步。

Rush 总结道：

“要让模型在现实中可靠运行，就必须让它在真实环境中学习。
它不仅要会写代码，更要学会在上下文中测试与改进。”

Composer-1 发布后，Reddit社区反响也是相当热烈。很多网友一致认为它“速度极快、交互顺滑”，并且在解决特定编程任务时非常智能。

有网友表示，自己卡了一周的问题，Composer几分钟内就解决了。

还有网友对比测试了对比测试了 Claude 4.5 Sonnet 和 Composer-1，结论是：

Composer 比 Sonnet快了3分钟完成任务虽然 token 用量多了 20%，但价格便宜 73%每 1K token 成本便宜约 4.5 倍

另外，已经有手快的网友整理了不同模型的API定价表，可以看出Composer的性价比还是很高的。

此外，也有一些开发者质疑多 Agent 并行开发的模式，认为实用性有限，容易浪费 Token等等。

Cursor 2.0 现已开放下载，你可以访问 cursor.com 获取最新版本。大家都快去体验起来！

那么评论区的各位大佬：

你觉得Composer的表现如何呢？

有哪些你觉得好用的功能或设计？

参考链接：

来源：51CTO一点号

标签：模型编程 gpt cursor composer

本文地址：http://news.43b.com.cn/a/1730537.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐