告别GPT!最强AI编程神器Cursor自研核心模型,速度快4倍

B站影视 欧美电影 2025-10-30 14:33 1

摘要:AI 编程工具 Cursor 背后的初创公司 Anysphere,在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。

这两天真是大事不断。

AI 编程工具 Cursor 背后的初创公司 Anysphere,在最新的 Cursor 2.0 更新中正式推出了首个自研大型语言模型 —— Composer。

Composer 是一款专为生产级环境设计的高性能编程模型,旨在让 AI 能更快、更精准地执行真实软件开发任务。这意味着 Cursor 不再只是调用第三方模型(如 GPT 或 Claude),而是进入了自主构建核心模型的新阶段。

值得注意的是,Composer 已在 Cursor 自家工程团队的日常开发中投入使用,这表明它的稳定性与成熟度已经达到了可生产的水准。

Cursor 表示,Composer 在大多数任务中可在 30 秒内完成响应,同时在复杂代码库中仍保持高水平的逻辑推理与理解能力。

知名开发者、t3.gg的创始人兼CEO Theo在 X 上表示:Composer是我用过最疯狂的模型之一!又快又聪明。

官方介绍Composer“比同类智能模型快 4 倍”,并专为 Agentic 工作流 而设计——也就是多个自主代理可协作完成编码、规划、测试与审查等任务。

Cursor 研究员 Sasha Rush 在 X上分享了 Composer 的基准性能图表,展示了其在多个模型类别中的领先表现。

Cursor 为 Composer 构建了名为 Cursor Bench 的内部基准体系,数据来自真实开发者在平台上的代理请求。

该测试不仅评估代码正确性,还考察模型是否遵循项目的既有抽象层次、代码风格与工程实践。

结果显示,Composer 达到了前沿级(frontier-level)编程智能,生成速度高达每秒 250 个 token ——这约是现有“快速推理模型”的两倍,且比同类顶级模型快四倍。

官方将测试模型划分为以下几类:

Best Open(如 Qwen Coder、GLM 4.6)Fast Frontier(如 Haiku 4.5、Gemini Flash 2.5)Frontier 7/2025(年中最佳模型)Best Frontier(GPT-5、Claude Sonnet 4.5)

Composer 在智能水平上接近中端 Frontier 模型,但在生成速度上居所有模型之首。

在此之前,Cursor 以其独特的 “vibe coding” 模式受到欢迎 —— 用户只需用自然语言描述功能,即便不是开发者,也能让 AI 自动生成代码。

旧版 Cursor 主要基于第三方模型,如 OpenAI、Anthropic、Google 和 xAI 等。而 Composer 的出现,标志着 Cursor 拥有了自有核心智能模型,但用户仍可选择这些外部模型进行对比使用。

Cursor 研究员 Sasha Rush 在 X 上透露,Composer 是一个基于强化学习(RL) 训练的专家混合模型(MoE):

“我们使用强化学习训练了一个大型 MoE 模型,使它能在真实编程任务中表现出色,同时保持极高速度。”

Rush 进一步解释说,Cursor 团队在设计 Composer 时,与 Cursor 的开发环境同步共建,以确保模型能在生产级规模下高效运行:

“与其他机器学习系统不同,编程智能体几乎不能抽象出实验环境。我们让模型与产品共同设计,使其能在必要规模下运行。”

Allen Institute for AI的机器学习研究员Nathan Lambert也对 Composer 模型强化学习(RL)训练成果大加赞赏:

“我特别喜欢这种漂亮的强化学习训练缩放曲线图。相比推理阶段的缩放曲线(inference-time scaling plots),这种图往往被忽视了。”

Composer 并非在静态数据集上训练,而是在真实的工程场景中学习。训练期间,模型运行在完整的代码库中,能使用一整套生产工具,包括:

文件编辑语义搜索终端命令

每次训练迭代,模型都会解决一个具体任务 —— 可能是生成代码修改、编写方案、或给出精准解释。

强化学习环节同时优化正确性与效率:
Composer 学会了如何合理使用工具、并行处理任务、减少冗余输出。
在训练后期,模型甚至出现了“自发行为”,例如:

自动运行单元测试修复语法/规范错误进行多步代码搜索

这种设计让 Composer 能在与用户相同的开发环境中运作,完全贴合真实编程场景,支持版本控制、依赖管理与迭代测试。

Composer 的诞生基于早期内部原型 Cheetah,Cheetah 主要用于验证低延迟推理的可行性。

Rush 在 X 上写道:

“Cheetah 是该模型的 v0 版本,主要测试速度。
Composer 的速度与之相同,但智能程度高出许多。”

Cursor(Anysphere) 的联合创始人兼 CEO Aman Sanger也表示:Cheetah 是 Composer-1 的早期原型。

Cheetah 的成功让 Cursor 意识到:“响应速度是开发者信任与使用体验的关键。”

Composer 在保持速度的同时,显著提升了推理能力与任务泛化水平。

一位早期测试者表示:

“它快到让我可以一直保持在思考循环中工作。”

Composer 延续了这种实时交互的体验,并拓展到多步骤编码、重构与测试任务。

Composer 深度集成于 Cursor 2.0 的全新多智能体平台中。
用户可最多同时运行 8 个代理,每个代理在独立的工作区(通过 git worktree 或远程机器)中执行任务。开发者可以让多个代理并行尝试同一任务,并对比结果后择优采用。

Cursor内部开发者 Jason Ginsberg 在X上评价:在 Cursor 里运行一个网页 Agent 的感觉,更像是在作画而不是写代码。

此外,Cursor 2.0 还带来了多项配套升级:

内嵌浏览器(正式版):代理可在 IDE 内直接运行与测试代码,并将 DOM 信息传递给模型。改进的代码审查界面:可跨多文件查看模型修改,提升审阅效率。安全沙盒终端(正式版):代理运行的 shell 命令在沙盒中隔离执行,确保本地安全。语音模式(Voice Mode):支持语音指令触发与管理智能体。

为支持大规模 RL 训练,Cursor 自研了强化学习训练架构:

基于 PyTorch + Ray 的异步分布式系统;开发了专用 MXFP8 MoE 内核,结合专家并行与混合分片数据并行;可在上千张 NVIDIA GPU 上低精度原生训练;避免了训练后量化的复杂性,显著提高推理效率。

训练过程中,Composer 在云端运行 数十万并行沙盒环境,每个都是独立的开发工作区。
为承载这些动态工作负载,Cursor 重写了虚拟机调度器,使训练环境与生产环境完全打通。

Cursor 针对企业用户也提供了 Composer 的管理与安全功能:

管理员可集中控制终端沙盒策略、Git 访问与网络权限;支持 Hooks 分发、团队规则管理与操作审计日志;提供团队层级的使用监控与性能分析。

价格层级:

个人用户:从 免费版(Hobby) 到 Ultra($200/月);团队版起价 $40/人/月,企业用户可定制合规与访问方案。

不过,开源工具Datasette的创建者、Django 框架联合创始人Simon Willson 以及一些网友都注意到了一个细节,那就是官方说明中并没有解释模型的来源:

他们是否从零开始训练模型?还是基于某个现有的开源模型(例如 Qwen 或 GLM 系列)进行微调?

Sasha Rush 最近在 Hacker News 上回答了一些相关问题,但在谈到模型基础时态度仍然相当含糊。

当有人直接提问:“Composer 是否是在某个开源基础模型上微调得到的?”
Sasha 的回答是:

“我们的主要关注点在于 强化学习后的训练(RL post-training)。
我们认为这才是让模型成为强大交互式代理的最佳途径。”

另外,Sasha 还否认了一个流传已久的传闻:
有用户猜测早期的 Cursor 预览模型 Cheetah 是基于 xAI 的 Grok 构建的。
对此 Sasha 回应:

“那完全是假的(Straight up untrue)。”

这种让模型在真实开发环境中训练、运行、验证的思路,是迈向自主软件开发的关键一步。

Rush 总结道:

“要让模型在现实中可靠运行,就必须让它在真实环境中学习。
它不仅要会写代码,更要学会在上下文中测试与改进。”

Composer-1 发布后,Reddit社区反响也是相当热烈。很多网友一致认为它“速度极快、交互顺滑”,并且在解决特定编程任务时非常智能。

有网友表示,自己卡了一周的问题,Composer几分钟内就解决了。

还有网友对比测试了对比测试了 Claude 4.5 Sonnet 和 Composer-1,结论是:

Composer 比 Sonnet快了3分钟完成任务虽然 token 用量多了 20%,但价格便宜 73%每 1K token 成本便宜约 4.5 倍

另外,已经有手快的网友整理了不同模型的API定价表,可以看出Composer的性价比还是很高的。

此外,也有一些开发者质疑多 Agent 并行开发的模式,认为实用性有限,容易浪费 Token等等。

Cursor 2.0 现已开放下载,你可以访问 cursor.com 获取最新版本。大家都快去体验起来!

那么评论区的各位大佬:

你觉得Composer的表现如何呢?

有哪些你觉得好用的功能或设计?

参考链接:

来源:51CTO一点号

相关推荐