MiniMax M1开源：一口生成3万字吊打Gemini，智能体性价比完胜DeepSeek？

摘要：最近，MiniMax突然宣布开源其推理模型M1，这一举动在AI圈引起了巨大轰动。M1凭借其1M的超长上下文和卓越的推理性能，不仅在多个核心基准测试中超越了Gemini 2.5 Pro，还以极高的性价比成为新一代开源战神。本文将深入探讨MiniMax M1的技术

最近，MiniMax突然宣布开源其推理模型M1，这一举动在AI圈引起了巨大轰动。M1凭借其1M的超长上下文和卓越的推理性能，不仅在多个核心基准测试中超越了Gemini 2.5 Pro，还以极高的性价比成为新一代开源战神。本文将深入探讨MiniMax M1的技术亮点、性能表现以及实际应用场景，揭示它如何在激烈的市场竞争中脱颖而出，成为智能体时代的强大底座。

就在昨天凌晨！当AI圈还在回味各路神仙打架时，沉寂已久的MiniMax突然扔出了一记重磅炸弹，开启了他们的“MiniMax Week”！

第一天就直接王炸——开源首个推理模型M1！这波操作，直接给我整不会了…出手就是开源，还是在这么阴间的时间点，真的行！

我先说结论：M1凭借1M的超长上下文和恐怖的推理性能，足以媲美Gemini 2.5 Pro，我愿敬称为新一代开源战神！

这不是又一个刷分的模型，这是一个真正为Agent时代打造的、能“干重活”的长推理底座，性价比直接拉满，让DeepSeek和Kimi瞬间emo！

如何体验

MiniMax Agent 已进入内测。

可通过 Google 账号登录官网 https://agent.minimax.io/ 免费尝鲜。

性能屠榜！1M上下文把Gemini拉下神坛？

是骡子是马拉出来遛遛，直接看跑分！

在多个核心基准上，M1的表现只能用“炸裂”来形容，尤其是在「超长」上下文、软件工程和工具调用等维度，直接超越了Qwen3和DeepSeek-R1等一众开源好手。

这个上下文是什么概念？简单来说，可以一口气生成3万字的内容。。我去，这不就一篇短篇小说了吗

但最离谱的，还是MRCR（4-needle）这项测试！

很多人不知道这是个啥，简单说，它就是“大海捞针”测试的究极进化版，专门考察模型在超长对话中精准回溯和理解复杂指代关系的能力。

在这个地狱难度的测试里，M1的表现简直一柱擎天，直接屠榜，跟闭源王者Gemini 2.5 Pro肩并肩！

我相信用过Gemini 2.5 Pro的伙伴都知道，那玩意的上下文有多离谱，而现在，一个开源模型做到了！

我特么…这波直接干碎了所有人的质疑！

技术扒一扒：省钱又省力，这波操作怎么做到的？

M1之所以能这么横，背后是硬核的技术创新，招招打在效率和成本的痛点上。

首先是Lightning Attention机制。

这玩意儿是实现1M超长上下文的核武器！它把传统注意力机制O(L²)的平方级计算复杂度，硬生生压到了近似O(L)的线性级别。这意味着什么？在生成10万token时，M1的计算量（FLOPs）不到DeepSeek R1的一半，生成100K时更是只有后者的25%！

这效率，简直离谱！

其次是高达80K的“思考预算”。这才是“长推理”的关键！

光能吃进长文本不算本事，能进行超长的、连贯的思考和输出，才是真功夫。80K的输出token，意味着M1在面对复杂任务时，可以写出极其详尽的思考过程，一步步拆解、验证、反思，而不是浅尝辄止。这为智能体（Agent）的复杂规划能力提供了坚实的底座。

最后是自研的CISPO强化学习算法。

M1基于456B参数的MoE架构（激活45.9B），但其强化学习（RL）成本低到令人发指：仅用512张H800，3周时间，花了53.47万美元就完成了！背后的功臣就是CISPO，这个骚方法通过裁剪重要性采样权重，极大提升了训练效率，实现了2倍加速。这不仅是技术上的胜利，更是对成本控制的极致诠释，把“性价比”三个字刻在了骨子里。

实测为王！这玩意儿真的能干活吗？

跑分再牛，不如实战。我们把它丢进了一些真实的、甚至变态的场景里，看看它到底能不能打！

测试一：超长上下文处理

MiniMax Agent 基于其自研的 ABAB-01 系列模型，支持高达 400 万 token 的超长上下文窗口。

这相当于什么概念？就是它能一口气读完《明朝那些事儿》，然后你问它“朱元璋在哪里第一次见到齐德”，它就能精准地告诉你。

针对“长上下文处理”能力的信息提取测试：

我把书籍《穷爸爸富爸爸》的PDF丢给了它，让它给这本书写概括和相关建议。之前用DeepSeek测，直接提示只读了23%就崩了。而M1，出色地完成了任务，超长上下文的魅力体现得淋漓尽致！

这体验，真的无敌！

测试二：PPT 制作

在这次更新中，一大亮点是能做漂亮的 PPT——职场牛马必备技能。

对于 MiniMax Agent 来说，PPT 也是多模态的一种。看上去只是图片和文字的结合，但无论从排版、内容和图案设计来讲，都得有主题、有思路、有逻辑，讲究一致性，并且还能根据主题主动补全内容，这才算是解放我们双手的ai。

来自官方的一个案例：

帮我做一个面向初中生讲解动量守恒的ppt

最终生成的PPT截图：

访问：https://vdq166psnf.space.minimax.io/

在代码生成方面，M1能力在线，比如让它做一个“打地鼠”游戏，很快就能生成可玩版本。但不得不吐槽一下，前端审美…有点直男。跟Gemini生成的页面一比，确实还有进步空间。

不过，瑕不掩瑜，功能实现是第一位的！

游戏开发测试：

使用 HTML, CSS, 和 JavaScript 创建一个简单的网页版“打地鼠”游戏。规则如下：
游戏界面是一个 4×4 的网格。
每隔 1-2 秒，会有一只“地鼠”随机出现在一个格子里。
玩家点击“地鼠”即可得分，分数需要实时显示。
游戏包含一个“开始/重新开始”按钮和一个 30 秒的倒计时。
请将所有代码打包到一个 index.html 文件中。