摘要:最近,MiniMax突然宣布开源其推理模型M1,这一举动在AI圈引起了巨大轰动。M1凭借其1M的超长上下文和卓越的推理性能,不仅在多个核心基准测试中超越了Gemini 2.5 Pro,还以极高的性价比成为新一代开源战神。本文将深入探讨MiniMax M1的技术
最近,MiniMax突然宣布开源其推理模型M1,这一举动在AI圈引起了巨大轰动。M1凭借其1M的超长上下文和卓越的推理性能,不仅在多个核心基准测试中超越了Gemini 2.5 Pro,还以极高的性价比成为新一代开源战神。本文将深入探讨MiniMax M1的技术亮点、性能表现以及实际应用场景,揭示它如何在激烈的市场竞争中脱颖而出,成为智能体时代的强大底座。
就在昨天凌晨!当AI圈还在回味各路神仙打架时,沉寂已久的MiniMax突然扔出了一记重磅炸弹,开启了他们的“MiniMax Week”!
第一天就直接王炸——开源首个推理模型M1!这波操作,直接给我整不会了…出手就是开源,还是在这么阴间的时间点,真的行!
我先说结论:M1凭借1M的超长上下文和恐怖的推理性能,足以媲美Gemini 2.5 Pro,我愿敬称为新一代开源战神!
这不是又一个刷分的模型,这是一个真正为Agent时代打造的、能“干重活”的长推理底座,性价比直接拉满,让DeepSeek和Kimi瞬间emo!
如何体验
MiniMax Agent 已进入内测。
可通过 Google 账号登录官网 https://agent.minimax.io/ 免费尝鲜。
性能屠榜!1M上下文把Gemini拉下神坛?是骡子是马拉出来遛遛,直接看跑分!
在多个核心基准上,M1的表现只能用“炸裂”来形容,尤其是在「超长」上下文、软件工程和工具调用等维度,直接超越了Qwen3和DeepSeek-R1等一众开源好手。
这个上下文是什么概念?简单来说,可以一口气生成3万字的内容。。我去,这不就一篇短篇小说了吗
但最离谱的,还是MRCR(4-needle)这项测试!
很多人不知道这是个啥,简单说,它就是“大海捞针”测试的究极进化版,专门考察模型在超长对话中精准回溯和理解复杂指代关系的能力。
在这个地狱难度的测试里,M1的表现简直一柱擎天,直接屠榜,跟闭源王者Gemini 2.5 Pro肩并肩!
我相信用过Gemini 2.5 Pro的伙伴都知道,那玩意的上下文有多离谱,而现在,一个开源模型做到了!
我特么…这波直接干碎了所有人的质疑!
技术扒一扒:省钱又省力,这波操作怎么做到的?M1之所以能这么横,背后是硬核的技术创新,招招打在效率和成本的痛点上。
首先是Lightning Attention机制。
这玩意儿是实现1M超长上下文的核武器!它把传统注意力机制O(L²)的平方级计算复杂度,硬生生压到了近似O(L)的线性级别。这意味着什么?在生成10万token时,M1的计算量(FLOPs)不到DeepSeek R1的一半,生成100K时更是只有后者的25%!
这效率,简直离谱!
其次是高达80K的“思考预算”。这才是“长推理”的关键!
光能吃进长文本不算本事,能进行超长的、连贯的思考和输出,才是真功夫。80K的输出token,意味着M1在面对复杂任务时,可以写出极其详尽的思考过程,一步步拆解、验证、反思,而不是浅尝辄止。这为智能体(Agent)的复杂规划能力提供了坚实的底座。
最后是自研的CISPO强化学习算法。
M1基于456B参数的MoE架构(激活45.9B),但其强化学习(RL)成本低到令人发指:仅用512张H800,3周时间,花了53.47万美元就完成了!背后的功臣就是CISPO,这个骚方法通过裁剪重要性采样权重,极大提升了训练效率,实现了2倍加速。这不仅是技术上的胜利,更是对成本控制的极致诠释,把“性价比”三个字刻在了骨子里。
实测为王!这玩意儿真的能干活吗?跑分再牛,不如实战。我们把它丢进了一些真实的、甚至变态的场景里,看看它到底能不能打!
测试一:超长上下文处理
MiniMax Agent 基于其自研的 ABAB-01 系列模型,支持高达 400 万 token 的超长上下文窗口。
这相当于什么概念?就是它能一口气读完《明朝那些事儿》,然后你问它“朱元璋在哪里第一次见到齐德”,它就能精准地告诉你。
针对“长上下文处理”能力的信息提取测试:
我把书籍《穷爸爸富爸爸》的PDF丢给了它,让它给这本书写概括和相关建议。之前用DeepSeek测,直接提示只读了23%就崩了。而M1,出色地完成了任务,超长上下文的魅力体现得淋漓尽致!
这体验,真的无敌!
测试二:PPT 制作
在这次更新中,一大亮点是能做漂亮的 PPT——职场牛马必备技能。
对于 MiniMax Agent 来说,PPT 也是多模态的一种。看上去只是图片和文字的结合,但无论从排版、内容和图案设计来讲,都得有主题、有思路、有逻辑,讲究一致性,并且还能根据主题主动补全内容,这才算是解放我们双手的ai。
来自官方的一个案例:
帮我做一个面向初中生讲解动量守恒的ppt
最终生成的PPT截图:
访问:https://vdq166psnf.space.minimax.io/
在代码生成方面,M1能力在线,比如让它做一个“打地鼠”游戏,很快就能生成可玩版本。但不得不吐槽一下,前端审美…有点直男。跟Gemini生成的页面一比,确实还有进步空间。
不过,瑕不掩瑜,功能实现是第一位的!
游戏开发测试:
使用 HTML, CSS, 和 JavaScript 创建一个简单的网页版“打地鼠”游戏。规则如下:
游戏界面是一个 4×4 的网格。
每隔 1-2 秒,会有一只“地鼠”随机出现在一个格子里。
玩家点击“地鼠”即可得分,分数需要实时显示。
游戏包含一个“开始/重新开始”按钮和一个 30 秒的倒计时。
请将所有代码打包到一个 index.html 文件中。
MiniMax M1的发布只是开始,这不,今天又发了AI生视频的海螺02
感兴趣可以去测一下:https://hailuoai.video/create
网友实测效果非常丝滑。
MiniMax这种“左手模型,右手Agent”的打法,稳扎稳打,正在构建一个从底层模型到上层应用、数据飞轮自洽的坚固生态。
当别人还在为高昂的token成本发愁时,MiniMax已经把价格打了下去,把智能提了上来。
这一周,MiniMax的好戏才刚刚开始。
让子弹再飞一会儿,让我们继续围观,看AI的这一把火,还能烧得多么热烈!
来源:人人都是产品经理