MiniMax的产品上新周:一场蓄谋已久的进攻

B站影视 韩国电影 2025-06-27 05:54 1

摘要:本周,MiniMax开始陆续发布4款新模型和2款Agent产品,包括已经发布的首款混合构架开源推理模型MiniMax M1(以下简称M1)、视频生成模型MiniMax Hailuo 02(以下简称Hailuo 02)、类似Manus的通用Agent产品Mini

OpenAI和DeepSeek之后,MiniMax也有了自己的产品上新周。

本周,MiniMax开始陆续发布4款新模型和2款Agent产品,包括已经发布的首款混合构架开源推理模型MiniMax M1(以下简称M1)、视频生成模型MiniMax Hailuo 02(以下简称Hailuo 02)、类似Manus的通用Agent产品MiniMax Agent、视频Agent产品Hailuo Video Agent;以及即将发布的音乐模型Music1.5与文生音模型Voice Design。

MiniMax早在2022年初就成立了,是大模型浪潮中最早成立的大模型新创公司之一。DeepSeek推出比肩OpenAI o1的推理模型R1之前,MiniMax一直是国内估值最高、产品用户和营收规模最大的AI独角兽公司,仅去年前8个月,其海外产品Talkie的全球下载量就快速突破千万次,超过Character AI,成为美国市场下载量第4的人工智能应用。

黑马DeepSeek的出现一度搅乱了全球大模型市场,包括零一万物、百川智能、字节跳动等在内的中国大模型公司都大幅调整了公司战略方向,要么只聚焦应用层、要么聚焦更细分的垂直赛道、要么把侧重点重新调回基座模型。MiniMax无疑也受到了DeepSeek的冲击,但它给出的反应不是收缩,而是更富野心:从模型层到应用层,从文本到多模态,MiniMax都在进攻——这是个与众不同的姿态,同时也是个只有极少数公司才敢尝试的挑战。

重要的是,它完成了自己给自己出的难题。

模型:重夺领导地位之战

新推出的几款模型中,M1模型是MiniMax上新周中最先发布也是最重要的一款模型。和DeepSeek类似,M1也基于一个包含预训练的基座模型(MiniMax-Text-01)进行强化学习后构建而成,拥有4560亿参数,并且同样采用混合专家结构(MoE)。不过,如同DeepSeek通过多项在架构和infra层的工程创新超越OpenAI的o1一样,MiniMax也在M1模型中提出了多项工程创新,这些创新使得M1在多个维度上实现了对OpenAI、Anhtropic、DeepSeek等同类模型的超越。

首先是混合注意力机制。与同行普遍采用传统Transformer的自注意力计算机制不同,M1使用了1/8的自注意力机制,另外7/8使用了自创的Lightning Attention(线性注意力)。这种混合注意力机制大幅降低了模型的计算量,技术报告称MiniMax仅用了512块H800芯片和3周时间,就完成了从长文本模型MiniMax-Text-01到推理模型MiniMax-M1的强化学习,算力成本仅为53.5万美元。

而在推理时,采用混合注意力机制的M1的计算速度也更快。比如在生成长度为10万token时,M1的计算量仅为DeepSeek R1的25%。技术报告称,M1模型在数学和编程等任务上比DeepSeek-R1模型还要高效。在工具使用场景(TAU-bench)中MiniMax-M1-40k领跑所有开源权重模型,超过闭源模型Gemini-2.5 Pro。

更高的计算效率带来了更大的上下文长度。技术报告显示,M1模型最长能一次性处理100万个token,相当于140万汉字,差不多是七八本书和一个小时的视频内容。这个长度可以允许模型更好地进行推理——相较于传统非推理模型,推理模型的反思能力会在推理过程中消耗更多token量。如果上下文长度不够长,模型能够处理的任务就会有限,比如难以胜任深度搜索、科研、多模态任务等复杂任务。

100万token的上下文长度使得M1模型成为目前市面上上下文最长的推理模型。目前,与此相当的只有Google最先进的模型Gemini 2.5 Pro,OpenAI的o3模型和Anthropic的Claude Opus 4的上下文窗口都只能处理大约20万个token,只有M1的1/5,而DeepSeek的上下文长度只有M1的1/8。

M1模型表现出了更强的工具使用(tool use)能力,即它能进行更长的推理而仍然保持稳定。tau_bench测试集的「多轮工具调用」测试显示,M1模型能在超过30轮以上的长链路思考和工具调用中表现稳定。这种能力有利于构建更强大的Agent。3月初风靡市场的通用AgentManus,所基于的主要就是Anthropic今年2月更新的Claude 3.7模型,后者在推理能力上较前代大为提升。

其实早在去年8月底发布首个视频生成模型abab-video-1时,MiniMax就已经探索出并在模型中使用了线性注意力机制,正是这种持续的底层创新,让MiniMax在面对新挑战时得以快速重建自己的优势。

产品:推理、多模态和Agent,MiniMax都想要

相较于模型,MiniMax在产品端的野心看起来更大。

一个表现就是通用Agent——MiniMax Agent的发布。目前,MiniMax是国内AI六小龙中最早发布通用Agent的公司,在此之前,市场上出现过的通用Agent产品只有Manus。MiniMax Agent的出现当然跟MiniMax新发布的M1模型相关,如果MiniMax不亲自推出,市面上也会出现其他创业者根据M1模型构建的Agent。

MiniMax Agent的出现是一个信号,它告诉市场「模型即Agent」,即通用智能体的机会即使不属于大公司,也会属于模型公司。

借助模型层的进展,MiniMax进入了更多应用领域。今年3月,MiniMax进行了产品线调整,将旗下现有产品「海螺AI」更名为「MiniMax」,与公司同名,聚焦文本理解和生成;另外重新推出一个叫「海螺视频」的产品,主打视频生成,与快手的可灵AI和字节跳动的即梦AI竞争。接下来,MiniMax还将分拆单独的音频品牌,名称未知。

此前,MiniMax的核心产品星野(国内)和Talkie(海外)都是社区型应用,除此之外,它并未在ChatBot、视频生成和音频生成领域分别单独布局产品和品牌。

如今,打开MiniMax官网,最醒目的两栏一栏陈列着它最新更新的几款模型,从M1到Hailuo 02、Speech 02,另一栏,它已直白展示了5款核心产品,MiniMax Chat、MiniMax Agent、海螺视频、MiniMax Audio和星野。M1和Hailuo 02、Speech 02三款模型明显分别对应支持MiniMax Chat、海螺视频和MiniMax Audio三款产品。MiniMax Agent和星野则需要多款模型的同时支持。

虽然入局不算早,海螺视频已对市场规模更大的快手可灵AI和字节跳动的即梦形成挑战。相较于上一代视频模型,Hailuo 02的参数量和训练数据量分别是上一代产品的3倍和4倍。MiniMax称,Hailuo 02是目前全球唯一一个可以实现类似体操这种高度复杂场景的视频大模型。在国际权威测评榜单Artificial Analysis排名中,Hailuo 02已超过Google的Veo 3和快手的可灵。并且,Hailuo 02给出了比Runway、可灵等同行更低的价格。

M1模型的发布则有助于提升MiniMax同名ChatBot在聊天机器人市场的份额。DeepSeek已经表明,只要模型够好用,终端流量提升是自然会发生的事,跟进入时间早晚、花在广告投放上的费用多少都没有关系。

来源:寂寞的咖啡

相关推荐