中国AI再爆王炸!MiniMax语音模型Speech-02登顶双榜,老外直呼“游戏规则变了”

B站影视 内地电影 2025-05-16 13:29 2

摘要:上海AI独角兽 MiniMax 带着新一代语音大模型 Speech-02 亮相——在国际权威的 Artificial Analysis 和 Hugging Face TTS Arena 两大语音评测榜单上,直接把OpenAI、ElevenLabs等公司甩在身后

全球AI圈又被中国公司“刷屏”了!

上海AI独角兽 MiniMax 带着新一代语音大模型 Speech-02 亮相——在国际权威的 Artificial Analysis 和 Hugging Face TTS Arena 两大语音评测榜单上,直接把OpenAI、ElevenLabs等公司甩在身后,拿下“双料冠军”!

这是什么概念?相当于在语音生成领域,中国技术直接“弯道超车”,站到了世界前排。要知道,年初DeepSeek-R1刚打破对硅谷大模型的“技术迷信”,这次MiniMax又用实力证明: 中国大模型,就是能打!

(国际权威语音评测榜单Artificial Analysis)

(Hugging Face TTS Arena 评测榜单)

外国网友评论:这是音频领域的游戏规则改变者!

技术指标更是看点。字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也更自然、真实。具体来看,与Seed-TTS、CosyVoice 2和真实音频相比,Speech-02在中英文的零样本语音克隆中均实现了更低的WER,表明其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输出。

最让人不能忽视的优势还有它的Speech-02商用定价仅为全球头部模型ElevenLabs的 四分之一 !通过高性能和极致性价比双重优势,推动国产AI语音技术大规模商业化落地。

这在某种程度上意味着,中小公司在昂贵的语音技术面前找到新的解题思路!智能客服、语音交互、AI教育等行业迎来新的机遇。目前,MiniMax已经和 阅文集团、高途教育、香港电视台等公司达成合作,甚至在AI玩具、汽车智能座舱等硬件场景玩出了新花样。

更绝的是“语言天赋”。32种语言无缝切换!方言、小语种全拿捏。MiniMax海外生态负责人Linda介绍,“这次发布的Speech-02能够轻松驾驭32个语种的不同口音和不同情绪,我们相信通过AI对稀缺小语种的支持,未来将多语种的声音以当地最地道的发音传向全世界,帮助全球每一种语言都被听见、每一种文化都被理解”。

从年初的Speech-01支持17种语言,到现在Speech-02覆盖32个语种,MiniMax只用了短短几个月,就完成了“技术迭代+全球落地”的双重跨越。这种“中国速度”背后,是中国AI企业“技术+商业”的双轮驱动——不仅能做出世界顶尖的技术,还能快速让技术变成实实在在的生产力。

行业分析师说:“当中国AI开始用‘技术突破+极致性价比’撕开市场,全球竞争的格局真的要变了。”

从语音克隆到多语种切换,从技术登顶到普惠定价,Speech-02的横空出世,不仅是MiniMax的胜利,更是中国AI的又一次“破圈”。当国外公司还在为“AI语音像不像人”纠结时,中国公司已经在用技术和实力重新定义行业规则。

下一个颠覆全球的中国AI技术,会是什么?我们拭目以待!

来源:环球网海外看中国

相关推荐