摘要:近日,AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02,宣布该模型在国际最权威的两项语音评测榜单Artificial Analysis和Hugging Face TTS Arena 上,超越OpenAI、ElevenLabs等国际巨头,登
新浪科技讯 5月16日晚间消息,近日,AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02,宣布该模型在国际最权威的两项语音评测榜单Artificial Analysis和Hugging Face TTS Arena 上,超越OpenAI、ElevenLabs等国际巨头,登上双榜榜首。
据介绍,Speech-02在语音模型核心技术指标:字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也更自然、真实。
基于技术与足够泛化的模型能力,Speech-02为用户带来了超拟人、个性化、多样性的语音服务。Speech-02可通过文生音功能给定自然语言文本描述生成符合描述的音色;通过声音参考功能,对任意给定语音实现灵活控制,进行感情、语速、音高、语种等无缝切换;同时支持粤语、葡萄牙语、法语等32个语种,甚至在同一段语音里也可以实现多个语种间的自如切换。
值得关注的是,Speech-02性能登顶同时其商用定价仅为全球头部语音模型ElevenLabs的四分之一,具有高性能和性价比双重优势。(文猛)
来源:新浪财经