MiniMax语音模型Speech-02登顶双榜

2025年05月16日 | 小微 | 浏览量:51575

MiniMax语音模型Speech-02登顶双榜
图片来源于网络,如有侵权,请联系删除

  在国际最权威的 Artificial Analysis和Hugging Face TTS Arena两大语音评测榜单上,上海AI独角兽MiniMax带着新一代语音大模型Speech-02登顶。

国际权威语音评测榜单Artificial Analysis

MiniMax语音模型Speech-02登顶双榜
图片来源于网络,如有侵权,请联系删除

MiniMax语音模型Speech-02登顶双榜
图片来源于网络,如有侵权,请联系删除

Hugging Face TTS Arena评测榜单

  在技术指标上,字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也更自然、真实。具体来看,与Seed-TTS、CosyVoice 2和真实音频相比,Speech-02在中英文的零样本语音克隆中均实现了更低的WER,表明其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输出。

  值得一提的是,Speech-02的商用定价仅为全球头部模型ElevenLabs的四分之一。通过超高性能和极致性价比双重优势,推动国产AI语音技术大规模商业化落地。

  这意味着中小公司再也不用为昂贵的语音技术发愁,智能客服、语音交互、AI教育等行业直接“原地起飞”。目前,MiniMax已经和阅文集团、高途教育等多家国内企业达成合作,甚至在AI玩具、汽车智能座舱等硬件场景玩出了新花样。

  在“语言天赋”上做到32种语言无缝切换,方言、小语种全拿捏。MiniMax海外生态负责人Linda介绍,“这次发布的Speech-02能够轻松驾驭32个语种的不同口音和不同情绪,我们相信通过AI,通过对稀缺小语种的支持,未来将多语种的声音以当地最地道的发音传向全世界,帮助全球每一种语言都被听见、每一种文化都被理解”。

  从年初的Speech-01支持17种语言,到现在Speech-02覆盖32个语种,MiniMax只用了短短几个月,就完成了“技术迭代+全球落地”的双重跨越。这种“中国速度”背后,是中国AI企业“技术+商业”的双轮驱动——不仅能做出世界顶尖的技术,还能快速让技术变成实实在在的生产力。

  从语音克隆到多语种切换,从技术登顶到普惠定价,Speech-02的横空出世,不仅是MiniMax的胜利,更是中国AI的又一次“破圈”,中国公司已经在用技术和实力重新定义行业规则。

【责任编辑:周靖杰】
    阅读下一篇:
              版权声明

              本文仅代表作者观点,不代表xx立场。
              本文系作者授权xxx发表,未经许可,不得转载。

              标签列表