TG:MiniMax发布新一代语音大模型

动态 2025-05-20 17:10

MiniMax发布新一代语音大模型

　　近日，AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02，宣布该模型在国际最权威的两项语音评测榜单Artificial Analysis（全球知名AI基准测试机构）和Hugging Face TTS Arena （抱抱脸文本转语音竞技场）上，超越OpenAI、ElevenLabs等国际巨头，登上双榜榜首。

　　据介绍，Speech-02在语音模型核心技术指标：字错率WER和相似度SIM等客观指标上取得了SOTA结果，用户盲听主观评价反馈也显示其更自然、真实。

　　与Seed-TTS、CosyVoice 2和真实音频相比，Speech-02在中英文的零样本语音克隆中均实现了更低的字错率（Word Error Rate, WER），表明其发音错误率更低且更清晰稳定。在SIM方面，Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型，前者生成的语音更逼近真人输出。

　　值得关注的是，Speech-02性能登顶的同时，其商用定价仅为全球头部语音模型ElevenLabs的四分之一，具有高性能和性价比双重优势。目前，MiniMax已在文旅导览、金融服务、语音助手、AI教育等领域应用其大模型服务。

TGapp