MiniMax发布新一代语音大模型
作者: 澎湃新闻 日期:2025-05-20 18:48 阅读:0 来源:澎湃新闻
【天维网综合报道】近日,AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02,宣布该模型在国际最权威的两项语音评测榜单Artificial Analysis(全球知名AI基准测试机构)和Hugging Face TTS Arena (抱抱脸文本转语音竞技场)上,超越OpenAI、ElevenLabs等国际巨头,登上双榜榜首。
国际权威语音评测榜单Artificial Analysis 来源:以下图片均由Minimax方提供
据介绍,Speech-02在语音模型核心技术指标:字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也显示其更自然、真实。
与Seed-TTS、CosyVoice 2和真实音频相比,Speech-02在中英文的零样本语音克隆中均实现了更低的字错率(Word Error Rate, WER),表明其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输出。
Hugging Face TTS Arena 评测榜单
值得关注的是,Speech-02性能登顶的同时,其商用定价仅为全球头部语音模型ElevenLabs的四分之一,具有高性能和性价比双重优势。目前,MiniMax已在文旅导览、金融服务、语音助手、AI教育等领域应用其大模型服务。
版权声明
1. 未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。
2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。
版权声明
1.
未经《新西兰天维网》书面许可,对于《新西兰天维网》拥有版权、编译和/或其他知识产权的任何内容,任何人不得复制、转载、摘编或在非《新西兰天维网》所属的服务器上做镜像或以其他任何方式进行使用,否则将追究法律责任。
2. 在《新西兰天维网》上转载的新闻,版权归新闻原信源所有,新闻内容并不代表本网立场。
- 中国5月LPR下调:1年期、5年期以上品种均下调10个基点
- 上海位居全球40城科技传播能力第六名
- 住建部:截至2024年底,中国超9.4亿人生活在城镇
- 武汉烧烤店外发生枪击案 至少一死二伤
- 中国多家大行下调存款利率 1年期下破1%
- 特朗普与普京通电话
- 涉杀害两人刺伤两人 中国籍男子被韩国警方抓获
- 俄乌直接谈判结束 乌称“毫无成果”
- 标普500指数五连阳!穆迪下调美国信用评级
- 美联储计划裁员约10%
· 请您文明上网、理性发言
· 尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任
· 您的留言只代表个人意见,不代表本站立场
· 天维网拥有管理笔名和留言的一切权利
· 您在天维网留言板发表的言论,天维网有权在网站内转载或引用
· 天维网新闻留言板管理人员有权保留或删除其管辖留言中的任意内容
· 参与本留言即表明您已经阅读并接受上述条款
查看所有评论 共( 条)