来源:互联网 更新时间:2026-04-24 08:29
4月24日消息,今日,
这是一套面向Agent时代的全链路语音模型系列,覆盖识别与合成两大核心能力,让语音的输入与输出都可以被语言自由调度。
在语音合成方面,MiMo-V2.5-TTS系列提供三大模型,分别对应不同创作场景:
首先是MiMo-V2.5-TTS,内置多款高质量精品音色,经过专业调优,发音自然、情感贴合,并支持语速、情绪、语气等精细化控制,开箱即用,满足多场景表达。

其次是MiMo-V2.5-TTS-VoiceDesign,
用户可从年龄、性别、口音、音质乃至性格气质等多个维度自由定义,例如“低沉略带嘶哑的老年学者”或“元气满满的少女”,模型即可自动生成对应声音形象。
依托大规模预训练能力,模型对复杂、模糊、甚至相互矛盾的描述也能合理解读,而不局限于"男/女/青年/老年"这类粗粒度标签。
第三是MiMo-V2.5-TTS-VoiceClone,
复刻后的声音不仅保留了原始说话人的音色身份,也保留了气息、节奏、习惯性停顿等个人特征。
同时,克隆音色可继续叠加自然语言指令、音频标签、导演剧本级脚本,实现更高自由度的语音创作。
作为全链路语音模型系列的听觉基座,


目前,MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS-VoiceClone已在Xiaomi MiMo API开放平台限时免费。

洛克王国世界雪影娃娃捕捉攻略 洛克王国世界雪影娃娃怎么捕捉
牛奶价格卷起来了:多家品牌搞促销
于东来回应退休:只是表面退休了 实际还是不退
洛克王国世界伊利斯怎么打
起猛了 在成都看到关公开公交:三国寻梦线巴士正式推出
儿子去世 名下房产被判全归养母:生母缺席成长 养母照顾长大
拆字游戏哪些值得玩2026
洛克王国世界可丽希亚是谁 洛克王国世界可丽希亚角色介绍
“拿捏你的不快乐,1000%笑到断气~”
能穿地的 “Wi-Fi” 无线网络成功了!可深入地表下100米 有望集成到手机中
龙胤立志传铸剑山庄门派有什么特点
Token经济已来 京东云Coding Plan上线
张雪峰追悼会将在明日举行 生前曾有三次自救机会 都被他错过了
洛克王国世界可可果商店兑换哪些
斗熊舞是我国哪个民族的传统舞蹈
超自然行动组如何快速找到棺材 超自然行动组棺材位置一览
洛克王国世界如何获得御三家 洛克王国世界获得御三家方法
保卫向日葵什么阵容强 保卫向日葵强力阵容免费获取攻略
洛克王国世界隐藏精灵怎么获得
女子遇起火拿毛巾捂口鼻:退房被收钱
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc