来源:互联网 更新时间:2026-02-11 11:24
2月11日消息 今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。
Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。
用户只需用自然语言下指令,即可对音色、语速、语调、音量、情绪与方言等进行精细控制。

蚂蚁集团在全模态方向已持续投入多年,Ming-Omni 系列迭代三个版本,此次将 Ming-Flash-Omni 2.0 开源,意味着其核心能力以“可复用底座”的形式对外释放,为端到端多模态应用开发提供统一能力入口。
视觉方面,融合亿级细粒度数据与难例训练策略,显著提升对近缘动植物、工艺细节和稀有文物等复杂对象的识别能力;
音频方面,实现语音、音效、音乐同轨生成,支持自然语言精细控制音色、语速、情绪等参数,并具备零样本音色克隆与定制能力;
图像方面,增强复杂编辑的稳定性,支持光影调整、场景替换、人物姿态优化及一键修图等功能,在动态场景中仍保持画面连贯与细节真实。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
阅读app安卓版下载推荐
4D采矿者官网在哪下载 最新官方下载安装地址
BuuPo官网在哪下载 最新官方下载安装地址
全球超百万玩家上头的女帝模拟器:《盛世天下》女帝篇预约开启!
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
王者荣耀世界反击技巧全解析:实用反制策略与操作指南
36岁男子爱上AI妻子不能自拔:想进行实体亲密行为失败后自杀
手机字幕滚动软件推荐
谁不系罚谁!在北京坐后座不系安全带被罚款20 官方证实
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
闲聊时刻|精灵异化系统开发中&本周精灵爆料
纸嫁衣9官网在哪下载 最新官方下载安装地址
金铲铲之战S17赛季五费卡都有啥
荣耀YOYO Claw PC版首度曝光 或将随MagicBook Pro 14笔记本同步发布
好用的手环阅读app下载安装
《烈焰觉醒》全新跨界联动来袭!
《和平精英》平板4指键位怎么设置-四指键位的设置方法
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc