来源:互联网 更新时间:2026-06-09 01:27
6月9日消息,据媒体报道,日前,
仅用一个月时间,项目团队便基于昇腾910C国产算力集群,成功实现DeepSeek-V4-Pro的全参数续训练与SFT(监督微调)稳定运行。训练累计完成超过1500步,模型训练MFU(模型算力利用率)超过30%,关键训练算子效率提升约14%。
DeepSeek-V4-Pro是一款拥有1.6万亿参数的MoE(混合专家)开源旗舰模型,采用了CSA+HCA混合稀疏注意力、mHC连接等创新机制。相比上一代DeepSeek-V3/R1,它对国产训练框架提出了全方位的“极限挑战”。
经过联合攻关,项目已在千卡级昇腾910C国产算力集群上实现了DeepSeek-V4-Pro全参数后训练的稳定运行。
模型迭代超过1500步,全程无迭代跳过或NaN异常。关键训练算子效率较初始版本提升约14%,最终MFU稳定达到34.9%,单步训练时间稳定在27秒。团队同步打通了DeepSeek‑V4‑Flash的全参数续训练与SFT完整链路。
本次成果并非单次演示,而是具备可复现、可工程化交付的万亿级MoE模型国产算力稳定训练能力。项目已完成工业级自动化运筹建模场景的闭环验证,证明国产算力能够在短周期、低成本下完成行业大模型的专项增强训练。
技术层面,项目实现了三大突破:一是成功构建了覆盖权重、梯度、激活、优化器状态的分布式承载方案,实现数据并行、张量并行、流水并行与专家并行的协同工作;二是优化了MoE路由与稀疏注意力算子,建立了专家负载均衡机制,有效缓解通信拥堵与负载失衡;三是构建了全指标可视化的长稳监控体系,在多日连续训练中未出现一次Loss失控或NaN值。
在能力验证环节,项目设计了一项“硬核”实验——增强大模型的数学建模能力。团队搭建了一条SFT建模数据生产工作流,产出3000条高质量数学建模任务SFT样本,覆盖4类目标任务与3种问题形态。
训练结果显示:模型LM Loss收敛至0.2056,MTP 1 Loss收敛至0.2538,梯度曲线平稳。

下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
《Off Campus》第二季官宣:这对CP还在,但不再是主角
4D采矿者官网在哪下载 最新官方下载安装地址
免费影视剧APP推荐
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短剧《情绪超市》剧情介绍
短视频软件推荐
抖音最火沙雕男生网名(精选100个)
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
网络热词聊污是什么意思
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
洛克王国世界S2赛季狂欢怪谈介绍
免费看电影的软件推荐
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
KuCoin基本面分析
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc