来源:互联网 更新时间:2026-03-09 11:30
3月8日消息,上海人工智能实验室(上海AI实验室)官方宣布,基于此前的DeepLink混训技术方案、跨千公里多智算中心长稳混训千亿参数大模型,正式推出
据悉,DeepLink混推方案基于统一推理中间件、低时延通信、智能流量路由、策略求解器等原创技术,不仅可对多款芯片混合调度与协同推理,性能也大幅提升,

近些年,国产AI GPU如雨后春笋,性能越来越强,但一方面都是各自为战,另一方面大模型推理技术也需要深入优化和提升。
上海AI实验室在国产GPU异构算力中,运用了
同一数据中心内不同规格属性的GPU芯片组合优化使用,可以形成最具性价比的异构算力配比。
以标准化融合算子接口打通上层框架与底层硬件壁垒,实现算法模型在多元硬件上的统一推理,降低应用门槛。
全面兼容各类主流物理连接协议,实现跨架构设备高速互联,核心场景带宽利用率突破97%;具有较强的异步处理能力,可实现计算与通信的重叠。
支持KVCache感知的请求路由,最大限度减少重复或重叠请求,节省计算资源,实现分布式集群负载均衡分配。
自动获取异构芯片全方位评测数据,结合模型配置以及用户服务等级目标等输入,匹配最优PD分离配置策略,兼顾推理性能与成本。


单一算力平台推理加速方面,可以实现在华为昇腾A2上,针对千卡规模下的化学数据生成场景,吞吐率提升61.9%;在沐曦曦云C500上,MinerU多模态生成推理加速60%。
多款国产GPU芯片的深度混合调度与协同推理方面,

值得一提的是,除了以上四家,
相信会看到越来越多的国产GPU并肩战斗!
参考链接:
DeepLink官网:https://deeplink.org.cn/home
DeepLink Github:https://github.com/DeepLink-org
DLInfer仓库:https://github.com/DeepLink-org/dlinfer
DLSlime仓库:https://github.com/DeepLink-org/DLSlime

DeepLink合作伙伴
做出个半成品?实测百度龙虾App“红手指”:58元月费,买不来一杯奶茶
洛克王国世界倍速孵蛋怎么弄
洛克王国世界魔法师晋升任务攻略
舞力全开派对新手入门怎么玩
安卓应用市场下载入口在哪
2026年最受欢迎的VR游戏推荐:经典流行VR手游排行榜
新作《八方旅人0》助力 系列总销量突破700万
异人之下张楚岚有什么技能
报道:韩国称正与伊朗沟通 效仿日本做法
微软公布Windows 11 25H2/26H2性能优化计划 重点提升系统流畅度与文件管理效率
蚂蚁庄园每日答题答案2026年2月28日
崩坏:星穹铁道货币战争成就攻略
减重药将步入“白菜价”时代 司美格鲁肽核心专利3月到期
2026热门超级玛丽手机版游戏推荐合集
2026热门微信小游戏推荐:精选高人气、好玩又上头的微信小游戏合集
2026年精选数学思维训练游戏推荐:提升逻辑与计算能力的优质益智游戏合集
明日方舟终末地安桩不易任务攻略
全民奇迹在哪刷材料
火爆的二次元养成游戏有哪几个 耐玩的二次元养成手游推荐合集2026
山姆部分产品大降价:一开门就有代购来疯抢
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc