来源:互联网 更新时间:2026-05-25 09:11
5月24日消息,AI算力目前的瓶颈已经从GPU转向了存储芯片,国内尤其缺少高性能HBM内存等芯片,所以也发展出了各种优化技术,清华大学日前的研究就在华为昇腾上实现了6倍用量的降低。
面壁智能、清华大学与 OpenBMB 社区日前联合发布了BitCPM-CANN,
顾名思义,这套系统引入了一套三元量化的技术,模型权重被压缩为-1、0、1三种状态,使得显存占用量降低了6倍,还顺带着降低了功耗,因为运算中高耗能的浮点乘法计算简化成了加减法运算。

通常降低算子也会导致大模型的精度降低,不过这套三元量化的实际表现还是很强的,团队公布了从0.5B、1B、3B再到8B参数量的大模型与全精度MiniCPM4的对比,1B、3B和8B 三元版本分别保留了各自对应尺寸全精度原版模型97.1% 、97.2%和95.7%的平均性能。
0.5B小尺寸的性能损失虽然是最大的,但也达到了90.1%的比率。
速度上的损失也在可接受范围内,在昇腾910B芯片平台上,全尺寸精度的吞吐量是155TFLOP/S,三元量化版也有148TFLOP/S,损失只有4.5%。
更重要的是,这套系统一开始就是基于昇腾平台原生开发的,做到了端到端运行,
至于这些技术的意义,不只是提升了国产AI平台的能力,更重要的是降低了对HBM等高价存储芯片的依赖,当初谷歌的那个TurboQuant技术也是差不多降低6倍内存用量,一度引发了三星、SK海力士、美光等公司股价暴跌。
如今内存市场不仅价格涨得离谱,而且厂商几乎都不会增加产能,任由缺货涨价蔓延,改变这个局面是不可能指望三星等公司自己了,还得靠国内的公司提升内存闪存芯片产能,同时加大技术优化,让内存闪存的用量不那么虚高才行。

下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
BuuPo官网在哪下载 最新官方下载安装地址
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
无尽花界时装合辑
人声接近真人!OpenAI一口气更新三款超强语音AI
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
《英雄无敌3》不能在塔楼里城市里招募单位介绍
免费影视剧APP推荐
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc