来源:互联网 更新时间:2026-05-29 17:20
端侧 AI 是一个系统性工程
5 月 25 日至 29 日,面壁智能联合 OpenBMB 开源社区,以每日一项关键技术成果的节奏,办了一场「端侧大模型开源周」。
这在中国乃至全球的大模型公司中,都算得上一次极为罕见的「亮见」。翻开过去三年的历史,也只有以「效率美学」著称的 DeepSeek,曾在2024年做过类似的开源周活动。
从适配国产昇腾、未来有望将600亿参数大模型装进手机的1.58-bit低比特训练大模型BitCPM-CANN,到性能超越两倍参数模型、全球同级最优的MiniCPM5-1B;从AI亲手编写、在H100上比英伟达自家训练框架Megatron更快的ForgeTrain,到重构交互范式的智能体操作系统PilotDeck;再到揭示端侧模型高效智能源头的核心数据集UltraData系列……
这五项成果并非孤立的「技术烟花」,而是一套环环相扣、逻辑严密的「技术组曲」。它们共同指向一个清晰的行业事实:
这场精心策划的「阳谋」,不仅让我们得以一窥面壁智能深不可测的技术「冰山」,更迫使我们重新思考:在通往AGI的道路上,开源的真正价值是什么?而端侧,又将在其中扮演怎样的角色?
提起开源,过去几年大模型圈或多或少都有点「名不副实」的尴尬。
从 Meta Llama 3 那份「开放,但非标准开源」的许可证,到国内一些厂商「开源模型、闭源数据与训练细节」的普遍操作,「伪开源」一直是笼罩在大模型发展道路上的疑云。这背后,是商业公司在开源道路上普遍面临的内在矛盾与痛苦抉择:开源是构建技术生态、吸引开发者的利器,但它会否在未来稀释自身的商业护城河?开源是姿态,还是信仰?
在这样的大背景下,面壁智能与 OpenBMB 开源社区的长期坚守,就显得尤为难得和珍贵。
这种坚守,首先体现在时间的维度上。早在2022年,当国内对大模型的认知还普遍处于混沌初开之际,由清华大学 THUNLP 实验室与面壁智能联合发起的 OpenBMB 开源社区,就已开启了中国最早的、全链路的大模型开源探索。
同年7月,OpenBMB 开源社区推出的免费「大模型公开课」,几乎成为国内第一批大模型从业者的「启蒙教程」,累计播放量达数百万。他们也是国内最早直播大模型训练过程的社区,对培养中国的大模型人才梯队、塑造开放的技术氛围,贡献卓著。
这种坚守,也体现在成果的「含金量」上:
在2024年 Hugging Face 统计全球最受欢迎大模型时,OpenBMB 开源社区的模型下载量位列中国区第一。时至今日,其 GitHub 星标已超过13万,位列全球开源组织前一百;MiniCPM 系列模型全球下载量突破3000万次,UltraData 数据集下载量也超过400万次。这些数字的背后,是全球开发者真金白银的「投票」,也是其开源贡献得到国际认可的最好证明。
更重要的是,面壁智能的开源,是一种体系化的、毫无保留的「真开源」。此次开源周,他们不仅开源了模型(MiniCPM5-1B),还开源了模型背后的「生产线」(ForgeTrain)、「核心工艺」(BitCPM-CANN)、「原材料」(UltraData),乃至「智能体操作系统」(PilotDeck)——这在全球范围内都极为罕见。
这传递出的信号是:面壁智能的开源,并非营销驱动的「机会主义」,而是一种根植于其基因的技术信仰。他们相信,通过彻底的开放,能够最大化地激发社区的创造力,加速技术的迭代,最终形成正向循环的、难以被模仿的生态壁垒。
在这个「模型+生态」的竞争下半场,面壁智能用长达数年的持续投入和一次毫无保留的集中展示,为「何为真正的开源精神」,写下了自己的注脚。
如果说持续的开源展现了面壁智能的格局,那么这次开源周的五项发布,则揭秘了其在端侧 AI 赛道上深不可测的「内功」。它让我们看到,这是一家具备系统性 AGI 研发能力、恐怖的工程化效率和极致技术自信的大模型公司。
ForgeTrain 的出现,是其工程化能力的最佳体现。一个完全由AI编写、零人类代码介入的生产级训练框架,性能反超英伟达官方框架,训练速度比 Megatron 快10%——这本身就是行业奇迹。它标志着面壁智能的研发模式,已经进入了「AI制造AI」的 L3+ 阶段,研发效率实现了指数级跃迁。
而五项成果构成的全栈闭环,则证明了其系统性的研发能力。从最底层的 Infra 创新(BMTrain、BitCPM),到数据治理(UltraData),再到模型算法(MiniCPM、VoxCPM)和上层应用(PilotDeck、松果派、法律大模型、智能座舱等),面壁智能的布局并非单点突破,而是围绕「端侧」这一核心目标,进行的前瞻性、体系化构建。
这一切,都源于一种极致的技术自信。他们自信即便公开了方法论,其体系化的领先优势也难以被快速复制。因为端侧 AI 赛道,从来都不是一个可以「大力出奇迹」的赛道。
云端大模型的核心壁垒在于「规模」——更多的卡、更多的数据。而端侧大模型的壁垒则在于「系统性协同」的复杂度。它要求在算法、软件、硬件、数据之间找到一个极致精妙的平衡点。这需要对模型压缩(如 BitCPM-CANN 的1.58-bit QAT)、高密度数据治理(如 UltraData)、软硬协同(适配国产算力)、高效推理框架(CPM.cu)、前沿智能体(PilotDeck)等多个领域都有世界级的认知和积累。
这是一个「精工细作」的领域。
面壁智能的指针,早在2024年就已拨向端侧。
这两年的时间差,不是简单的模型迭代,而是对整个端侧技术栈的反复打磨、验证与优化,是认知与工程经验上的巨大鸿沟。
这种领先,最直观地体现在 MiniCPM5-1B 的惊人表现上。根据公开评测,其能力在部分任务上已经超越了 GPT-4o 的某些版本。这一事实,不再是理论推演,而是对「密度定律」的强力实证:

图注:2024年12月,面壁智能就已预测2026年端侧模型可实现 GPT-4o 的性能效果

图注:2026年5月,面壁智能新一代「小钢炮」MiniCPM5-1B 的性能就已超越 GPT-4o 的部分版本能力
如果这一趋势持续,整个 AI 行业的底层逻辑将被彻底改写:
这不仅是一场技术路线的演进,更是一场权力与价值的迁移。而在这场即将到来的地壳运动中,已经领先两年的面壁智能,无疑占据了最有利的战略位置。
当我们将面壁智能的开源周与 DeepSeek 的开源周并置对比时,一幅描绘中国大模型发展双雄并立、两种技术哲学交相辉映的画卷,便清晰地展现在我们面前。
DeepSeek 的开源周,展现的是一种
同样,面壁智能的开源周,展现的也是一种
AGI 的终极愿景,是让智能如空气和水一般,无处不在,惠及众生。从这个角度看,将智慧的权杖从云端服务器中解放出来,将其安全、可靠、低成本地放入每一个人的口袋、每一辆汽车、每一个家庭……
这,或许才是通往普惠 AGI 时代,那条更坚实、也更光明的道路。而在这条路上,面壁智能,已然是那个走在最前方的掌灯人。
下饭影视APP下载安装指南
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
《Off Campus》第二季官宣:这对CP还在,但不再是主角
下载浏览器app下载安装选择推荐
免费影视剧APP推荐
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
抖音最火沙雕男生网名(精选100个)
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
网络热词聊污是什么意思
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短剧《情绪超市》剧情介绍
短视频软件推荐
洛克王国世界S2赛季狂欢怪谈介绍
免费看电影的软件推荐
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
KuCoin基本面分析
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc