您的位置：首页 > > 教程攻略 > ai资讯 >苹果渴求的端侧AI杀出黑马：首个认知模型诞生，4B打平GPT-5.4！

苹果渴求的端侧AI杀出黑马：首个认知模型诞生，4B打平GPT-5.4！

来源:互联网 更新时间:2026-06-10 13:28

昨晚的 WWDC 大会上，Siri 借谷歌 1.2 万亿参数 Gemini 的力量“重生”了一把。但另一头呢？亚马逊却悄悄关停了自己那个争议不小的内部 AI 排行榜——原因很简单，员工们调用大模型用得太多，算力开销飙到让管理层直冒冷汗的地步。

这俩事儿搁一块儿看，核心矛盾浮出水面：Token 成本，这玩意儿才是决定 AI 能不能大规模落地的“硬门槛”。

其实更早的时候，AI 界的大神 Andrej Karpathy 就在一个访谈里抛出过一个很有意思的方向：把模型里海量的知识记忆剥离掉，只留下一个“认知核心”——也就是那个会思考、会规划、知道自己什么不懂的“灵魂”。他觉得，哪怕参数规模只有 10 亿，也能实现相当高效的类人思考。这个判断在当时技术圈子里激起了不小的波澜。

Karpathy 的预言与算力的账单

算力成本的压力，已经不再是技术圈内部的小议题，而是赤裸裸地变成了财务决策。亚马逊那个案例就是个典型——员工通过内部 AI 工具疯狂调用大模型推理能力，撑爆的算力支出逼得管理层不得不紧急叫停排行榜。这背后是整个行业正在经历一次“Token 大撤退”，部分公司单日算力消耗甚至触及亿元量级。

大模型的商业模型正撞上一堵结构性高墙：能力越强，推理链越深，单次调用的成本就跟坐火箭一样往上蹿。GPU 成本营收比——这个指标是所有 AI 公司的命门，而模型参数持续膨胀的趋势只会让这个数字越来越难看。

Karpathy 指出的那条路，本质上是把“记忆”和“智能”分开。一个剥离了海量事实知识、但保留了思考算法和问题解决策略的实体——他确信，即便只有 10 亿参数，也能像人类一样思考：如果你问它一个事实性问题，它会知道自己不知道，然后主动去查。

方向上的共识正在形成，但谁能把这个“认知核心”从概念落地成可部署的产品，才是真正的变量。

4B 打平千亿级，新程 Alpha 做了什么

把 Karpathy 描述的“认知核心”从概念推到产品层面的是国内一家公司——明日新程（Nextie）。他们的做法很不一样：通过强化学习训练，将知识与认知解耦，剥离模型中的记忆性知识储备，专门强化泛化和抽象思考能力。

产出的模型叫新程 Alpha，参数规模只有 4B，但已经在训练完成后部署上线——这是行业中首个被明确定义为“认知模型”的产品。

训练方法上有一个不寻常的起点：团队整理了 1800 年至 2020 年跨越 220 年的人类学术论文，试图梳理群体智能的演化脉络，以此为技术路线提供参照系。在此基础上对开源推理模型做强化学习，专注提升泛化和抽象能力。

举个直观的例子：经过训练的模型能将围棋选手的决策模式迁移到日常生活场景——这恰好就是 Karpathy 所说的“保留思考算法”的具体技术实现。

效果层面更有说服力。在群体智能任务中，包括辩论、反思、挑战、投票等多个环节，新程 Alpha 的 4B 参数达到了与 GPT-5.4 等千亿级大模型等效的输出质量，而算力消耗和推理速度优势不言而喻。

这个模型解锁的场景空间，可以从三个层面递进理解：

第一层，多智能体决策质量提升。

在 Harness 决策框架中，使用认知模型的输出效果明显优于传统推理模型。底层模型从“推理”升级为“认知”，带来的是多智能体协作系统中决策链条整体质量的跃升。

第二层，算力成本量级缩减。

4B 参数相较于千亿参数模型，云端部署的算力开销大幅降低。更关键的是，新程 Alpha 支持端侧部署——MacBook、具身智能设备都可以直接运行，算力成本由此转化为电力成本。这对具身智能领域意义尤为突出：用千亿参数大模型驱动一个家务机器人，每一次“思考”都在烧 Token，综合成本可能比直接请人做家务还贵。4B 端侧部署，从根本上改写了这笔账。

第三层，主动式场景解锁。

目前绝大多数 AI 产品都运行在“响应式”模式下——用户发指令，模型响应。而“主动式”模式意味着智能体能自主决策和执行任务，无需等待命令。后者的商业规模远超前者，但一直因为算力成本太高而被挡在门外。新程 Alpha 支持 24 小时不间断运行，成本可控，让之前因为太贵而搁置的主动式智能体终于成为可能。

团队底牌与赛道卡位

明日新程由微软小冰创始团队创立。这支团队的标签是“用小参数赢大参数”——此前训练的开源模型 rinna（日本小冰）以 3.6B 参数登顶日本 Hugging Face 排行榜第一名，击败了 65B 参数的 Llama。新程 Alpha 用 4B 打平千亿级大模型，延续的正是这一套技术基因。

明日新程重仓布局的赛道是 Harness 群体多智能体。这个方向正在获得头部资本的确认——2026 年 3 月，OpenAI 投资了初创公司 Isara，直接将其估值推到 6.5 亿美元，而 Isara 的研究方向正是多智能体协同与群体智能。

在该领域的智能深度评测中，明日新程的综合表现显著高于任何单一大模型。资本验证了赛道价值，评测数据标定了它在赛道内的位置。两个信号叠加起来，指向同一个判断：群体多智能体是 AI 应用层的下一个高价值方向，而认知模型正是驱动它的关键基础设施。

认知模型改变的，不只是参数，更是账本

GPU 成本营收比，这把悬在所有 AI 公司头上的达摩克利斯之剑，是认知模型试图解决的核心问题。用 4B 达到千亿级才能实现的效果，意味着同样的输出质量，对应着一套完全不同的成本结构。

明日新程在采访中透露，团队正在训练泛化能力更强的 8B 认知模型。如果 4B 已经能在群体智能任务中对标 GPT-5.4，那么 8B 的能力边界毫无疑问值得期待。

一个更深远的疑问摆在整个行业面前：当端侧全天候运行一个认知模型的成本降至几乎可以忽略的水平，今天所有基于“用户发指令、模型响应”这种响应式模式设计的 AI 产品，是不是都需要重新审视自己的产品形态？主动式智能体的商业想象空间，可能远超当前响应式智能体下的一切。

苹果渴求的端侧AI杀出黑马：首个认知模型诞生，4B打平GPT-5.4！

Karpathy 的预言与算力的账单

4B 打平千亿级，新程 Alpha 做了什么

第一层，多智能体决策质量提升。

第二层，算力成本量级缩减。

第三层，主动式场景解锁。

团队底牌与赛道卡位

认知模型改变的，不只是参数，更是账本

热门资讯

热门手游

相关攻略

热门专题