热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >苹果渴求的端侧AI杀出黑马:首个认知模型诞生,4B打平GPT-5.4!

苹果渴求的端侧AI杀出黑马:首个认知模型诞生,4B打平GPT-5.4!

来源:互联网 更新时间:2026-06-10 13:28

昨晚的 WWDC 大会上,Siri 借谷歌 1.2 万亿参数 Gemini 的力量“重生”了一把。但另一头呢?亚马逊却悄悄关停了自己那个争议不小的内部 AI 排行榜——原因很简单,员工们调用大模型用得太多,算力开销飙到让管理层直冒冷汗的地步。

这俩事儿搁一块儿看,核心矛盾浮出水面:Token 成本,这玩意儿才是决定 AI 能不能大规模落地的“硬门槛”。


其实更早的时候,AI 界的大神 Andrej Karpathy 就在一个访谈里抛出过一个很有意思的方向:把模型里海量的知识记忆剥离掉,只留下一个“认知核心”——也就是那个会思考、会规划、知道自己什么不懂的“灵魂”。他觉得,哪怕参数规模只有 10 亿,也能实现相当高效的类人思考。这个判断在当时技术圈子里激起了不小的波澜。

Karpathy 的预言与算力的账单

算力成本的压力,已经不再是技术圈内部的小议题,而是赤裸裸地变成了财务决策。亚马逊那个案例就是个典型——员工通过内部 AI 工具疯狂调用大模型推理能力,撑爆的算力支出逼得管理层不得不紧急叫停排行榜。这背后是整个行业正在经历一次“Token 大撤退”,部分公司单日算力消耗甚至触及亿元量级。

大模型的商业模型正撞上一堵结构性高墙:能力越强,推理链越深,单次调用的成本就跟坐火箭一样往上蹿。GPU 成本营收比——这个指标是所有 AI 公司的命门,而模型参数持续膨胀的趋势只会让这个数字越来越难看。

Karpathy 指出的那条路,本质上是把“记忆”和“智能”分开。一个剥离了海量事实知识、但保留了思考算法和问题解决策略的实体——他确信,即便只有 10 亿参数,也能像人类一样思考:如果你问它一个事实性问题,它会知道自己不知道,然后主动去查。

方向上的共识正在形成,但谁能把这个“认知核心”从概念落地成可部署的产品,才是真正的变量。


4B 打平千亿级,新程 Alpha 做了什么

把 Karpathy 描述的“认知核心”从概念推到产品层面的是国内一家公司——明日新程(Nextie)。他们的做法很不一样:通过强化学习训练,将知识与认知解耦,剥离模型中的记忆性知识储备,专门强化泛化和抽象思考能力。

产出的模型叫新程 Alpha,参数规模只有 4B,但已经在训练完成后部署上线——这是行业中首个被明确定义为“认知模型”的产品。

训练方法上有一个不寻常的起点:团队整理了 1800 年至 2020 年跨越 220 年的人类学术论文,试图梳理群体智能的演化脉络,以此为技术路线提供参照系。在此基础上对开源推理模型做强化学习,专注提升泛化和抽象能力。

举个直观的例子:经过训练的模型能将围棋选手的决策模式迁移到日常生活场景——这恰好就是 Karpathy 所说的“保留思考算法”的具体技术实现。

效果层面更有说服力。在群体智能任务中,包括辩论、反思、挑战、投票等多个环节,新程 Alpha 的 4B 参数达到了与 GPT-5.4 等千亿级大模型等效的输出质量,而算力消耗和推理速度优势不言而喻。

这个模型解锁的场景空间,可以从三个层面递进理解:

第一层,多智能体决策质量提升。

在 Harness 决策框架中,使用认知模型的输出效果明显优于传统推理模型。底层模型从“推理”升级为“认知”,带来的是多智能体协作系统中决策链条整体质量的跃升。

第二层,算力成本量级缩减。

4B 参数相较于千亿参数模型,云端部署的算力开销大幅降低。更关键的是,新程 Alpha 支持端侧部署——MacBook、具身智能设备都可以直接运行,算力成本由此转化为电力成本。这对具身智能领域意义尤为突出:用千亿参数大模型驱动一个家务机器人,每一次“思考”都在烧 Token,综合成本可能比直接请人做家务还贵。4B 端侧部署,从根本上改写了这笔账。

第三层,主动式场景解锁。

目前绝大多数 AI 产品都运行在“响应式”模式下——用户发指令,模型响应。而“主动式”模式意味着智能体能自主决策和执行任务,无需等待命令。后者的商业规模远超前者,但一直因为算力成本太高而被挡在门外。新程 Alpha 支持 24 小时不间断运行,成本可控,让之前因为太贵而搁置的主动式智能体终于成为可能。


团队底牌与赛道卡位

明日新程由微软小冰创始团队创立。这支团队的标签是“用小参数赢大参数”——此前训练的开源模型 rinna(日本小冰)以 3.6B 参数登顶日本 Hugging Face 排行榜第一名,击败了 65B 参数的 Llama。新程 Alpha 用 4B 打平千亿级大模型,延续的正是这一套技术基因。


明日新程重仓布局的赛道是 Harness 群体多智能体。这个方向正在获得头部资本的确认——2026 年 3 月,OpenAI 投资了初创公司 Isara,直接将其估值推到 6.5 亿美元,而 Isara 的研究方向正是多智能体协同与群体智能。

在该领域的智能深度评测中,明日新程的综合表现显著高于任何单一大模型。资本验证了赛道价值,评测数据标定了它在赛道内的位置。两个信号叠加起来,指向同一个判断:群体多智能体是 AI 应用层的下一个高价值方向,而认知模型正是驱动它的关键基础设施。


认知模型改变的,不只是参数,更是账本

GPU 成本营收比,这把悬在所有 AI 公司头上的达摩克利斯之剑,是认知模型试图解决的核心问题。用 4B 达到千亿级才能实现的效果,意味着同样的输出质量,对应着一套完全不同的成本结构。

明日新程在采访中透露,团队正在训练泛化能力更强的 8B 认知模型。如果 4B 已经能在群体智能任务中对标 GPT-5.4,那么 8B 的能力边界毫无疑问值得期待。

一个更深远的疑问摆在整个行业面前:当端侧全天候运行一个认知模型的成本降至几乎可以忽略的水平,今天所有基于“用户发指令、模型响应”这种响应式模式设计的 AI 产品,是不是都需要重新审视自己的产品形态?主动式智能体的商业想象空间,可能远超当前响应式智能体下的一切。


热门手游

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc