来源:互联网 更新时间:2026-06-10 13:28
昨晚的 WWDC 大会上,Siri 借谷歌 1.2 万亿参数 Gemini 的力量“重生”了一把。但另一头呢?亚马逊却悄悄关停了自己那个争议不小的内部 AI 排行榜——原因很简单,员工们调用大模型用得太多,算力开销飙到让管理层直冒冷汗的地步。
这俩事儿搁一块儿看,核心矛盾浮出水面:Token 成本,这玩意儿才是决定 AI 能不能大规模落地的“硬门槛”。
其实更早的时候,AI 界的大神 Andrej Karpathy 就在一个访谈里抛出过一个很有意思的方向:把模型里海量的知识记忆剥离掉,只留下一个“认知核心”——也就是那个会思考、会规划、知道自己什么不懂的“灵魂”。他觉得,哪怕参数规模只有 10 亿,也能实现相当高效的类人思考。这个判断在当时技术圈子里激起了不小的波澜。
算力成本的压力,已经不再是技术圈内部的小议题,而是赤裸裸地变成了财务决策。亚马逊那个案例就是个典型——员工通过内部 AI 工具疯狂调用大模型推理能力,撑爆的算力支出逼得管理层不得不紧急叫停排行榜。这背后是整个行业正在经历一次“Token 大撤退”,部分公司单日算力消耗甚至触及亿元量级。
大模型的商业模型正撞上一堵结构性高墙:能力越强,推理链越深,单次调用的成本就跟坐火箭一样往上蹿。GPU 成本营收比——这个指标是所有 AI 公司的命门,而模型参数持续膨胀的趋势只会让这个数字越来越难看。
Karpathy 指出的那条路,本质上是把“记忆”和“智能”分开。一个剥离了海量事实知识、但保留了思考算法和问题解决策略的实体——他确信,即便只有 10 亿参数,也能像人类一样思考:如果你问它一个事实性问题,它会知道自己不知道,然后主动去查。
方向上的共识正在形成,但谁能把这个“认知核心”从概念落地成可部署的产品,才是真正的变量。

把 Karpathy 描述的“认知核心”从概念推到产品层面的是国内一家公司——明日新程(Nextie)。他们的做法很不一样:通过强化学习训练,将知识与认知解耦,剥离模型中的记忆性知识储备,专门强化泛化和抽象思考能力。
产出的模型叫新程 Alpha,参数规模只有 4B,但已经在训练完成后部署上线——这是行业中首个被明确定义为“认知模型”的产品。
训练方法上有一个不寻常的起点:团队整理了 1800 年至 2020 年跨越 220 年的人类学术论文,试图梳理群体智能的演化脉络,以此为技术路线提供参照系。在此基础上对开源推理模型做强化学习,专注提升泛化和抽象能力。
举个直观的例子:经过训练的模型能将围棋选手的决策模式迁移到日常生活场景——这恰好就是 Karpathy 所说的“保留思考算法”的具体技术实现。
效果层面更有说服力。在群体智能任务中,包括辩论、反思、挑战、投票等多个环节,新程 Alpha 的 4B 参数达到了与 GPT-5.4 等千亿级大模型等效的输出质量,而算力消耗和推理速度优势不言而喻。
这个模型解锁的场景空间,可以从三个层面递进理解:

明日新程由微软小冰创始团队创立。这支团队的标签是“用小参数赢大参数”——此前训练的开源模型 rinna(日本小冰)以 3.6B 参数登顶日本 Hugging Face 排行榜第一名,击败了 65B 参数的 Llama。新程 Alpha 用 4B 打平千亿级大模型,延续的正是这一套技术基因。

明日新程重仓布局的赛道是 Harness 群体多智能体。这个方向正在获得头部资本的确认——2026 年 3 月,OpenAI 投资了初创公司 Isara,直接将其估值推到 6.5 亿美元,而 Isara 的研究方向正是多智能体协同与群体智能。
在该领域的智能深度评测中,明日新程的综合表现显著高于任何单一大模型。资本验证了赛道价值,评测数据标定了它在赛道内的位置。两个信号叠加起来,指向同一个判断:群体多智能体是 AI 应用层的下一个高价值方向,而认知模型正是驱动它的关键基础设施。

GPU 成本营收比,这把悬在所有 AI 公司头上的达摩克利斯之剑,是认知模型试图解决的核心问题。用 4B 达到千亿级才能实现的效果,意味着同样的输出质量,对应着一套完全不同的成本结构。
明日新程在采访中透露,团队正在训练泛化能力更强的 8B 认知模型。如果 4B 已经能在群体智能任务中对标 GPT-5.4,那么 8B 的能力边界毫无疑问值得期待。
一个更深远的疑问摆在整个行业面前:当端侧全天候运行一个认知模型的成本降至几乎可以忽略的水平,今天所有基于“用户发指令、模型响应”这种响应式模式设计的 AI 产品,是不是都需要重新审视自己的产品形态?主动式智能体的商业想象空间,可能远超当前响应式智能体下的一切。

下饭影视APP下载安装指南
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
《Off Campus》第二季官宣:这对CP还在,但不再是主角
下载浏览器app下载安装选择推荐
免费影视剧APP推荐
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
抖音最火沙雕男生网名(精选100个)
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
网络热词聊污是什么意思
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短剧《情绪超市》剧情介绍
短视频软件推荐
洛克王国世界S2赛季狂欢怪谈介绍
免费看电影的软件推荐
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
KuCoin基本面分析
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc