来源:互联网 更新时间:2026-06-09 15:00
在刚刚过去的GTC台北大会上,黄仁勋抛出了一个很有意思的观点:过去四十年,我们使用PC的方式基本没变过——打开应用、点击、输入。但现在,微软和英伟达打算重新定义这台机器。
他现场展示了一台能24小时不间断运行个人Agent的电脑。这个场景传达的信号很明确:AI正在从大语言模型时代,迈入Agentic AI时代。
PC的角色也在随之改变。它不再是那个被动等待你操作的死板工具,而是变成了一个能理解情境、进行推理规划、甚至自主调用工具的个人计算中枢。黄仁勋把这个变化称为“自Windows 95以来最重要的一次PC底层重构”。
几乎在同一时间,国产AI PC长城N90 Pro也正式发布了。它的定位和英伟达展示的Agent Computer如出一辙——同样以Agent为设计原点,同样在轻薄的机身里实现了端侧大模型的本地流畅运行。
两条技术路线并行推进,最终指向同一个结论:端侧算力,是进入Agent时代的入场券。
那么问题来了,在具体的解题思路上,国产方案在算力供给、经济账和安全边界这三个维度上,到底有什么不同?
黄仁勋把一台合格的Agent Computer拆解成了三个必要条件。
首先是足够的本地算力。Agent需要同时处理多个模型的调用和推理,参数规模直奔百亿级。其次是安全沙盒。必须确保Agent在一个受保护的环境中运行,不能随意存取整机的资源。最后是Agent运行时,也就是那个能够理解用户意图、拆解任务、调用工具的中间层软件。
这三个条件之所以是必要条件,根源在于Agent的工作方式和传统软件完全不同。传统软件的路径是线性的:你点击一个按钮,它执行一个功能,然后结束。Agent则是循环式的:它收到一个模糊的指令,自己拆解成多个步骤,调用不同的工具,根据中间结果调整下一步行动,直到任务完成为止。在这个过程里,每一次推理都需要算力,每一次工具调用都需要权限管控,每一个步骤的切换都需要在运行时进行调度。
三个条件里,行业最先着手突破的,还是算力。
2024年微软刚提出Copilot+PC标准时,40 TOPS的算力要求一度被认为“够用了”。但两年过去,这个判断已经被推翻。从桌面自动化到智慧会议助手,AI大模型已经从聊天工具变成了实际的生产力工具。一次任务需要多次推理,参数小了根本不够用。行业目前的普遍共识是:35B及以上的参数模型才算入门。
算力需求的增长速度,已经远超芯片迭代的速度。芯片更新一代大约需要两年,而AI应用和多模态大模型,几个月就会迎来一次大的变化。
这种节奏差异带来的影响,已经清晰反映在产业链上。业内头部企业认为,当前大约70%-80%的AI算力还是用在训练上,20%-30%用在推理上。但未来,这个比例会倒过来。TrendForce的数据也显示,北美五大云服务商2026年的AI训练算力预计增长56%,而推理算力将暴增122%。
算力上去了,功耗这个老问题又冒出来了。
传统方案的尴尬在于,当算力从几十TOPS提升到上百TOPS时,芯片的功耗和尺寸会跟着线性增长,结果就是塞不进轻薄的笔记本。

长城N90 Pro AI PC
长城N90 Pro给出的解法是:从需求倒推。先想清楚笔记本到底需要什么,再去选芯片。
市面上不少AI芯片原本是为数据中心设计的,功耗几百瓦,体积巨大。搬到终端设备之后,散热、续航、噪音全都成了麻烦。而长城N90 Pro采用的M50芯片,并不是从服务器方案下放过来的。
M50芯片来自后摩智能,它的底层技术关键点是“存算一体”。传统芯片里,计算和存储是分开的,数据要不停地在两者之间搬来搬去,搬动本身就要消耗大量能量。存算一体把计算和存储做了深度融合,数据不用再长途搬运,功耗自然大幅下降。
在满足35B模型本地运行的前提下,M50的芯片功耗控制在10W左右,整板功耗不到15W。这意味着它可以像一块普通的固态硬盘一样,直接插在M.2接口上工作。
可以看出,在Agent Computer时代,国产方案解决端侧算力问题的方式体现出明显的“需求导向型”。不是从技术端出发,把服务器芯片强行塞进笔记本,而是从终端的真实场景出发,专门设计一颗为笔记本服务的芯片。功耗控制、散热设计、续航平衡,这些工程难题在设计阶段就已经被考虑进去了。
长城选择与后摩智能合作、做深度协同优化,看中的正是他们能把存算一体的概念真正量产化的能力。
一颗10W功耗的芯片,让一台1公斤出头的轻薄本能够本地流畅运行35B参数的大模型。过去需要一块500W以上的GPU和一个全尺寸塔式工作站才能做到的事,现在一台普通笔记本就够了。
算力和功耗一旦“够用了”,下一个必要条件就会聚焦到安全问题上。Agent的工作性质决定了它离不开数据,而本地算力有一个天然的好处:数据不出端。
Agent任务经常涉及会议纪要、个人知识库、办公文档这类敏感信息。一旦涉及云端处理,合规风险就会被放大。端侧运行,数据从输入到输出都在本地闭环,从物理层面就实现了数据的安全合规。这是Agent Computer能够拥有丰富落地场景的先决条件。
黄仁勋也反复强调安全的重要性。全球AI产业已经意识到,Agent要普及,安全是必选项。
2026年,AI PC的普及速度已经可以用充分的市场数据来衡量。Gartner预测,2026年全球AI PC出货量将达到1.43亿台,占整个PC市场的55%。这意味着AI PC可能很快就会超越传统PC,成为选购主流。
中国市场的节奏更快,已经成为拉动市场的核心引擎。IDC预测,2026年国内尽管整体PC出货量预计下滑0.8%,但AI PC出货量将同比激增146.5%,未来五年复合增长率达58.7%,到2029年有望占据整体PC市场36.5%的份额。
操作系统层面也在同步跟进。微软Windows 11的持续更新已经加入了大量AI功能,而国内操作系统厂商如麒麟,也开始整合本地Agent能力。
从芯片、整机、操作系统,再到Agent应用,整条产业链都在为Agent原生PC做准备。
算力讨论的是能不能跑起来,而Token成本决定的是在哪里跑最划算。
这个问题,在Agent大规模落地的2026年,正在重塑整个AI计算的商业逻辑。黄仁勋在3月的GTC 2026上提出了Token经济学,他把Token服务分成了五个层级:
免费层用来吸引用户;基础层每百万Token大约3美元,服务普通用户;进阶层每百万Token大约6美元,提供更大的模型和更快的速度;高速层每百万Token大约45美元,支持长上下文和深度推理;顶级层每百万Token大约150美元,面向超长研究任务和关键路径的实时响应。
他算了一笔账:一个研究员每天使用5000万Token,按每百万150美元计算,对一个研究团队来说是可以接受的。
Token不是一次性买卖,只要AI在运行,Token就在消耗。当Agent应用全面铺开时,一个企业级AI应用的月度Token账单很容易达到几十万美元。
2026年3月,阿里巴巴成立了Token Hub事业群,CEO吴泳铭亲自挂帅。可见Token管理已经从技术问题变成了商业战略问题。目前,国内多家云服务商也已经或正在调整API调用价格,部分模型的百万Token定价在短期内出现了多次上涨。
可以预见,Token在成为一种计费单位之外,还能直接兑换稀缺的商业资源。
端侧算力的商业逻辑,在这里就变得清晰了:一次性投入买断AI PC硬件,之后的每一次基础推理都不再产生Token费用。这个承诺,确实很诱人。
Agent会让Token的消耗量成倍增长,端侧的零边际成本优势也随之从理论变成了现实。一个经常被引用的对比是:一台高端AI PC的硬件成本大约在1万到2万元软妹币,而一个团队如果每天高频调用云端API,几个月的Token费用可能就会超过这个数字。
行业里有人把本地和云端的推理边界,归纳为三条线。
第一条是模型大小,120B及以下参数的模型,本地已经能跑。第二条是安全保密,涉及隐私和敏感数据的场景,必须本地处理。第三条就是商业化,高频使用Token的Agent场景,本地推理可以彻底避开云端的按量计费。
基于这三条线,一个判断正在形成:未来,80%的推理场景会下沉到本地。
这个判断不是空xue来风。Omdia数据显示,通过端、边、云动态调度工作负载的分布式架构,把80%的轻量任务放在本地处理,以每人每天50次AI请求和0.003美元的单次典型成本为基准,可以让1亿用户的年度云端成本从55亿美元降到12亿美元,节省超过43亿美元。
对企业来说,这是一个忽略不了的数字。对于个人用户而言,端侧算力也进一步降低了使用AI的门槛。日常调用Agent能力去完成一些成熟的推理工作和稳定流程,不需要再去购买昂贵的云端算力配额,也不用担心月底会收到一张巨额账单。
基于Token经济学的逻辑,端侧算力的热度开始得到广泛验证。
比如,英伟达发布了面向Windows的PC超级芯片RTX Spark,戴尔、联想、惠普、华硕、宏碁等整机厂商都参与了首批产品名单。这些产品的一个共同卖点就是:本地运行AI,不消耗云端Token配额。
国内厂商的动作同样迅速。在这一轮端侧算力的落地中,长城N90 Pro的发布是一个实实在在的市场动作。在M50这颗已经量产的存算一体芯片的支撑下,35B模型在本地流畅运行。这意味着用户下达的高频Agent指令,Token的消耗完全发生在本地,不产生任何云端调用费用。

后摩漫界M50芯片、力擎LQ50 M.2卡
换句话说,一台长城N90 Pro买回来,只要操作系统和AI应用能支持,后续日常推理的成本几乎为零。
由此,端侧算力完成了一次Agent时代的价值重估。过去它常被视为云计算的廉价替代品,如今已经成为Token消费水涨船高的算力结构中,不可或缺的一层基础设施。
黄仁勋把Token比作数字世界的石油,那么端侧算力扮演的角色,就像是那些自带油田的分布式能源节点:不依赖输油管道,却能独立满足本地用户的全部需求。
当石油价格不断上涨的时候,拥有自备油田的价值,就会格外凸显。
当下,虽然全球AI PC的技术话语权仍然被英伟达、微软等海外巨头主导,但几乎同时出发的国产整机方案,也正在悄然完成一次从跟随到并行的转变。
长城N90 Pro的量产交付,意义不止于一款Agent Computer形态产品的上市,更在于完整地输出了一次国产技术栈的全链路验证。
一直以来,中国市场的PC用户对AI应用的拥抱度更高,日常工作对效率提升的需求更多,对数据隐私和推理延迟的敏感度也更直接。这些都是端侧算力的优势会在国内市场被放大的逻辑支撑。
本地AI带来的低延迟、零风险和个性化体验,直接激活了原本受到移动办公严重冲击的PC换机需求。因此,在这次AI PC升级浪潮中,国产整机厂商的竞争逻辑也发生了变化。
过去很长一段时间,国产PC的核心叙事围绕安全可控、或是高性价比替代展开。AI PC的出现,改变了产品形态的定义方式。如今,安全不再是一个需要单独列出的卖点,而是作为端侧算力的天然属性打包销售。
这种转变的背后,国产端侧芯片正在用实际可落地的产品证明自己。以同样搭载了M50芯片的产品为例:1L机身的AI迷你工作站,通过4颗M50实现了640TOPS/L的算力密度,开箱即可直接运行Qwen3.6等主流本地大模型;超迷你AI主机P7,重量仅有300g,整机最大功耗30W,却能支撑千亿参数模型的本地部署。
这些数字放在全球市场里,都是第一梯队的水平。
有用户在测试了长城N90 Pro之后表示,这是“见过的运行速度最快的AI PC,比用大型台式机GPU跑的很多模型还要快。”
不需要用“国产替代”的修辞来证明什么,产品本身,就是最好的回答。
国产整机厂商在技术选型上也有自己的方法论。以长城为例,在选择端侧AI芯片时,看重的不是单纯的算力数字,而是三个更实际的指标:功耗是否适配笔记本场景、产品是否已经量产、芯片厂商是否愿意做深度的软硬协同优化。
这三点直接回答了端侧AI芯片商业化的三个核心问题:能不能装进去、能不能稳定供货、能不能一起把体验调好。
据了解,长城和后摩智能的合作,从产品规划到测试导入大约花了一年时间,真正的测试到量产又用了半年多。长时间的联合调试,才能换来产品的稳定性和性能释放。
作为国产芯片厂商,后摩智能的目标是助力国产电脑跻身全球AI PC的Top赛道。英伟达的RTX Spark预计2026年秋季上市,而搭载M50的国产Agent Computer,已经早于这个时间节点实现了量产交付。
所以,在AI PC这个产业棋局上,国产技术栈没有再成为追赶者。它正在成为一个从不缺席的主导者,稳扎稳打地从可用到好用、再到智能,三个阶段层层递进。
可用解决的是国产软硬件能不能适配的问题,好用是持续把体验优化到足够流畅。智能阶段,AI能力开始成为产品的核心定义。长城N90 Pro,就处在了这个从“好用到智能”的跨越节点上。
2026年被很多人称为AI Agent元年。英伟达的RTX Spark为全球AI PC划定了性能上限,中国整机方案的量产交付则提供了另一条叙事线索:在Agent Computer这个新赛道上,国产技术栈是一条独立、可行、并且正在加速的路径。从芯片到操作系统再到整机,中国产业链已经具备了完整交付AI Agent计算机的能力。
两条路径服务于不同的市场,但最终必然交汇到同一个方向:让Agent真正成为每个人都能用、用得起、用得放心的基础设施。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
《Off Campus》第二季官宣:这对CP还在,但不再是主角
4D采矿者官网在哪下载 最新官方下载安装地址
免费影视剧APP推荐
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
抖音最火沙雕男生网名(精选100个)
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短剧《情绪超市》剧情介绍
短视频软件推荐
免费看电影的软件推荐
KuCoin基本面分析
苹果macOS 27将优化界面设计并测试AI驱动的Safari标签页自动分组功能
网络热词聊污是什么意思
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
洛克王国世界S2赛季狂欢怪谈介绍
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc