来源:互联网 更新时间:2026-06-11 15:06
Agent应用的时代,已经站在了门口。
自大模型技术浪潮兴起,Agent(智能体)便一直是焦点。进入2026年,随着OpenClaw等现象级产品的出现,Agent彻底破圈,进入了大众视野。更重要的是,如果说过去的Agent更多停留在演示或特定定制场景,那么随着近一年来Agent Skills等技术的成熟,如今的Agent已经能够处理更多实际、复杂的任务。一个属于Agent应用形态的时代,或许真的不远了。
在Agent应用出现之前,无论是早期的单机程序,还是如今主流的云原生微服务,其本质都是由开发者针对特定场景编写的确定性程序。代码逻辑清晰,行为可预测。
但Agent彻底改变了这一点。它的运行逻辑不再由程序员一行行敲定,而是交由大模型动态生成。无论是业务负责人、运维工程师,还是框架开发者,都无法精确预知大模型面对一个具体问题时会如何思考、调用哪些工具、生成怎样的代码。这种与生俱来的“非确定性”,是Agent区别于以往所有应用形态的根本特征。
问题在于,我们现有的基础设施——从容器编排到微服务治理——几乎都是为确定性应用设计的。这很可能成为Agent迈向企业级大规模应用的最大障碍,但反过来看,这也是基础设施领域一个绝佳的技术创新机遇。
非确定性并非一个抽象概念,它直接催生了三个具体而棘手的运行特征:高动态性、安全风险以及长会话需求。
传统应用是静态的。一个微服务处理请求的逻辑基本固定,运维人员可以基于对代码的了解,为每个容器实例配置统一的资源规格。
Agent则完全不同。它的执行路径由大模型实时驱动,面对用户千奇百怪的自然语言提问,每次的“思考过程”都可能天差地别。可能简单问答瞬间完成,也可能需要多轮对话、调用多个外部工具,甚至动态执行AI生成的代码,复杂任务还可能拉起新的子Agent协同工作。

这就带来了一个非常现实的问题:资源怎么给?给少了,复杂请求可能中途失败或响应缓慢;拍脑袋给每个实例都分配超大资源,又会造成巨大的浪费。以往那种“一套配置管所有”的静态资源分配模式,在Agent的动态世界面前彻底失灵了。
Agent的另一个特征是执行环境可能不安全。运行中调用外部工具或执行大模型生成的代码,都可能引入安全风险。传统容器的隔离性相对较弱,一旦恶意代码逃逸,后果严重。
一个直接的思路是采用更安全的容器或虚拟机来替代传统容器,并通过标准接口与K8s对接。目前很多面向Agent的安全沙箱也正是这么做的。
但这仍然不够。看下面这个例子:即使将Agent本体和风险代码放在同一个安全容器内,隔离了主机风险,但容器内部的重要隐私信息(如访问大模型的密钥)仍然可能被风险代码窃取。

更合理的做法是进行“运行时隔离”:当Agent需要执行有风险的代码或工具调用时,将其动态调度到一个全新的、干净的安全容器中运行,实现彻底的物理隔离。

这就要求基础设施不仅要支持应用启动时的静态部署,还要具备在应用运行中随时按需、动态调度并执行任务的能力。而这,恰恰是传统K8s体系所欠缺的。
云原生提倡无状态服务,便于扩展和运维。但Agent天生是有状态的。多轮对话中,必须保证用户上下文由同一个Agent实例处理。
更复杂的是,Agent处理的任务正变得越来越长,涉及大量外部工具调用。如果在处理中途发生实例故障,问题就麻烦了:请求可能已经执行了几轮循环,部分工具调用已经生效(例如,已经预订了一张机票)。简单地将实例重启、请求重试,由于Agent的非确定性,新的执行路径可能完全不同(例如,又订了一张高铁票),导致业务逻辑出现严重错误。

在企业级生产环境中,硬件故障是常态。因此,Agent基础设施必须提供可靠的故障恢复机制,确保中断的会话能够“断点续执”,且状态绝对一致,否则将无法投入实际生产。
综上所述,Agent非确定性带来的高动态、不安全、长会话三大特征,对以K8s为代表的现有基础设施构成了巨大挑战。那么,Agent时代究竟需要怎样的分布式基础设施呢?
K8s等系统的核心能力,是将集群资源以容器为单位进行管理和分配。至于容器内部应用逻辑如何、资源利用是否高效,它并不关心,也把配置资源的责任交给了用户。这在确定性应用时代可行,但在非确定性的Agent时代就捉襟见肘了。
本质上,Agent需要的不再是一个简单的“容器部署平台”,而是一个更加灵活强大的分布式系统。它需要能够:
听起来是不是有点熟悉?这很像我们在单机操作系统上运行程序:程序以进程形式长时运行、保有状态;可以根据需要动态创建子进程;进程间通过IPC通信协作;所有进程都按实际需求动态使用CPU和内存资源。
没错,Agent需要的,正是一个具备单机OS般灵活动态调度与资源管理能力的“分布式操作系统”。唯一的区别是,它的舞台是整个集群。
目前,业界已经出现了一些探索,它们从不同角度试图应对上述挑战。
从设计理念上看,目前最匹配的开源系统可能是openYuanrong。它的核心目标就是构建一个类单机OS的分布式内核,统一支持各类负载,这正好契合了Agent的需求。
此外,openYuanrong还提供异构算力统一调度等能力,能够将Agent、大模型推理、强化学习等负载协同调度在同一个集群,提升整体资源利用率。
Ray同样具备成熟的任务级动态分布式调度能力,其Actor模型也能满足Agent有状态运行的需求,因此在支持Agent动态拉起子任务方面有天然优势。
不过,Ray此前更多聚焦于离线计算场景,在面向在线服务的安全隔离、多租户管理、精细化弹性等方面能力尚在发展之中,目前可能还难以直接支撑企业级的大规模、高安全要求的Agent在线应用。
值得一提的是Anthropic近期提出的Managed Agents构想。其中将Sandbox(沙箱)与Harness(执行器)解耦以提升安全性的思路,与本文“运行时隔离”的观点不谋而合。其“Many Brains”(多脑,对应水平弹性)和“Many Hands”(多手,对应动态并行工具调用)的理念,也精准命中了Agent的核心运行特征。虽然该文章主要提出了理念和方向,并未详述具体实现,但其思考极具前瞻性。
Agent是对传统应用形态的一次彻底重构,其非确定性特征带来了高动态、不安全、长会话等全新挑战,使得基于K8s的现有基础设施体系难以直接适配。这要求新一代基础设施具备像单机操作系统一样的灵活调度、动态资源管理和强一致状态保障能力。
幸运的是,业界探索已经开始。像openYuanrong这样的系统,已经在相关方向上积累了可观的能力。相比于Anthropic等先行者,大多数企业目前可能还处于云原生微服务阶段,缺乏Agent的大规模落地经验。但Agent应用的爆发窗口可能比预想的更近。因此,企业有必要未雨绸缪,尽早评估和布局适合Agent时代的基础设施技术栈,为未来的规模化应用做好准备。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
免费影视剧APP推荐
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
抖音最火沙雕男生网名(精选100个)
网络热词聊污是什么意思
蒙古上单是什么梗
帅气继父网名女生可爱英文(精选100个)
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
免费看片软件下载地址推荐
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
免费看电影的软件推荐
韦一敏是什么梗
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
晨字沙雕网名大全女生(精选100个)
帅到极致的网名女生霸气(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc