来源:互联网 更新时间:2026-06-17 13:33
在长会话里想精准控制上下文体积,避免模型因为 token 超限报错或者响应越来越慢,又不想丢掉关键的任务状态——/compress 指令就是 Hermes Agent 提供的最直接、最可控的手动压缩入口。
先说几个核心判断。这个指令不是等着自动触发的,它属于即时干预操作,能让你在完成一个阶段性目标后,立刻把中间的调试过程“打包归档”,然后干净地继续下一步。
直接输入
这一步不依赖 token 估算,不用等自动触发,属于即时干预。特别适合这样的场景:你刚写完 API 接口文档并通过测试,想把中间那些调试、报错、改参数的来回对话“打包起来”,然后清爽地继续下一个任务。
拿场景说话吧。假设你想说“保留最近 5 轮不要动”,那就写:
这行指令会强制保留最近 5 轮完整消息——包括用户提问、工具调用、执行结果、助手回复在内,全部不动,其余部分压缩。这里 N 必须是正整数,最小值为 1。
如果你写
需要注意一点:here 后面的数字只控制“从尾部向前数多少轮不压缩”,它不保证这些轮次一定在当前 token 预算内。如果单轮消息本身就非常大——比如你上传了 10MB 的日志文件并让模型输出全文——那么即使设置了保尾轮数,依然可能触发后续的自动压缩机制。
这个模式用起来稍微讲究一点,分三步走。
第一步,确认当前会话中存在明确的主题锚点。比如你之前输入过“帮我检查 deployment.yaml 的 Helm values 配置”,或者 Agent 曾经生成过一个标题为【Helm 部署参数校验】的摘要块。这类文本会被 ContextCompressor 自动标记为 topic boundary。
第二步,执行
第三步,压缩完成后,你会看到新生成的摘要块开头带有一个 [FOCUS: Helm] 标识,表示这段是主题保留区。这个标识不可删除,否则下次 /compress focus 就无法定位锚点了。
压缩完了别急着走。马上跑一行
但万一发现压缩之后 Agent 忘记了刚确认过的约束条件——比如“必须用 Python 3.11”——说明那条信息没有被纳入 protected tail 或 focus topic 区域。这时候不要慌,立即执行
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
帅到极致的网名女生霸气(精选100个)
帅气继父网名女生可爱英文(精选100个)
蒙古上单是什么梗
韦一敏是什么梗
网络热词聊污是什么意思
作家助手如何上传自制封面 作家助手如何设置小说的封面
抖音最火沙雕男生网名(精选100个)
韩漫小少爷网名大全女生(精选100个)
有寓意的易经网名男生(精选100个)
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
免费看电影的软件推荐
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
如何在夸克浏览器中开启网页视频的倍速播放功能?
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc