来源:互联网 更新时间:2026-06-27 07:23
每次调 GPT-4o、Claude、DeepSeek,你是不是也这样:

统计过一个月的 API 调用数据,平均 38% 的 Token 是冗余的。按 GPT-4o 的 4。看着不多,但如果你每天调 1000 次,一年就是 $180+。
更要命的是,提示词越长,响应也越慢。那能不能在发请求之前,自动把这些废话过滤掉?
于是 PromptSlim 诞生了。
在 client.chat.completions.create() 之前,插入一个轻量级的文本分析层:
用户输入 → 冗余检测(40+ 规则)→ 代码保护 → LLM 二次压缩 → 发送 API
三个关键设计:
pip install promptslim
# 直接精简echo "嗯那个我想说的是这个功能非常非常好用对吧" | promptslim slim# 统计 Token 数promptslim count -i prompt.txt# 智能压缩(LLM 二次处理)promptslim smart -i long_prompt.txt --api-key YOUR_KEY# 对比精简效果promptslim compare -i before.txt -o after.txt
from promptslim import quick_slim# 一行搞定report = quick_slim("嗯那个我想说的是这个功能非常非常好用对吧")print(f"节省 {report.sa vings_pct}% Token")# 批量处理from promptslim import slim_batchresults = slim_batch(["prompt1", "prompt2", "prompt3"])for r in results:print(f"节省 {r.sa vings_pct}%")
| 场景 | 原始 Token | 精简后 | 节省 |
|---|---|---|---|
| 中文口语化提示词 | 48 | 27 | 43.8% |
| 英文冗余(basically/just/very) | 27 | 24 | 11.1% |
| 带代码块的技术问题 | 118 | 118 | 0%(代码被保护) |
| 混合中英文长文 | 350 | 210 | 40.0% |
| 礼貌用语堆砌 | 85 | 38 | 55.3% |
代码块保护是最重要的安全机制。你绝不希望 AI 精简工具把你的 def quick_sort(arr) 变成 def sort(arr)。
# 核心流程(简化版)def slim(prompt: str) -> SlimReport:# 1. 提取并保护代码块code_blocks, placeholder = extract_code_blocks(prompt)# 2. 应用 40+ 条冗余规则for rule in REDUNDANCY_RULES:prompt = rule.apply(prompt)# 3. 可选:LLM 语义压缩if use_llm:prompt = llm_compress(prompt)# 4. 还原代码块prompt = restore_code_blocks(prompt, code_blocks)return SlimReport(original_tokens, slimmed_tokens, sa vings_pct)
每条规则是一个简单的正则替换:
# 中文冗余("(嗯|那个|就是说|我想说的是)", ""),("(非常|特别|十分)非常", "非常"),("(可以|能)(够|以)", r"1"),("(帮助|帮)(你|我|我们)", r"1助"),# 英文冗余("basically,?s*", ""),("I just wanted to mention thats*", ""),("in my opinion,?s*", ""),("very very", "very"),
| ✅ 适用 | ❌ 不适用 |
|---|---|
| 日常聊天式提示词 | 精确的 few-shot 示例 |
| 多轮对话上下文累积 | System prompt(需保持完整) |
| 用户填写的长表单内容 | 法律/医疗等精确措辞 |
| 批量处理大量 Prompt | 已精心优化的提示词 |
| 工具 | 规则引擎 | LLM 压缩 | 代码保护 | 离线 |
|---|---|---|---|---|
| PromptSlim | ✅ 40+ 规则 | ✅ 可选 | ✅ | ✅ |
| 手动删减 | ❌ | ❌ | — | — |
| 用 GPT 精简 | ❌ | ✅ | ❌ | ❌ |
PromptSlim 在 GitHub 开源,MIT 协议:
github.com/JING04-PROD…
如果你每天调 API 超过 100 次,用它能直观感受到 Token 消耗下降。有问题或建议直接提 Issue。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
archiveofourown 实战指南:常见用法整理
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
作家助手如何上传自制封面 作家助手如何设置小说的封面
如何在夸克浏览器中开启网页视频的倍速播放功能?
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
全链网:黄金价格因美元的走强及利率担忧而下跌
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
美国市场:股票相对债券的风险溢价正在消失
有寓意的易经网名男生(精选100个)
电视剧《小欢喜》剧情介绍
电影《遁甲门之消失的公主》剧情介绍
动漫《柚木家的四兄弟》剧情介绍
植物娘大战僵尸电脑端与手机端存档转移的方法
网石18禁MMO《RAVEN2:渡鸦》大型更新推出全新职业“军阀”
《梦幻西游》159五开五门怎么搭配-159五开五门常见搭配
卡厄思梦境哀嚎螺旋塔攻略 哀嚎螺旋塔怎么玩
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc