热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai教程 >《每次 API 调用前扔掉 43% Token,我开源了一个 AI 提示词瘦身工具》

《每次 API 调用前扔掉 43% Token,我开源了一个 AI 提示词瘦身工具》

来源:互联网 更新时间:2026-06-27 07:23

第一篇:每次 API 调用前扔掉 43% Token,我开源了一个 AI 提示词瘦身工具

每次调 GPT-4o、Claude、DeepSeek,你是不是也这样:

《每次 API 调用前扔掉 43% Token,我开源了一个 AI 提示词瘦身工具》

  • "嗯那个我想说的是..." → 5 个 Token 纯浪费
  • "Basically, I just wanted to mention that..." → 8 个 Token 毫无意义
  • "求求了、帮帮忙、拜托拜托" → 对模型没用,但花钱是真的

统计过一个月的 API 调用数据,平均 38% 的 Token 是冗余的。按 GPT-4o 的 2.50/1Minput算,每个月白白烧掉2.50/1M input 算,每个月白白烧掉 ~4。看着不多,但如果你每天调 1000 次,一年就是 $180+。

更要命的是,提示词越长,响应也越慢。那能不能在发请求之前,自动把这些废话过滤掉?

于是 PromptSlim 诞生了。

核心思路

client.chat.completions.create() 之前,插入一个轻量级的文本分析层:

用户输入 → 冗余检测(40+ 规则)→ 代码保护 → LLM 二次压缩 → 发送 API

三个关键设计:

  1. 规则引擎前置:先跑 40+ 条正则,0 Token 消耗剃掉常规冗余
  2. 代码块保护:检测到 Python/JS/Go 代码自动跳过,绝不乱改
  3. LLM 语义压缩:规则处理后,按需调用轻量模型做精细压缩

5 分钟上手

pip install promptslim

命令行

# 直接精简echo "嗯那个我想说的是这个功能非常非常好用对吧" | promptslim slim# 统计 Token 数promptslim count -i prompt.txt# 智能压缩(LLM 二次处理)promptslim smart -i long_prompt.txt --api-key YOUR_KEY# 对比精简效果promptslim compare -i before.txt -o after.txt

Python API

from promptslim import quick_slim# 一行搞定report = quick_slim("嗯那个我想说的是这个功能非常非常好用对吧")print(f"节省 {report.sa vings_pct}% Token")# 批量处理from promptslim import slim_batchresults = slim_batch(["prompt1", "prompt2", "prompt3"])for r in results:print(f"节省 {r.sa vings_pct}%")

效果实测

场景原始 Token精简后节省
中文口语化提示词482743.8%
英文冗余(basically/just/very)272411.1%
带代码块的技术问题1181180%(代码被保护)
混合中英文长文35021040.0%
礼貌用语堆砌853855.3%

代码块保护是最重要的安全机制。你绝不希望 AI 精简工具把你的 def quick_sort(arr) 变成 def sort(arr)

技术架构

# 核心流程(简化版)def slim(prompt: str) -> SlimReport:# 1. 提取并保护代码块code_blocks, placeholder = extract_code_blocks(prompt)# 2. 应用 40+ 条冗余规则for rule in REDUNDANCY_RULES:prompt = rule.apply(prompt)# 3. 可选:LLM 语义压缩if use_llm:prompt = llm_compress(prompt)# 4. 还原代码块prompt = restore_code_blocks(prompt, code_blocks)return SlimReport(original_tokens, slimmed_tokens, sa vings_pct)

每条规则是一个简单的正则替换:

# 中文冗余("(嗯|那个|就是说|我想说的是)", ""),("(非常|特别|十分)非常", "非常"),("(可以|能)(够|以)", r"1"),("(帮助|帮)(你|我|我们)", r"1助"),# 英文冗余("basically,?s*", ""),("I just wanted to mention thats*", ""),("in my opinion,?s*", ""),("very very", "very"),

适用场景

✅ 适用❌ 不适用
日常聊天式提示词精确的 few-shot 示例
多轮对话上下文累积System prompt(需保持完整)
用户填写的长表单内容法律/医疗等精确措辞
批量处理大量 Prompt已精心优化的提示词

和竞品对比

工具规则引擎LLM 压缩代码保护离线
PromptSlim✅ 40+ 规则✅ 可选
手动删减
用 GPT 精简

下一步

PromptSlim 在 GitHub 开源,MIT 协议:

github.com/JING04-PROD…

如果你每天调 API 超过 100 次,用它能直观感受到 Token 消耗下降。有问题或建议直接提 Issue。

AI自动绘画大师
AI自动绘画大师

类型:益智休闲

大小:5.72MB

语言:简体中文

平台:互联网

游戏下载

热门手游

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc