来源:互联网 更新时间:2026-05-28 09:20
在AI辅助编程领域,一个核心的挑战始终存在:如何让一个通用的大语言模型,在特定、复杂的专业任务中表现得像一位经验丰富的专家?OpenAI在2025年推出的Codex,给出了一个颇具启发性的答案——它不仅仅是一个代码生成工具,而是一个配备了“技能库”的云端软件工程智能体。今天,我们就来深入拆解这套名为“Codex Skills”的体系,看看它是如何通过模块化扩展,将通用AI转变为领域专家的。

简单来说,
那么,如何赋予这个智能体更专业的能力呢?这就引出了
你可以把它理解为一套标准化的“技能包”。每个Skill本质上是一个包含指令、脚本和资源的文件夹。AI智能体能够自动发现并加载这些技能包,从而执行特定的专业任务,比如浏览器自动化、CI/CD修复或者设计稿转代码。
OpenAI没有另起炉灶,而是选择拥抱开放标准。Codex Skills正是基于Anthropic的Agent Skills标准构建的具体实现,并在GitHub上建立了自己的开源生态仓库。这套设计的精妙之处在于,它将模型本身难以完全掌握的
| 层级 | 说明 |
|---|---|
开放标准 |
Agent Skills(Anthropic 制定,agentskills.io) |
实现方案 |
OpenAI Codex Skills(基于标准的具体实现) |
Skills 仓库 |
github.com/openai/skills |
这背后直指大语言模型的几个固有局限:知识存在截止日期、缺乏企业内部特定知识、重复编写相似代码效率低下、上下文窗口有限,以及对操作一致性的高要求。Skills就像是为AI配备了一个可随时查阅、按需调用的外部知识库和工具库。
| 问题 | Skills 的解决方案 |
|---|---|
| LLM 知识截止日期 | 通过外部文档提供最新 API、工具使用方法 |
| 缺乏公司内部知识 | 打包公司特定的 schema、流程、规范 |
| 重复编写相同代码 | 提供可复用脚本,直接执行 |
| 上下文窗口有限 | 渐进式加载,按需读取 |
| 操作一致性要求 | 提供确定性脚本,避免每次重新生成 |
这套体系的价值是多维度的:它提供了高度的可复用性和模块化,让团队能力得以沉淀;其渐进式加载机制聪明地管理了宝贵的上下文资源;而遵循开放标准和社区驱动的模式,则确保了生态的活力和互操作性。
| 维度 | 价值 |
|---|---|
可复用性 |
团队和个人可以打包特定任务的能力,重复使用 |
模块化 |
每个 Skill 独立自包含,易于维护和分发 |
渐进式加载 |
三级加载机制,高效管理上下文窗口 |
开放标准 |
遵循 agentskills.io 开放标准 |
社区驱动 |
开源仓库,接受社区贡献 |
每个Skill都遵循一个清晰的结构。最核心的文件是SKILL.md,它包含了元数据和详细指令。此外,还可以包含用于界面展示的agents/openai.yaml配置文件,以及可选的资源文件夹,用于存放脚本、参考文档和输出模板等。
skill-name/
├── SKILL.md # 必需:核心指令文件
│ ├── YAML frontmatter # 元数据(name + description)
│ └── Markdown body # 详细指令
├── agents/ # 推荐:UI 元数据
│ └── openai.yaml # 界面展示配置
└── Bundled Resources/ # 可选:捆绑资源
├── scripts/ # 可执行脚本(Python/Bash)
├── references/ # 参考文档
└── assets/ # 输出资源(模板、图标等)
SKILL.md是整个Skill的灵魂,由两部分构成。
首先是
name和description。这里有个关键设计:description字段是Skill的主要触发机制。AI会通过匹配用户请求与这个描述来决定是否调用该Skill。因此,描述必须清晰说明“何时使用”。
---
name: skill-name
description: 完整描述 Skill 功能和触发场景
---
其次是
这是整个架构中最精妙的设计之一,它基于一个核心认知:上下文窗口是宝贵的公共资源,必须高效利用。因此,Skill的加载被分为三级:
┌─────────────────────────────────────────────────────────────┐
│ Level 1: Metadata (name + description) │
│ ├── 始终在上下文中 │
│ └── 约 100 词 │
├─────────────────────────────────────────────────────────────┤
│ Level 2: SKILL.md Body │
│ ├── 仅在 Skill 触发时加载 │
│ └── < 5000 词 │
├─────────────────────────────────────────────────────────────┤
│ Level 3: Bundled Resources │
│ ├── 按需加载 │
│ └── 无限制(脚本可直接执行,无需加载到上下文) │
└─────────────────────────────────────────────────────────────┘
简单来说,AI始终只“记住”所有Skill的名字和简短描述(第一级)。只有当用户的任务匹配了某个Skill的描述,AI才会去加载该Skill的详细指令(第二级)。最后,在执行过程中,如果需要参考文档或运行脚本,再按需读取(第三级)。这种设计极大地优化了上下文的使用效率。
当某个操作需要绝对的确定性或避免重复生成相同代码时,脚本就派上用场了。例如,一个旋转PDF的Python脚本。它的优势在于Token效率高(直接执行,无需解释),输出确定,并且AI可以读取脚本来了解所需环境。
参考文档用于提供AI工作时需要查阅的背景资料,比如最新的API文档或公司内部数据模式。最佳实践是保持文档结构清晰,对于长文档应在顶部添加目录,对于超长文档则可以在SKILL.md中提供搜索模式,而不是全部加载。
资产文件通常不加载到上下文中,而是作为输出的一部分。比如品牌Logo、PPT模板或前端项目的脚手架代码。它们为AI生成的内容提供了结构和样式基础。
这是一个“元Skill”,用于创建其他Skill,体现了系统的自举能力。它提供初始化、生成配置和验证的脚本。在设计Skill时,需要根据任务的“脆弱性”来考虑给予AI多大的自由度:对于有多种有效方法、高度依赖上下文的任务,给予高自由度;对于操作脆弱、一致性至关重要的任务,则提供具体的、低自由度的脚本。
这个Skill负责从GitHub仓库或其他来源安装新的Skill。用户可以通过简单的命令列出、安装官方精选的或实验性的Skill,将其部署到本地的Skill目录中。
官方提供了一系列经过验证的精选Skill,它们展示了Skill设计的典型模式:
这个配置文件主要用于定义Skill在用户界面中的展示方式以及一些调用策略。例如,可以设置显示名称、图标、品牌色,以及一个默认的提示词。一个关键的配置项是allow_implicit_invocation,可以控制该Skill是否允许被AI隐式调用。
所有设计都围绕一个核心原则:“上下文窗口是公共资源。”这意味着要默认AI已经足够聪明,每条添加到Skill中的信息都需要被质疑:AI真的需要这个解释吗?通常,一个简洁的示例胜过冗长的说明。
Skill目录应该非常“干净”。它只包含AI完成任务所必需的信息,而不包含给人类开发者看的安装指南、快速参考或更新日志。那些文件应该放在项目的README里,而不是Skill里。
创建Skill是一个持续的过程:使用它,发现问题,识别改进点,实施更新,然后再次测试。好的Skill是在实际使用中打磨出来的。
Skills被清晰地分为三类,便于管理:
回顾整个Codex Skills体系,其技术创新主要体现在以下几点:渐进式披露的三级加载架构、以description为核心的精准触发机制、脚本/参考/资产分离的资源策略、根据任务特性调整的自由度控制、用于创建Skill的元Skill设计,以及最重要的——拥抱开放标准带来的跨平台潜力。
Skills可以在Codex CLI、IDE扩展(如VS Code)以及Codex Web应用中使用,提供了灵活的使用场景。
触发方式有两种:用户可以在提示词中显式调用(如输入$skill-name),或者依赖AI根据任务描述自动进行隐式匹配。隐式匹配的准确性高度依赖于Skill描述description的清晰度。
当用户提出请求时,Codex会先扫描所有Skill的元数据(第一级),进行匹配。匹配成功后,加载完整指令(第二级),然后在执行过程中按需读取参考文档或执行脚本(第三级)。
Codex会从多个优先级不同的位置查找Skill,包括当前项目目录、用户主目录、系统目录等。这允许在不同层级(项目、用户、系统)共享和管理Skill。
由于Codex运行在云端隔离的沙箱中,Skills的设计需要考虑网络限制、无持久化状态等约束,通常通过在脚本中标注权限要求、使用特定环境变量来应对。
用户可以通过内置的skill-installer或直接修改配置文件来安装、启用或禁用特定的Skill,管理起来相当灵活。
最快捷的方式是直接使用$skill-creator这个元Skill。它会交互式地引导你定义Skill的功能、触发条件和所需资源。
手动创建也很简单:建立一个文件夹,并在其中创建一个SKILL.md文件。文件开头是YAML格式的元数据(name和description),后面跟上详细的Markdown指令即可。Codex会自动检测到新的Skill。
对于喜欢自动化的开发者,可以使用官方提供的Python脚本init_skill.py来初始化标准的Skill目录结构,并用quick_validate.py进行验证。
如果需要更精细的控制,可以添加agents/openai.yaml文件。这里可以配置UI显示、设置是否允许隐式调用,以及声明该Skill所依赖的外部工具(如MCP服务器)。
OpenAI Codex Skills代表了一种优雅的AI能力扩展范式。它没有试图让模型记住一切,而是聪明地将程序性知识外部化、模块化。这就像给一位聪明的助手配备了一个按需取用的、不断丰富的工具手册库。对于开发者和团队而言,理解和掌握这套体系,意味着能够构建出更高效、更定制化、也更可持续的AI辅助工作流。而由于其基于开放标准,你今天为Codex创建的Skill,未来也可能在其他支持该标准的AI智能体上运行,这无疑增加了其长期价值。
下饭影视APP下载安装指南
灵宝派对手游下载安装地址推荐
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
初中英语同步课文跟读APP推荐|免费下载高口碑跟读软件排行榜
BuuPo官网在哪下载 最新官方下载安装地址
4D采矿者官网在哪下载 最新官方下载安装地址
阅读app安卓版下载推荐
碎片人偶Vragmeet官网在哪下载 最新官方下载安装地址
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
喧哗番长乙女 2nd Rumble !!官网在哪下载 最新官方下载安装地址
纸嫁衣9官网在哪下载 最新官方下载安装地址
萌神契约手游下载安装
好用的手环阅读app下载安装
无尽花界时装合辑
免费影视剧APP推荐
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
人声接近真人!OpenAI一口气更新三款超强语音AI
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
短视频软件推荐
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc