SkillOps / docs

文档_

SkillOps 是 AI Skill 的全生命周期管理操作系统,由 小能 / Ace(一个 Skill HRD 智能体)执行. 这份文档讲清它最核心的能力 —— 技能评级体系(SMS 标准),以及如何让你自己的 skill 被评估.

01什么是 SkillOps

把 skill 当成"资产组合"来管理,而不是一堆 markdown 文件.

如果你在产出 skill / prompt / agent,你迟早会遇到三个问题:不知道哪个在挣钱新 skill 没人 review资产组合没有全局视角. SkillOps 用 HR 的范式解决这件事 —— 把每个 skill 当成"员工",由 小能/Ace 跑完 8 个模块:招聘 · 评估 · 管理 · 分发 · 培训 · 绩效 · 项目评估 · 退役.

生态位上:Anthropic 做 Skill 格式标准,SkillOps 做 Skill 管理. 就像 npm + SnykGitHub + Sourcegraph 的关系 —— 底层标准被巨头握住,ops / governance / portfolio 这一层留给生态做.

当前状态 v1.0. 评估、管理(控制台)、registry、agent 调用已可用. 完整 8 模块 × 9 子技能见下方 产品路线图.

02技能评级体系

SMS = Skill Management Standard · 衡量一个 skill 成熟度的标准化度量.

市面上的 skill / GPT / prompt 库都没有质量度量 —— HuggingFace 没有、GPT Store 没有、LangSmith 关注 runtime 不关注资产. SMS 是第一个针对 skill 本身的标准化评分.

SMS v2.0 把成熟度拆成 4 支柱 × 10 维(可理解 / 可执行 / 可工程 / 可信赖与价值),每维 0–5 分、总分 50,由 openclaw-skill-ops 引擎自动计算. 完整方法论(支柱、锚点、反模式、分档)见 SMS 方法论 →

10 个评分维度

01清晰度
CLARITY

描述、触发词、用途是否一眼能懂. Agent 和人类能否快速判断"这个 skill 是干什么的".

0–5 分
02可调用性
INVOCABILITY

触发词是否设计良好,agent 在合适的场景下能否准确地把它召唤出来,而不是漏掉或误触.

0–5 分
03可执行性
EXECUTABILITY

步骤是否具体、可操作. 是"给方法"还是"给套路",agent 拿到能不能直接跑.

0–5 分
04输出稳定性
STABILITY

多次调用输出结构是否一致. 是稳定产出固定格式,还是每次随机漂移.

0–5 分
05结果质量
QUALITY

产出的实际质量. 是专家级洞察,还是通用模板填空.

0–5 分
06可复用性
REUSABILITY

能否跨场景复用. 是为单一任务写死,还是抽象到能迁移到多个上下文.

0–5 分
07可组合性
COMPOSABILITY

能否和其他 skill 串联. 是孤立工具,还是能进入更大的工作流编排.

0–5 分
08可评估性
EVALUABILITY

输出好坏是否可被判断. 有没有明确的成功标准,能不能被测试和回归.

0–5 分
09安全性
SAFETY

是否有越界、注入、误导风险. 在企业场景下能否放心接入.

0–5 分
10商业价值
BUSINESS VALUE

这个 skill 是否解决真实、有支付意愿的问题. 决定它在资产组合里的优先级.

0–5 分

Tier 分级

总分映射到 5 个等级,决定 skill 在 Hub 里的可见性与分发策略.

TIER
分数区间
含义
S
43–50
核心资产 · 旗舰级,主推、可商业化
A
38–42
稳定可用 · 公开发布、可放心调用
B
32–37
实验 · 公开发布的最低门槛
C
25–31
概念 · 设为 private,不对外分发
D
< 25
无效 · 候选退役 / 重写
真实样例:Skill Hub 已发布的 25 个 skill 的评级公开在 registrydemo —— 2 个 S 段、12 个 A 段,均分 35.2/50,与每个 skill 详情页同源.

03如何开始

两条路径:自己跑开源版,或申请托管版 early access.

路径 A · 开源自托管(现在就能用)

openclaw-skill-ops 是开源的. 把你的 skill 整理成 skills.json + SKILL.md,本地跑评分脚本:

# 1. clone openclaw-skill-ops
git clone https://github.com/qiuyiwu1989-star/openclaw-skill-ops

# 2. 指向你的 skills 目录,跑 SMS 审计
python run_sms_audit.py --skills ./my-skills/

# 3. 得到 10 维评分 + tier + 改进建议

路径 B · 托管版 Early Access(推荐)

申请 early access

发邮件简单介绍你的 skill 资产(数量、当前管理方式、最大痛点). 我们人工挑选 20 个早期用户深度配合.

接入你的 skill 库

支持 GitHub repo / 本地目录 / Skill Hub 格式. 小能自动扫描、解析、评分.

每周自动审计 + 仪表盘

每周日自动重跑,给你一个 Portfolio Dashboard:tier 分布、能力热图、排行榜、改进建议、趋势.

04产品路线图

SkillOps 把 skill 当成"团队"来管理 —— 8 个 HR 模块,由 小能/Ace 的 9 个子技能执行(分发是平台原生能力)。诚实标注现状,不画饼。

M·01招聘
RECRUIT · BETA

从 GitHub / 上传发现 skill,访谈生成 Skill Card 或从零锻造。
skill-card-gen · skill-forge

M·02评估
EVALUATE · LIVE

SMS 10 维评级。已上线,在线评估
skill-audit

M·03管理
ORGANIZE · LIVE

扫描登记 + 依赖/组合图谱,本地优先。控制台
skill-registry-scan · skill-graph

M·04分发
DISTRIBUTE · LIVE

公开 registry + API key 给 agent 调用。已上线。
平台原生(registry + API)

M·05培训
DEVELOP · SPEC ✓

读评级、定位最弱维度、重写 SKILL.md 提分到目标段位。
skill-coach

M·06绩效
PERFORMANCE · SPEC ✓

调用量 / 分数趋势 / 退化预警,红黄绿持续监控。
skill-metrics

M·07项目评估
PORTFOLIO · BETA

按 agent / 项目把 skill 当组合盘点,看资产健康。
agent-capability-map

M·08退役
RETIRE · SPEC ✓

识别低产 / 重复 / 过时 skill,查依赖、给迁移路径、可逆归档。
skill-retire

生态位:Anthropic 做 Skill 格式标准,SkillOps 做 Skill 管理。就像 npm + SnykGitHub + Sourcegraph —— 底层标准被巨头握住,ops / governance / portfolio 这层留给生态做。完整 8 模块 × 9 子技能映射见 SMS 标准

05团队 / 企业

个人用永久免费、不用登录。团队和企业有更深的需求时,可以聊。

如果你的团队有 10+ skill / prompt / agent 需要体系化管理、私有化部署、自定义评分维度、或把这套方法论 stack 接进你们的产品 —— 我们提供托管版与企业方案。当前 early-access 阶段免费深度配合,价格随首批用户一起敲定。

06FAQ

小能和 Anthropic Skills 是竞争关系吗?

不是. Anthropic 定义 Skill 的格式标准,小能构建在这个标准之上做管理. 就像 npm 定义包格式、Snyk 做依赖治理 —— 我们是互补的两层.

技能评级是 AI 打的还是人工打的?

当前是 AI 自动评分 + 人工校准混合. run_sms_audit.py 从 skill 元数据和文档自动计算 10 维分数,S 级核心资产会额外人工 review. v0.7 阶段部分分数为合理估算,全量 pipeline 接入后纯自动化.

我的 skill 不是 Claude Code 格式,能用吗?

SMS 维度是格式无关的 —— 评估的是 skill 的内在质量. 只要能整理成结构化描述(用途、触发条件、步骤、输出),就能评分. Claude Code / 通用 prompt / 自定义 agent 都适用.

评分结果会公开吗?

由你决定. Skill Hub 自家的评分主动全部公开(见 registry)作为透明承诺. 你自己的 skill 评分默认私有,可选择性公开.

多少钱?

个人用永久免费、不用登录. 团队 / 企业 / 私有部署见上方 团队 / 企业 —— early access 阶段免费深度配合.