文档_
SkillOps 是 AI Skill 的全生命周期管理操作系统,由 小能 / Ace(一个 Skill HRD 智能体)执行. 这份文档讲清它最核心的能力 —— 技能评级体系(SMS 标准),以及如何让你自己的 skill 被评估.
01什么是 SkillOps
把 skill 当成"资产组合"来管理,而不是一堆 markdown 文件.
如果你在产出 skill / prompt / agent,你迟早会遇到三个问题:不知道哪个在挣钱、新 skill 没人 review、资产组合没有全局视角. SkillOps 用 HR 的范式解决这件事 —— 把每个 skill 当成"员工",由 小能/Ace 跑完 8 个模块:招聘 · 评估 · 管理 · 分发 · 培训 · 绩效 · 项目评估 · 退役.
生态位上:Anthropic 做 Skill 格式标准,SkillOps 做 Skill 管理. 就像 npm + Snyk、GitHub + Sourcegraph 的关系 —— 底层标准被巨头握住,ops / governance / portfolio 这一层留给生态做.
02技能评级体系
SMS = Skill Management Standard · 衡量一个 skill 成熟度的标准化度量.
市面上的 skill / GPT / prompt 库都没有质量度量 —— HuggingFace 没有、GPT Store 没有、LangSmith 关注 runtime 不关注资产. SMS 是第一个针对 skill 本身的标准化评分.
SMS v2.0 把成熟度拆成 4 支柱 × 10 维(可理解 / 可执行 / 可工程 / 可信赖与价值),每维 0–5 分、总分 50,由 openclaw-skill-ops 引擎自动计算. 完整方法论(支柱、锚点、反模式、分档)见 SMS 方法论 →
10 个评分维度
描述、触发词、用途是否一眼能懂. Agent 和人类能否快速判断"这个 skill 是干什么的".
0–5 分触发词是否设计良好,agent 在合适的场景下能否准确地把它召唤出来,而不是漏掉或误触.
0–5 分步骤是否具体、可操作. 是"给方法"还是"给套路",agent 拿到能不能直接跑.
0–5 分多次调用输出结构是否一致. 是稳定产出固定格式,还是每次随机漂移.
0–5 分产出的实际质量. 是专家级洞察,还是通用模板填空.
0–5 分能否跨场景复用. 是为单一任务写死,还是抽象到能迁移到多个上下文.
0–5 分能否和其他 skill 串联. 是孤立工具,还是能进入更大的工作流编排.
0–5 分输出好坏是否可被判断. 有没有明确的成功标准,能不能被测试和回归.
0–5 分是否有越界、注入、误导风险. 在企业场景下能否放心接入.
0–5 分这个 skill 是否解决真实、有支付意愿的问题. 决定它在资产组合里的优先级.
0–5 分Tier 分级
总分映射到 5 个等级,决定 skill 在 Hub 里的可见性与分发策略.
03如何开始
两条路径:自己跑开源版,或申请托管版 early access.
路径 A · 开源自托管(现在就能用)
openclaw-skill-ops 是开源的. 把你的 skill 整理成 skills.json + SKILL.md,本地跑评分脚本:
git clone https://github.com/qiuyiwu1989-star/openclaw-skill-ops
# 2. 指向你的 skills 目录,跑 SMS 审计
python run_sms_audit.py --skills ./my-skills/
# 3. 得到 10 维评分 + tier + 改进建议
路径 B · 托管版 Early Access(推荐)
申请 early access
发邮件简单介绍你的 skill 资产(数量、当前管理方式、最大痛点). 我们人工挑选 20 个早期用户深度配合.
接入你的 skill 库
支持 GitHub repo / 本地目录 / Skill Hub 格式. 小能自动扫描、解析、评分.
每周自动审计 + 仪表盘
每周日自动重跑,给你一个 Portfolio Dashboard:tier 分布、能力热图、排行榜、改进建议、趋势.
04产品路线图
SkillOps 把 skill 当成"团队"来管理 —— 8 个 HR 模块,由 小能/Ace 的 9 个子技能执行(分发是平台原生能力)。诚实标注现状,不画饼。
从 GitHub / 上传发现 skill,访谈生成 Skill Card 或从零锻造。skill-card-gen · skill-forge
公开 registry + API key 给 agent 调用。已上线。平台原生(registry + API)
读评级、定位最弱维度、重写 SKILL.md 提分到目标段位。skill-coach
调用量 / 分数趋势 / 退化预警,红黄绿持续监控。skill-metrics
按 agent / 项目把 skill 当组合盘点,看资产健康。agent-capability-map
识别低产 / 重复 / 过时 skill,查依赖、给迁移路径、可逆归档。skill-retire
npm + Snyk、GitHub + Sourcegraph —— 底层标准被巨头握住,ops / governance / portfolio 这层留给生态做。完整 8 模块 × 9 子技能映射见 SMS 标准。05团队 / 企业
个人用永久免费、不用登录。团队和企业有更深的需求时,可以聊。
如果你的团队有 10+ skill / prompt / agent 需要体系化管理、私有化部署、自定义评分维度、或把这套方法论 stack 接进你们的产品 —— 我们提供托管版与企业方案。当前 early-access 阶段免费深度配合,价格随首批用户一起敲定。
06FAQ
小能和 Anthropic Skills 是竞争关系吗?
不是. Anthropic 定义 Skill 的格式标准,小能构建在这个标准之上做管理. 就像 npm 定义包格式、Snyk 做依赖治理 —— 我们是互补的两层.
技能评级是 AI 打的还是人工打的?
当前是 AI 自动评分 + 人工校准混合. run_sms_audit.py 从 skill 元数据和文档自动计算 10 维分数,S 级核心资产会额外人工 review. v0.7 阶段部分分数为合理估算,全量 pipeline 接入后纯自动化.
我的 skill 不是 Claude Code 格式,能用吗?
SMS 维度是格式无关的 —— 评估的是 skill 的内在质量. 只要能整理成结构化描述(用途、触发条件、步骤、输出),就能评分. Claude Code / 通用 prompt / 自定义 agent 都适用.
评分结果会公开吗?
由你决定. Skill Hub 自家的评分主动全部公开(见 registry)作为透明承诺. 你自己的 skill 评分默认私有,可选择性公开.
多少钱?
个人用永久免费、不用登录. 团队 / 企业 / 私有部署见上方 团队 / 企业 —— early access 阶段免费深度配合.