skill-creator 大更新

skill-creator 项目完成重大重构，从单一技能创建指南升级为完整的技能开发框架。主要更新包括：1) 重构SKILL.md文档，新增评估迭代循环、描述优化、盲比较系统等功能；2) 添加多个实用脚本工具，支持基准测试、报告生成和持续改进；3) 引入Agent指令文件和评估查看器；4) 移除旧文件并新增JSON结构文档。此次更新实现了从技能创建到测试评估的完整闭环，包含自动化测试、描述优化、防

Elwin Wong

959人浏览 · 2026-02-25 20:48:24

Elwin Wong · 2026-02-25 20:48:24 发布

今天skill-creator进行了一次大更新，基本上是进行了一次重构，使得 skill 的创建流程更加严谨和完整。

主要更新内容

SKILL.md 文档大幅重构

描述更新：

旧版：Guide for creating effective skills. This skill should be used when
users want to create a new skill…
新版：Create new skills, modify and improve existing skills, and measure
skill performance. Use when users want to create a skill from scratch,
update or optimize an existing skill, run evals to test a skill, benchmark
skill performance with variance analysis, or optimize a skill’s description
for better triggering accuracy.

新增核心功能：

完整的评估和迭代循环 - 现在支持定量基准测试和定性评估
描述优化 - 自动优化技能描述以提高触发准确度
盲比较系统 - 用于严格评估两个技能版本的质量
平台特定指令 - 针对 Claude.ai、Claude Code 和 Cowork 的不同适配

新增脚本工具

新增脚本	功能
aggregate_benchmark.py	聚合基准测试数据，计算 mean/stddev/min/max
generate_report.py	生成 HTML 报告
improve_description.py	使用 Claude 扩展思考优化技能描述
run_eval.py	运行评估测试
run_loop.py	运行评估+改进循环，支持 train/test split 防止过拟合
utils.py	工具函数