大家好,我们又见面了。

2026年开始了,我们在新的一年里会加大对AI、Vibe Coding、Agent落地应用等方面的关注。在过去的2年时间里,个人也是深度参与了数个跟大模型落地相关的项目开发和上线。未来会逐步分享出来,欢迎持续关注。

回归正文,就在昨天2026年2月25日,Anthropics官方维护的Claude Skills做了一次重大更新。

https://github.com/anthropics/skills/pull/465

本次更新目前各个自媒体社区关注度还不高,但是这个更新意义重大

anthropics/skills 是什么?

https://github.com/anthropics/skills 是anthropics官方提供的Claude扩展能力库(Skills Library)。它定义了一套标准,允许开发者通过特定的文件结构(SKILL.md)赋予Claude使用外部工具、执行复杂工作流或遵循特定企业规范的能力。

它的主要作用包括:

  • 标准化扩展:提供了一种标准格式,让Claude能够"加载"特定的技能包(例如处理 Office 文档、生成代码、执行特定分析)。

  • 能力增强:包含了一些核心的高级能力,例如 docx(Word 处理)、pdf(PDF 读取)、pptx(PPT 生成)等,这些是Claude Code强大功能的底层实现。

  • 最佳实践示范:展示如何编写高质量的系统提示词(System Prompts)和工具定义,是学习"Prompt Engineering"的高级教材。

Pull Request #465 的核心改动

这次改动是一次大规模的架构升级,核心是将Skill的开发模式进行了工程化升级全场景标准化落地

这是skill-creator的能力的重要升级,我们来看一下核心改动点:

  • Skill Creation工程化

新增了agents/grader.md(评分员)、agents/comparator.md(对比员)和agents/analyzer.md(分析员),把Skill的创建从「概念说明」转为「流程化执行」。意味着创建Skill不再是一个简单的问答过程,而是变成了由多个专门 AI 角色协作的自动化测试与评估流程。

  • 引入评估闭环(Eval Loop)

新增了 run_loop.py、run_eval.py 和 HTML 格式的评估报告生成器。这标志着Prompt开发从"凭感觉写"转向了"测试驱动开发(TDD)"。

  • 质量管控机制强化

新增全链路校验规则,确保Skill/文档输出质量可控:

1. 新增多维度校验节点:

    • Skill 创作侧:要求基于「真实业务任务」测试 Skill 效果,而非模拟用例,确保落地可用;

    • 文档处理侧:新增「Reader Claude 测试」,校验内容的模糊性、逻辑一致性、读者理解成本;

2. 明确迭代触发规则:

    • Skill 侧:测试发现低效 / 错误后,必须立即更新 SKILL.md 并复测,直到满足断言 / 基准测试要求;

    • 文档侧:校验不通过时,需回退到上一版本重新修改,禁止「带病发布」;

3. 统一质量评估维度:跨场景统一「简洁性、精准性、可读性、兼容性」四大评估标准,避免不同场景输出质量参差不齐。

4. 其他

此外,本次改动还明确了Skill的编写规范、冗余文件管控、合规补充等等。

本次改动的影响

1. 降低开发门槛与协作成本:标准化流程让 Skills 开发从「靠经验」转向「靠规则」,跨团队 / 场景的协作无需重复磨合;

2. 提升生态质量与稳定性:工具链调整 + 校验机制减少低效 / 冗余 Skills,核心 Skills 版本同步避免兼容性问题;

3. 完善迭代闭环:明确的测试 - 迭代规则让 Skills 从「一次性创作」变为「持续优化的活资产」,适配企业级长期使用需求;

4. 推动规模化落地:标准化 + 可复用的规则,让 Skills 从「示例演示」走向企业级场景落地,为后续技能市场、智能触发等生态升级奠定基础。

本次改动,通过版本同步、工具链调整和流程精细化,推动Skills 生态从「功能可用」升级为「流程可控、质量可测、规模可扩」,最终会加速Skills向企业级生产场景落地。

Skill的开发正式从"手工作坊"时代进入了"自动化流水线"时代,Skills企业级生产场景落地就在眼前了。

图片

最后,欢迎加入我们的知识星球小圈子:

   如果这个文章对你有帮助,不要忘记 「在看」 「点赞」 「收藏」 三连啊喂!

图片

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐