
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
改进 Skill Creator:如何测试、度量与优化 Agent Skills
Skill Creator测试优化指南摘要 本文介绍了改进Skill Creator的工具与方法,帮助非技术背景的领域专家验证和优化Agent Skills。主要内容包括: 两类Skill测试重点:能力扩展型需测试模型进步后是否冗余;偏好编码型需验证流程准确性。 Evals测试框架: 通过预设测试场景自动验证Skill效果 可捕获模型更新导致的质量回归 跟踪模型自身能力成长 Benchmark量化

当我把 Claude Code 从终端“搬“到服务器上之后...
本文分享了将Claude Code CLI工具改造成API服务的实践过程。作者通过分析Claude Code的内部机制,发现其核心是一个标准的tool_use循环,包括分块System Prompt、三层上下文压缩策略和独立子代理实例。基于这些发现,作者开发了CCServer项目,实现了多接口支持、项目级配置保留和多Agent编排功能。文章详细介绍了API调用方式、配置管理方案,以及实现过程中遇到
改进 Skill Creator:如何测试、度量与优化 Agent Skills
Skill Creator测试优化指南摘要 本文介绍了改进Skill Creator的工具与方法,帮助非技术背景的领域专家验证和优化Agent Skills。主要内容包括: 两类Skill测试重点:能力扩展型需测试模型进步后是否冗余;偏好编码型需验证流程准确性。 Evals测试框架: 通过预设测试场景自动验证Skill效果 可捕获模型更新导致的质量回归 跟踪模型自身能力成长 Benchmark量化
到底了







