
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
揭示了 Claude Code 如何将组织经验工程化为可复用的 Agent 能力单元。文章指出,有效的 skill 不是简单的提示词模板,而是包含脚本、数据、流程的"能力目录",覆盖从代码生成到运维的完整交付链路。Anthropic 总结了 9 类实用 skills 和 7 条关键经验,强调应聚焦模型易错点而非重复常识,通过渐进式文件披露和脚本化提升效率。skill 本质上是将

摘要:文章探讨了Prompt Caching在Agent系统设计中的核心地位,指出其不仅是优化手段,更是决定产品形态的基础设施。通过Claude Code的实践案例,揭示了5个关键设计原则:1) 按稳定性分层组织Prompt结构;2) 用消息而非修改System Prompt传递变化;3) 避免会话中途切换模型;4) 保持工具集稳定;5) 上下文压缩需保持前缀复用。这些原则表明,Agent设计需同

揭示了 Claude Code 如何将组织经验工程化为可复用的 Agent 能力单元。文章指出,有效的 skill 不是简单的提示词模板,而是包含脚本、数据、流程的"能力目录",覆盖从代码生成到运维的完整交付链路。Anthropic 总结了 9 类实用 skills 和 7 条关键经验,强调应聚焦模型易错点而非重复常识,通过渐进式文件披露和脚本化提升效率。skill 本质上是将

Anthropic团队在《Harness design for long-running application development》中揭示了AI应用开发的关键洞见:真正决定复杂任务完成质量的不是模型本身,而是为其设计的工作框架(harness)。文章通过前端设计和长时应用开发案例,展示了如何通过拆分任务、建立评价标准和构建闭环系统来解决模型的长程失稳和自我评价失真问题。核心观点包括:将主观任

Anthropic团队在《Harness design for long-running application development》中揭示了AI应用开发的关键洞见:真正决定复杂任务完成质量的不是模型本身,而是为其设计的工作框架(harness)。文章通过前端设计和长时应用开发案例,展示了如何通过拆分任务、建立评价标准和构建闭环系统来解决模型的长程失稳和自我评价失真问题。核心观点包括:将主观任

Anthropic团队在《Harness design for long-running application development》中揭示了AI应用开发的关键洞见:真正决定复杂任务完成质量的不是模型本身,而是为其设计的工作框架(harness)。文章通过前端设计和长时应用开发案例,展示了如何通过拆分任务、建立评价标准和构建闭环系统来解决模型的长程失稳和自我评价失真问题。核心观点包括:将主观任

揭示了 Claude Code 如何将组织经验工程化为可复用的 Agent 能力单元。文章指出,有效的 skill 不是简单的提示词模板,而是包含脚本、数据、流程的"能力目录",覆盖从代码生成到运维的完整交付链路。Anthropic 总结了 9 类实用 skills 和 7 条关键经验,强调应聚焦模型易错点而非重复常识,通过渐进式文件披露和脚本化提升效率。skill 本质上是将

设计模型的工具,既是一门科学,也是一门艺术。我很认同这一点。因为 Agent 系统不是纯静态软件,它面对的是一个会随着模型能力变化而不断迁移的交互对象。今天有效的设计,明天未必仍然最优。多观察输出多实验多调整工具边界多重新审视原来的假设Agent 的工具设计,不该从“我们能接多少能力”开始,而应该从“模型真正能顺畅地用什么能力”开始。这可能才是这篇文章最值得带走的结论。

摘要:文章探讨了Prompt Caching在Agent系统设计中的核心地位,指出其不仅是优化手段,更是决定产品形态的基础设施。通过Claude Code的实践案例,揭示了5个关键设计原则:1) 按稳定性分层组织Prompt结构;2) 用消息而非修改System Prompt传递变化;3) 避免会话中途切换模型;4) 保持工具集稳定;5) 上下文压缩需保持前缀复用。这些原则表明,Agent设计需同

上一篇写了自己的原生agent如何实现的mcp,这篇文章说说怎么实现的skills。其实skills比mcp实现起来要简单很多,因为他本质是渐进式披露加载文件系统,然后让大模型去执行skill,也是需要初始化skills获取元数据,








