
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Anthropic团队在《Harness design for long-running application development》中揭示了AI应用开发的关键洞见:真正决定复杂任务完成质量的不是模型本身,而是为其设计的工作框架(harness)。文章通过前端设计和长时应用开发案例,展示了如何通过拆分任务、建立评价标准和构建闭环系统来解决模型的长程失稳和自我评价失真问题。核心观点包括:将主观任

Anthropic团队在《Harness design for long-running application development》中揭示了AI应用开发的关键洞见:真正决定复杂任务完成质量的不是模型本身,而是为其设计的工作框架(harness)。文章通过前端设计和长时应用开发案例,展示了如何通过拆分任务、建立评价标准和构建闭环系统来解决模型的长程失稳和自我评价失真问题。核心观点包括:将主观任

揭示了 Claude Code 如何将组织经验工程化为可复用的 Agent 能力单元。文章指出,有效的 skill 不是简单的提示词模板,而是包含脚本、数据、流程的"能力目录",覆盖从代码生成到运维的完整交付链路。Anthropic 总结了 9 类实用 skills 和 7 条关键经验,强调应聚焦模型易错点而非重复常识,通过渐进式文件披露和脚本化提升效率。skill 本质上是将

本文介绍了工具系统设计的关键要素,重点围绕LLM与工具的协作机制展开。工具系统通过三个核心问题定义其架构:工具定义、执行和管理。工具接口(Tool)作为核心契约,包含名称、描述、参数和执行逻辑等关键方法。设计亮点包括:异步获取工具描述以适应动态场景,使用Zod Schema实现类型与校验统一,以及分离工具结果与状态的双通道机制。BaseTool作为抽象基类,实现了工具状态机管理、流式参数解析(is

设计模型的工具,既是一门科学,也是一门艺术。我很认同这一点。因为 Agent 系统不是纯静态软件,它面对的是一个会随着模型能力变化而不断迁移的交互对象。今天有效的设计,明天未必仍然最优。多观察输出多实验多调整工具边界多重新审视原来的假设Agent 的工具设计,不该从“我们能接多少能力”开始,而应该从“模型真正能顺畅地用什么能力”开始。这可能才是这篇文章最值得带走的结论。

摘要:文章探讨了Prompt Caching在Agent系统设计中的核心地位,指出其不仅是优化手段,更是决定产品形态的基础设施。通过Claude Code的实践案例,揭示了5个关键设计原则:1) 按稳定性分层组织Prompt结构;2) 用消息而非修改System Prompt传递变化;3) 避免会话中途切换模型;4) 保持工具集稳定;5) 上下文压缩需保持前缀复用。这些原则表明,Agent设计需同

上一篇写了自己的原生agent如何实现的mcp,这篇文章说说怎么实现的skills。其实skills比mcp实现起来要简单很多,因为他本质是渐进式披露加载文件系统,然后让大模型去执行skill,也是需要初始化skills获取元数据,

Claude Agent Skills实操心得,简单易懂!

动态 Prompt 构建技术解析 本文介绍了 Agent 框架中动态 prompt 构建的核心机制,主要包含两个关键部分: 双 prompt 注入系统: systemPrompt(系统角色定义)作为 system 消息注入 environmentPrompt(实时上下文)作为末尾 user 消息注入 这种分离设计考虑了缓存优化和语义区分 systemPrompt 的四层组合结构: 基础角色定义和核

多Agent子任务编排系统 本文介绍了一个基于父子任务机制的多Agent协作系统,通过schoober-ai-sdk实现。系统允许主Agent作为协调者,将复杂任务分解并委派给专业子Agent处理。核心架构包括: 分层结构:主Agent负责协调,子Agent专注特定领域 异步任务机制:通过NewTaskTool创建子任务,主任务暂停等待结果 独立运行环境:每个子Agent拥有独立的配置和工具集 状








