
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文分析了s02_tool_use.py源码的设计思路与改进。相比仅支持bash工具的s01版本,s02新增了read_file、write_file和edit_file三个专用文件工具,通过dispatch map路由到对应的handler函数,核心改进包括: 安全机制:引入safe_path()路径沙箱,通过几何约束防止路径逃逸工作目录,比黑名单更可靠; 文件操作:专用工具避免了bash操作的
本文分析了如何让AI模型通过代理循环与真实世界交互。传统聊天机器人只能被动响应,而s01_agent_loop.py实现了一个30行的核心循环,使模型能主动执行bash命令并处理结果。关键设计包括:通过stop_reason判断工具调用需求,动态维护消息历史,以及安全执行命令的防护机制。相比纯聊天模式,该系统实现了自主行动能力,将用户从手动复制粘贴中解放出来,形成"模型决策-代码执行&q
s04 引入了一个新工具task——不是自己去探索,而是派一个"子代理"去探索,子代理做完回来只汇报结果。父代理 (Parent Agent) 子代理 (Subagent)| messages=[...已有上下文] | | messages=[] ← 空白开始 || | 派发 | || prompt="调研所有..." | | 执行 bash/read/edit || description="调
THRESHOLD = 50000 # tokens 阈值每轮循环在调用 API 之前检查。用粗略估算——不需要精确计数,只需要判断"是不是该压缩了"。auto_compact 最精妙的地方是让 LLM 自己摘要自己的对话。没有预定义的"什么重要"的规则——模型自己判断哪些决定、哪些状态值得保留。这是用 LLM 的理解能力解决传统程序难以处理的问题(“什么是关键信息?”)。
lines = []name } : {name } : {name } : {if tags:name } : {]"这段文本被嵌入 system prompt,模型看到的只是"有哪些 skill 以及一句话描述"。每个 skill 大约占 100 tokens——10 个 skill 才 1000 tokens,比全部塞进去省了 10-20 倍。name:skill 名称,必填。模型从 sys
基于源码逐行分析,配合设计思路。
基于源码逐行分析,配合设计思路。
基于源码逐行分析,配合设计思路。
模型只是"使用"这些协议(调用相应的工具),但协议的存在、状态追踪、超时处理、响应匹配——全是 Harness 代码的责任。
初学者允许你从同一个仓库创建多个工作目录,每个目录有自己的分支。它们共享同一个.git目录(节省磁盘空间),但文件系统完全隔离。主仓库: /project (branch: main)每个 worktree 像一个独立的克隆,但不需要重新 clone 整个仓库。创建 worktree 通常只需要几秒钟。







