基于Workbuddy的双Agent闭环校验实践：解决AI技能装载中的信息遗漏问题

基于Workbuddy的双Agent闭环校验实践

神助

339人浏览 · 2026-04-26 07:59:43

神助 · 2026-04-26 07:59:43 发布

摘要： 本文记录了一次针对Workbuddy Agent在执行技能装载（Skill Loading）任务时出现的遗漏问题进行架构优化的实战过程。通过引入“双Agent架构”（执行Agent + 校验Agent），构建了一个最小闭环的反馈系统，显著提升了任务执行的准确率，并探讨了该模式在低成本自动化中的技术价值。

一、问题背景：单一Agent的执行盲区

在长期使用Workbuddy（下称“小钱”）的过程中，我发现了一个典型的LLM（大语言模型）应用痛点。当输入源包含几十篇关于“三省六部”、“OODA循环”的技术文章时，单一Agent存在明显的信息遗漏（Information Omission）。

例如，在最近一次测试中，小钱生成的技能列表漏掉了关键的GitHub链接。这并非简单的“粗心”，而是类似于软件开发中的“单点失效”。由于LLM的注意力机制限制及上下文窗口的干扰，单一执行者在没有外部反馈机制的情况下，很难保证100%的准确率。

二、架构设计：引入“小严”进行逆向校验

为了对抗这种熵增，我设计了第二个Agent——“小严”。

这不仅仅是增加一个实例，而是构建了一个生产者-消费者模型的闭环系统。

执行层（Agent A - 小钱）： 负责解析文档、提取技能点、生成配置文件。
校验层（Agent B - 小严）： 角色设定为“拥有上帝视角的科学家”。其Prompt工程核心在于逆向思维与完整性校验。

工作流如下：

graph LR
    A[输入文档] --> B(小钱: 技能提取)
    B --> C{小严: 校验}
    C -- 通过 --> D[技能入库]
    C -- 失败 --> E[返回错误日志]
    E --> B

三、深度剖析：为什么需要“小严”？

从技术原理上讲，这利用了对抗生成的思想雏形。单一Agent往往陷入“局部最优”或“自我确认偏误”（Confirmation Bias）。通过引入第二个具有独立视角的Agent，我们实现了：

交叉验证（Cross-Validation）： 对配置路径、文档完整性进行二次确认。
错误隔离： 将执行与验证解耦，避免错误累积。

四、成本效益分析（Cost-Benefit Analysis）

该架构在“一人公司”场景下的优势极为明显：

维度	传统开发团队	双Agent架构
人力成本	程序员(2W) + 测试(1.5W)	Token消耗 (~200元/月)
容错率	依赖人工Review	自动化闭环校验
扩展性	招聘周期长	秒级复制Agent