简化多智能体系统：基于双Agent的通用工具操作框架

在当今多智能体系统设计中，我们常常面临一个核心挑战：如何平衡灵活性与复杂性。传统的多Agent架构往往需要将大量工具和功能暴露给LLM，导致系统臃肿、错误处理复杂且维护成本高。今天，我将介绍一种创新的双Agent设计范式，通过极简的架构实现强大的工具操作能力。

东方金木 · 2025-10-03 12:37:39 发布

传统多Agent系统通常为每个功能领域设计专用Agent，如检索Agent、写作Agent、邮件Agent等。这种设计虽然功能明确，但随着系统扩展，Agent数量增加，导致交互复杂度呈指数级增长。Agent间的通信、错误处理和任务协调变得异常复杂。

更糟糕的是，当某个Agent需要修改时，往往会产生连锁反应，需要调整多个相关Agent的配置和交互逻辑。这不仅增加了开发难度，也降低了系统的稳定性和可维护性。

我们的解决方案是采用仅有两个暴露给LLM的Agent的极简架构，每个Agent职责单一且高度专注：

这个Agent充当系统的“工具目录”，负责集中管理所有可用工具的元数据信息。其核心功能包括：

这种集中式的工具管理方式，避免了LLM直接面对大量工具细节的复杂性，将工具选择问题转化为标准的元数据查询操作。

这个Agent负责接收和处理DAG（有向无环图）形式的工作流定义，具体功能包括：

关键优势在于，DAG执行Agent不需要理解工具的具体功能，只需关注工作流的执行逻辑，实现了关注点的彻底分离。

双Agent架构的工作流程遵循清晰的阶段性划分：

LLM首先与工具元数据管理Agent交互，获取可用工具的完整信息。基于任务需求和工具能力，LLM逐步构建一个可靠的DAG执行计划。这个阶段允许迭代优化 - 如果初步规划发现问题，可以重新查询工具信息并调整DAG结构，而无需涉及实际工具执行。

一旦DAG规划完成，LLM将其传递给DAG执行Agent进行实际执行。执行过程中可能出现多种情况：

这种“规划-执行-反思”的循环机制，使系统能够应对复杂任务中的不确定性和异常情况。

该设计的真正威力在于其分层递归能力。我们可以将整个双Agent系统本身视为一个高级工具，在更高层级的系统中被调用：

例如，底层系统可能处理具体的API调用和数据处理，而中层系统协调业务流程，高层系统则制定战略决策。这种架构既保持了各层的独立性，又确保了整体的协调性。

与LangGraph、CrewAI等传统多Agent框架相比，双Agent设计具有显著优势：

错误隔离：工具元数据管理Agent的错误仅影响工具查询，不会波及实际执行；DAG执行Agent的错误则局限于工作流执行层面。这种隔离大大降低了调试难度。
简化交互：LLM只需与两个Agent交互，而不是与多个功能Agent进行复杂对话，显著减少了上下文复杂度和出错概率。
灵活扩展：新增工具只需在工具元数据管理Agent中注册，无需修改其他组件系统的扩展变得简单可靠。
统一接口：DAG作为通用工作流表示语言，为不同工具提供了统一的调用和组合方式，提高了系统的规范性。