港中文:公司制度引入多智能体架构
如何设计有效的组织结构以优化基于大语言模型的多智能体系统在复杂推理任务中的协作效率与性能?论文提出了 OrgAgent 框架,首次系统性证实公司式层级结构在多数场景下优于扁平化结构,能显著提升任务准确率并大幅降低 Token 消耗。

📖标题:OrgAgent: Organize Your Multi-Agent System like a Company
🌐来源:arXiv, 2604.01020v1
🌟摘要
虽然基于大型语言模型的多智能体系统在复杂推理方面表现出了强大的潜力,但如何有效地组织多智能体仍然是一个悬而未决的问题。在本文中,我们介绍了OrgAgent,一个公司风格的分层多智能体框架,它将协作分为治理层、执行层和遵从层。OrgAgent将多智能体推理分解为三个层:一个用于规划和资源分配的治理层,一个用于任务求解和审查的执行层,以及一个用于最终答案控制的合规层。通过跨推理任务、LLM、执行模式和执行策略评估框架,我们发现,以公司式层级组织的多代理系统通常优于其他组织结构。此外,在大多数设置中,层级协调相对于平面协作也减少了令牌消耗。例如,对于GPT-OSS-120 B,在SQuAD 2.0上,分层设置将平面多代理系统的性能提高了102.73%,同时将令牌使用量减少了74.52%。进一步的分析表明,当任务受益于稳定的技能分配、受控的信息流和分层验证时,分层设置的帮助最大。总体而言,我们的研究结果突出了组织结构作为多智能体推理的一个重要因素,不仅塑造了效率和成本,而且还塑造了协调行为。
🛎️文章简介
🔸研究问题:如何设计有效的组织结构以优化基于大语言模型的多智能体系统在复杂推理任务中的协作效率与性能?
🔸主要贡献:提出了 OrgAgent 框架,首次系统性证实公司式层级结构在多数场景下优于扁平化结构,能显著提升任务准确率并大幅降低 Token 消耗。
📝重点思路
🔸构建三层公司式层级架构:将多智能体协作分解为治理层(负责规划与资源分配)、执行层(负责任务求解与审查)和合规层(负责最终答案控制)。
🔸定义专业化角色与技能池:设立 CEO、CTO 等管理角色及起草者、审查者等执行角色,并维护包含技术、定量、推理等六类技能的工人池供动态调用。
🔸设计多样化执行模式与策略:支持直接生成、轻量协作及全量协作三种模式,并结合严格、平衡、无上限及自动四种策略来调控资源使用与交互深度。
🔸对比不同组织结构变量:在多个推理基准测试中,系统对比了单层扁平化结构与三层层级结构在不同大模型 backbone 下的表现差异。
🔎分析总结
🔸层级结构在 MuSiQue 和 SQuAD 2.0 等复杂推理任务上显著优于扁平结构,部分模型性能提升超过 100%,而在简单选择题任务上优势不明显。
🔸层级协调机制能大幅减少 Token 消耗,相比扁平化协作平均节省 46% 至 79% 的 Token,实现了高性能与低成本的兼得。
🔸严格的执行策略(STRICT)通常最具 Token 效率,而灵活策略(NOCAP)虽成本较高但能提升特定任务的准确率,存在明显的性能与成本权衡。
🔸层级结构促使智能体形成更稳定的技能分工与信息流控制,特别是在需要拒绝回答无解问题时,层级系统表现出更高的 abstention 率,减少了幻觉。
💡个人观点
该文从组织管理学视角切入,将成熟的公司层级制度迁移至多智能体角色设计中,有些类似规划、行动和反思。
🧩附录

更多推荐




所有评论(0)