别再堆大模型了！多智能体编排，才是复杂任务的正确打开方式

/ 智能体1：意图识别（只负责解析用户需求） @AiService interface IntentAgent {@SystemMessage("提取用户需求的核心意图、关键参数（如客户ID、产品名称），只返回结构化信息，不冗余") String parseIntent(String question);} // 智能体2：RAG检索（只负责从PGVector检索知识） @AiService in

恼书:-(空寄

306人浏览 · 2026-05-18 16:59:07

恼书:-(空寄 · 2026-05-18 16:59:07 发布

大模型是“能力单元”，不是“全能选手”。单靠堆模型参数、堆Prompt，永远解决不了复杂任务的“流程化、协同化”问题。而真正的破局点，是「多智能体编排」——让多个“专精于某一领域”的智能体，分工协作、按流程执行，像团队一样完成复杂任务。今天就跟大家聊透：为什么别再堆大模型了？多智能体编排到底强在哪？

一、堆大模型的3个致命问题

先直面现实：单模型再强，也扛不住复杂任务的考验，这3个问题几乎无法解决。

1. 单模型“精力有限”，多步骤任务易断层

大模型的上下文窗口是有限的，而且擅长“单点任务”（比如问答、生成），但不擅长“多步骤流程”。

比如一个简单的“企业客户需求处理”任务：

「接收客户需求 → 检索产品知识库 → 调用CRM查询客户信息 → 判断客户等级 → 生成定制化方案 → 推送方案给销售」

单模型处理时，很容易出现：遗漏“查询CRM”步骤、忘记判断客户等级、方案和客户信息不匹配——不是模型不够强，而是它无法像人一样“按流程拆解任务、分步执行”。

2. 堆参数=高成本，性价比极低

很多人觉得“模型参数越大，能力越强”，但忽略了两个核心问题：

成本翻倍：70B模型的部署成本，是7B模型的10倍以上，需要更高配置的服务器，运维成本也直线上升；
收益递减：参数从7B升到13B，能力有明显提升，但从34B升到70B，对于复杂任务的提升微乎其微，反而会增加推理延迟。

对于企业来说，追求“能用、好用、低成本”，远比“堆参数”更有意义。

3. 功能耦合严重，无法灵活扩展

如果用单模型处理所有任务，Prompt会变得极其臃肿，而且一旦需要新增功能（比如新增“客户售后跟进”步骤），就要重新修改Prompt、重新调试，甚至需要更换更大的模型，扩展性极差。

就像一个人既要做产品、又要做开发、还要做销售、做运维——看似全能，实则每一项都做不精，而且一旦有新任务，就会彻底乱套。

二、多智能体编排，让智能体“分工协作”

多智能体编排的核心逻辑很简单：把复杂任务拆解成多个简单的子任务，给每个子任务分配一个“专精智能体”，再用编排工具（比如LangGraph）定义流程，让它们协同完成任务。

这就像一个高效的团队：

产品经理（智能体1）：拆解需求、明确任务目标；
研发工程师（智能体2）：负责技术实现；
测试工程师（智能体3）：负责测试验证；
运维工程师（智能体4）：负责部署上线；
项目经理（编排工具）：协调各角色，按流程推进，确保任务落地。

对比单模型，多智能体编排有3个不可替代的优势：

1. 分工明确，每个智能体“专精一项”

不用追求“大而全”，而是“小而精”：

检索智能体：只负责从PGVector/Milvus向量库中检索相关知识，不做其他操作；
工具调用智能体：只负责调用CRM、ERP等业务接口，处理数据查询；
总结智能体：只负责将检索结果、工具返回数据，汇总成规范报告；
意图识别智能体：只负责解析用户需求，判断任务类型。

每个智能体都用最合适的小模型（比如7B），既降低成本，又能保证每一步的准确性。

2. 流程可控，避免逻辑断层

通过编排工具（LangGraph），可以明确定义“谁先做、谁后做、遇到异常怎么办”，流程可视化、可控制。

比如刚才的“客户需求处理”任务，用LangGraph编排后，流程是固定的：

「意图识别智能体 → 检索智能体 → 工具调用智能体 → 总结智能体」

只有前一个智能体完成任务，才能进入下一个步骤；如果某一步失败（比如检索不到知识），可以自动触发降级逻辑（比如提示用户“暂无相关信息”），不会出现逻辑断层。

3. 灵活扩展，新增功能零侵入

如果需要新增“客户售后跟进”步骤，只需新增一个“售后智能体”，然后在LangGraph中调整流程，无需修改其他智能体的代码，也无需更换模型。

就像团队新增一个售后角色，只需明确其职责和流程，不会影响其他成员的工作——这种扩展性，是单模型永远无法实现的。

三、LangGraph + Spring AI 落地多智能体编排

对于Java后端开发者来说，无需学习新的语言，用Spring AI + LangGraph + PGVector，就能快速落地多智能体编排。

1. 环境准备

核心依赖：Spring AI、LangGraph、PGVector（向量库）、Ollama（本地模型），已解决版本冲突：

<plugins>
    val kotlinVersion = "2.0.20"
    java
    kotlin("jvm") version kotlinVersion
    kotlin("plugin.spring") version kotlinVersion
    id("org.springframework.boot") version "3.3.0"
    id("io.spring.dependency-management") version "1.1.4"
</plugins>

<dependencies>
   <!-- Spring Boot 基础 -->
    implementation("org.springframework.boot:spring-boot-starter-web")
    implementation("org.springframework.boot:spring-boot-starter-data-jpa")

    <!-- Spring AI 核心 -->
    implementation("org.springframework.ai:spring-ai-core")
    implementation("org.springframework.ai:spring-ai-ollama")

    <!-- LangGraph 编排 -->
    implementation("dev.langchain4j:langchain4j-langgraph:1.11.0-beta19")

    <!-- PGVector 向量库 -->
    runtimeOnly("org.postgresql:postgresql")
    implementation("dev.langchain4j:langchain4j-pgvector:1.11.0-beta19")

    <!-- 工具类 -->
    implementation("org.apache.commons:commons-lang3:3.14.0")
</dependencies>

2. 配置文件（application.yml）

配置Ollama本地模型、PGVector向量库，无需复杂配置：

spring:
  datasource:
    url: jdbc:postgresql://localhost:5432/ai_db
    username: postgres
    password: 123456

# Ollama 本地模型（私有化部署，无需联网）
spring:
  ai:
    ollama:
      base-url: http://localhost:11434
      chat:
        model: qwen:7b
      embedding:
        model: nomic-embed-text

# PGVector 配置
langchain4j:
  pgvector:
    table: doc_embedding
    dimension: 768
    index-type: HNSW

3. 定义4个专精智能体（分工明确）

每个智能体只负责一项任务，用Spring AI的@AiService注解快速实现：

import dev.langchain4j.service.AiService;
import dev.langchain4j.service.SystemMessage;
import dev.langchain4j.service.Tool;
import dev.langchain4j.service.Tools;

// 智能体1：意图识别（只负责解析用户需求）
@AiService
interface IntentAgent {
    @SystemMessage("提取用户需求的核心意图、关键参数（如客户ID、产品名称），只返回结构化信息，不冗余")
    String parseIntent(String question);
}

// 智能体2：RAG检索（只负责从PGVector检索知识）
@AiService
interface RagAgent {
    @SystemMessage("根据用户需求和检索到的上下文，返回相关知识，不添加额外内容")
    String retrieve(String question, String context);
}

// 工具类（业务接口，供智能体调用）
class CrmTool {
    @Tool("根据客户ID查询客户信息，参数：customerId")
    public String queryCustomer(String customerId) {
        // 实际项目中对接CRM接口
        return "客户ID：" + customerId + "，客户等级：VIP，历史订单：3单，客单价：5000元";
    }
}

// 智能体3：工具调用（只负责调用业务工具）
@AiService
@Tools(CrmTool.class)
interface ToolAgent {
    @SystemMessage("根据意图信息，调用对应的工具，返回工具查询结果")
    String executeTool(String intentInfo);
}

// 智能体4：总结回答（只负责汇总所有结果，生成最终回复）
@AiService
interface SummaryAgent {
    @SystemMessage("整合意图、检索结果、工具查询结果，用自然语言友好回复用户，逻辑清晰、重点突出")
    String summary(String intent, String ragResult, String toolResult);
}

4. LangGraph 编排流程

用LangGraph定义智能体的执行流程，明确“谁先执行、谁后执行”，流程可灵活调整：

import dev.langchain4j.langgraph.Graph;
import dev.langchain4j.langgraph.State;
import dev.langchain4j.store.embedding.EmbeddingStore;
import dev.langchain4j.store.embedding.TextSegment;
import org.springframework.stereotype.Service;

// 流程状态：存储各步骤的结果
class AgentFlowState implements State {
    String question;       // 用户问题
    String intent;         // 意图识别结果
    String ragContext;     // RAG检索结果
    String toolResult;     // 工具调用结果
    String finalAnswer;    // 最终回答

    // 重写get/put方法，供LangGraph管理状态
    @Override
    public Any get(String key) {
        return switch (key) {
            case "question" -> question;
            case "intent" -> intent;
            case "ragContext" -> ragContext;
            case "toolResult" -> toolResult;
            case "finalAnswer" -> finalAnswer;
            default -> null;
        };
    }

    @Override
    public void put(String key, Any value) {
        switch (key) {
            case "question" -> question = (String) value;
            case "intent" -> intent = (String) value;
            case "ragContext" -> ragContext = (String) value;
            case "toolResult" -> toolResult = (String) value;
            case "finalAnswer" -> finalAnswer = (String) value;
        }
    }
}

@Service
class MultiAgentOrchestrationService {

    private final IntentAgent intentAgent;
    private final RagAgent ragAgent;
    private final ToolAgent toolAgent;
    private final SummaryAgent summaryAgent;
    private final EmbeddingStore<TextSegment> embeddingStore;
    private final dev.langchain4j.model.embedding.EmbeddingModel embeddingModel;

    // 构造器注入所有智能体和依赖
    public MultiAgentOrchestrationService(IntentAgent intentAgent, RagAgent ragAgent,
                                          ToolAgent toolAgent, SummaryAgent summaryAgent,
                                          EmbeddingStore<TextSegment> embeddingStore,
                                          dev.langchain4j.model.embedding.EmbeddingModel embeddingModel) {
        this.intentAgent = intentAgent;
        this.ragAgent = ragAgent;
        this.toolAgent = toolAgent;
        this.summaryAgent = summaryAgent;
        this.embeddingStore = embeddingStore;
        this.embeddingModel = embeddingModel;
    }

    // 构建LangGraph流程
    public Graph<AgentFlowState> buildFlow() {
        return Graph.builder(AgentFlowState.class)
                // 节点1：意图识别（第一步）
                .node("intentNode", state -> {
                    state.intent = intentAgent.parseIntent(state.question);
                    return "ragNode"; // 下一步：RAG检索
                })
                // 节点2：RAG检索（第二步）
                .node("ragNode", state -> {
                    // 从PGVector检索相关知识
                    var embedding = embeddingModel.embed(state.question);
                    var relevant = embeddingStore.findRelevant(embedding, 3);
                    state.ragContext = relevant.stream()
                            .map(match -> match.embedded().text())
                            .collect(Collectors.joining("\n"));
                    return "toolNode"; // 下一步：工具调用
                })
                // 节点3：工具调用（第三步）
                .node("toolNode", state -> {
                    state.toolResult = toolAgent.executeTool(state.intent);
                    return "summaryNode"; // 下一步：总结回答
                })
                // 节点4：总结回答（第四步）
                .node("summaryNode", state -> {
                    state.finalAnswer = summaryAgent.summary(
                            state.intent, state.ragContext, state.toolResult
                    );
                    return "end"; // 流程结束
                })
                .start("intentNode") // 流程入口：意图识别
                .end("end") // 流程出口
                .build();
    }

    // 执行入口：接收用户问题，返回最终回答
    public String runAgent(String question) {
        Graph<AgentFlowState> flow = buildFlow();
        AgentFlowState state = new AgentFlowState();
        state.question = question;
        flow.run(state);
        return state.finalAnswer;
    }
}

5. 对外接口（供前端调用）

import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestBody;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

@RestController
@RequestMapping("/agent")
public class AgentController {

    private final MultiAgentOrchestrationService agentService;

    public AgentController(MultiAgentOrchestrationService agentService) {
        this.agentService = agentService;
    }

    @PostMapping("/chat")
    public String chat(@RequestBody String question) {
        return agentService.runAgent(question);
    }
}

6. 效果演示

用户提问：「帮我查询客户ID为VIP001的信息，同时告诉我我们的高端产品政策」

系统自动执行流程：

意图识别智能体：提取「客户ID：VIP001，意图：查询客户信息+高端产品政策」；
RAG检索智能体：从PGVector检索「高端产品政策」相关知识；
工具调用智能体：调用CRM工具，查询VIP001的客户信息；
总结智能体：汇总所有信息，生成最终回复。

最终回复：

「客户ID：VIP001，客户等级：VIP，历史订单：3单，客单价：5000元。我们的高端产品政策如下：1. 年消费满10万元可享8折优惠；2. 提供专属客户经理一对一服务；3. 免费赠送年度运维服务。」

整个流程自动执行，无需人工干预，而且每一步都可追溯、可调试。

四、多智能体编排的3个落地建议

1. 任务拆解“宁细勿粗”

复杂任务拆解成子任务时，尽量细化，每个子任务只让一个智能体负责，避免“一个智能体做多个事情”。比如“生成报告”可以拆解成“检索知识→调用数据→整理格式→生成报告”，每个步骤一个智能体。

2. 优先用“小模型”，不堆大模型

除了总结、意图识别等需要较强理解能力的智能体，其他智能体（如检索、工具调用）用7B模型足够，无需上13B、34B模型，降低部署成本和推理延迟。

3. 流程设计“留降级”

每个节点都要设计降级逻辑，比如检索不到知识时，提示用户“暂无相关信息”；工具调用失败时，自动重试或触发人工介入，避免整个流程卡死。

五、别再盲目堆模型了

AI开发的核心，从来不是“模型越大越好”，而是“如何让AI高效解决实际问题”。

单模型就像一个“全能选手”，看似什么都能做，实则什么都做不精；而多智能体编排，就像一个“高效团队”，每个成员专精一项，协同完成复杂任务——这才是复杂任务的正确打开方式。

对于Java后端开发者来说，Spring AI + LangGraph + PGVector的组合，已经把多智能体编排的门槛降到了最低：不用学习新语言，不用复杂部署，直接复用现有技术栈，就能快速落地。

与其花大量精力堆模型参数、调Prompt，不如试试多智能体编排——你会发现，复杂任务的解决效率，会有质的提升。

北京朝阳AI社区

更多推荐

AI 应用软件开发的技术方案

现代AI应用开发正经历从传统工程向数据驱动范式的转变，其技术架构包含四层：1）基础模型层采用多模型混用策略，结合大模型推理与小模型垂直任务处理；2）数据层通过RAG技术和向量数据库实现知识检索；3）业务逻辑层运用LangChain等框架进行智能体编排；4）交互层采用流式渲染和动态UI生成。开发需解决三大核心问题：AI性能监控、安全防护及持续评估体系，推荐使用Python/TS技术栈配合低代码工具实