《AI Agent开发:零基础构建复合智能体》

本书内容

《AI Agent开发:零基础构建复合智能体》聚焦于基于大语言模型(LLM)构建智能体系统的全面解析。内容包括:LLM的核心原理、Agent的内部架构组成、LangChain与LangGraph框架、RAG检索增强生成机制、MCP上下文通信协议、A2A多智能体协作协议以及扣子低代码平台等一系列关键技术要点。书中配备了大量翔实的案例与实战项目,引领读者逐步精通从模型调用直至系统集成的全流程操作,并详细阐释如何将诸如Qwen 3.0、DeepSeek-V1这类通用语言模型与外部工具进行深度整合,从而打造出拥有记忆功能、自主推理能力、任务分解技巧以及多轮交互特性的先进智能体系统。此外,《AI Agent开发:零基础构建复合智能体》还贴心提供了配套的教学视频和示例源码,助力读者更加高效地学习本书知识。

本书作者

梁志远,博士,毕业于北京航空航天大学。长期从事人工智能、大语言模型的开发,专注于深度学习、自然语言处理、数据分析与智能决策等领域。主持或参与多项科研项目,涵盖模型训练优化、知识蒸馏、自动推理与多模态学习等方向。致力于推动人工智能技术在工业应用、智能交互与数据驱动中的实践与发展。

本书读者

《AI Agent开发:零基础构建复合智能体》兼具内容的深入浅出、案例的丰富多元以及技术的前沿先进性,无论是渴望踏入LLM应用开发领域的初学者,还是致力于探索Agent开发的工程实践者,亦或是负责搭建企业AI平台的技术负责人,都能从中受益。

本书目录

目    录

第 1 章  大模型与智能体技术基础1

1.1  智能体发展的技术背景1

1.1.1  从专家系统到语言模型1

1.1.2  感知?认知?执行5

1.1.3  智能体的系统级结构模型7

1.2  大模型的基本架构9

1.2.1  Transformer结构剖析10

1.2.2  编码器与解码器机制13

1.2.3  注意力机制与多头注意力15

1.2.4  位置编码与上下文建模17

1.3  大模型能力边界与应用接口20

1.3.1  通用能力与推理能力20

1.3.2  输入长度限制与窗口控制21

1.3.3  提示词工程23

1.3.4  多模态模型26

1.4  构建语言智能体的基本流程29

1.4.1  任务建模与输入输出结构定义29

1.4.2  大模型API设计模式32

1.4.3  基于上下文的行为规划设计33

1.5   本章小结34

第 2 章  智能体系统的组成结构与运行机制35

2.1  智能体核心模块构成35

2.1.1  感知模块:输入理解与解析35

2.1.2  决策模块:推理与规划逻辑37

2.1.3  行动模块:工具执行与响应38

2.1.4  记忆模块:上下文与持久状态40

2.2  智能体生命周期管理41

2.2.1  启动与初始化过程41

2.2.2  对话状态追踪机制44

2.2.3  中断恢复与持久化上下文机制48

2.2.4  智能体注销与资源释放机制52

2.3  与外部系统的集成方式55

2.3.1  调用Web API与插件机制56

2.3.2  与数据库系统的读写操作59

2.3.3  文件系统与代码执行环境62

2.3.4  UI输入输出的中间层接口64

2.4  本章小结67

第 3 章  大模型开发基础68

3.1  模型服务部署架构68

3.1.1  OpenAI式SaaS调用方式68

3.1.2  本地部署Qwen 3.0模型流程72

3.1.3  模型微调与LoRA注入机制74

3.1.4  GPU资源调度与推理优化76

3.2  API调用设计模式79

3.2.1  Chat Completion API设计79

3.2.2  函数调用标准结构82

3.2.3  批处理与流式传输机制85

3.3  安全与内容控制机制88

3.3.1  敏感词过滤与红线审查88

3.3.2  输出可信度评估机制91

3.4  本章小结94

第 4 章  LangChain框架与智能体构建流程95

4.1  LangChain的核心组件95

4.1.1  LLM接口抽象结构95

4.1.2  Chains链式逻辑构造器97

4.1.3  Tools与Agent集成机制99

4.1.4  Memory记忆管理模块101

4.2  工具集成与函数调用机制103

4.2.1  工具函数包装规范103

4.2.2  Tool执行环境与沙盒控制104

4.2.3  多工具调用顺序管理106

4.3  LangChain Agent运行机制108

4.3.1  ReAct智能体结构108

4.3.2  自定义提示词驱动智能体109

4.3.3  工具链动态规划逻辑111

4.4  本章小结113

第 5 章  LangGraph智能体编排与任务流管理114

5.1  LangGraph概述114

5.1.1  从LangChain到LangGraph114

5.1.2  LangGraph在智能体体系中的定位115

5.1.3  面向复杂任务的图式化编排需求118

5.2  LangGraph的核心概念与结构119

5.2.1  节点与边的定义119

5.2.2  状态与上下文存储机制121

5.2.3  任务依赖与执行路径122

5.3  LangGraph与LangChain的互补关系123

5.3.1  链式调用与图式编排的差异123

5.3.2  与LangChain工具链的集成方式123

5.3.3  在复杂Agent系统中的联合使用125

5.4  LangGraph工程化实战125

5.4.1  LangGraph安装与运行环境准备126

5.4.2  基于LangGraph的简单任务流示例127

5.4.3  面向科研助手的多步骤任务实现129

5.4.4  结合外部工具与数据库的集成案例131

5.5  LangGraph与协议层的衔接133

5.5.1  与MCP的接口映射133

5.5.2  与A2A(多Agent通信协议)的结合136

5.5.3  面向大规模Agent网络的扩展性设计138

5.6  本章小结142

第 6 章  RAG机制:检索增强智能体143

6.1  RAG原理与系统架构143

6.1.1  检索-生成双阶段框架143

6.1.2  向量数据库的嵌入机制145

6.1.3  文档切片与Chunking策略146

6.1.4  基于语义相关度的召回机制148

6.2  文档预处理与向量化149

6.2.1  文本清洗与句元切分149

6.2.2  Embedding模型选择151

6.2.3  Faiss/Weaviate/Chroma部署154

6.3  基于LangChain的RAG实现157

6.3.1  RetrievalQA链路构建157

6.3.2  多段检索与Top-K融合161

6.3.3  文本与结构化数据混合检索164

6.4  本章小结167

第 7 章  MCP协议:模型上下文通信标准168

7.1  MCP协议基础设计理念168

7.1.1  模型上下文管理的核心难题168

7.1.2  上下文段结构化表示170

7.1.3  系统提示、记忆段、工具段定义173

7.2  上下文标注与路由机制176

7.2.1  metadata标签语义结构177

7.2.2  信息路由控制策略178

7.2.3  模型分支路由与入口决策逻辑181

7.3  上下文存储与回调机制183

7.3.1  持久化上下文日志设计184

7.3.2  提示词缓存与快速回放机制187

7.3.3  动态上下文合并策略189

7.4  本章小结192

第 8 章  单智能体系统构建实战193

8.1  单智能体结构设计193

8.1.1  输入输出流封装标准193

8.1.2  智能体状态管理机制194

8.2  工具调用链设计与调试197

8.2.1  工具注册与执行框架197

8.2.2  输入参数解析与封装198

8.2.3  工具异常处理机制201

8.3  记忆机制实现204

8.3.1  短期Memory与长期Memory204

8.3.2  LangChain中的Memory类详解205

8.3.3  上下文动态剪辑策略208

8.4  本章小结210

第 9 章  多智能体系统构建实战211

9.1  多智能体系统的基本结构211

9.1.1  主控智能体与子任务智能体划分211

9.1.2  智能体职责分工建模213

9.1.3  多智能体间的状态共享机制216

9.2  多智能体任务协调调度218

9.2.1  任务分配策略:轮询与权重219

9.2.2  任务依赖链与优先级控制222

9.2.3  子智能体并行执行管理225

9.3  多智能体消息传递机制227

9.3.1  智能体间的通信协议格式228

9.3.2  上下文切换与隔离设计230

9.3.3  状态同步与锁控制策略232

9.4  本章小结235

第 10 章  A2A协议:智能体之间的协作语言236

10.1  A2A协议设计概述236

10.1.1  什么是A2A协议236

10.1.2  消息格式与语义设计规范238

10.1.3  智能体身份认证与能力声明机制242

10.1.4  A2A协议与MCP协议在Qwen 3.0原生支持下的开发流程245

10.2  消息类型与调度规则249

10.2.1  Request-Response机制详解249

10.2.2  广播与订阅模型设计252

10.2.3  协商与竞争机制设计254

10.3  本章小结257

第 11 章  扣子低代码平台开发与智能体部署258

11.1  扣子平台结构与功能概览258

11.1.1  什么是扣子258

11.1.2  低代码开发模式与传统开发模式的区别260

11.1.3  搭建一个AI助手智能体261

11.2  基于扣子的智能体开发实战264

11.2.1  使用自然语言搭建智能体264

11.2.2  开发一个AI翻译应用267

11.3  扣子平台进阶开发272

11.3.1  扣子罗盘272

11.3.2  扣子空间275

11.3.3  扣子API与SDK开发进阶277

11.4  本章小结279

第 12 章  智能体系统的部署、扩展与维护实战280

12.1  智能体系统部署策略280

12.1.1  私有部署与云端部署比较280

12.1.2  Web服务化部署流程282

12.1.3  部署环境中的安全加固措施285

12.2  性能优化与可用性保障289

12.2.1  API负载均衡与异步任务调度289

12.2.2  缓存系统设计与多层级记忆291

12.2.3  智能体失败容错机制297

12.2.4  高并发场景的限流与降级策略300

12.3  本章小结303

第 13 章  项目案例:从零实现一个复合智能体系统304

13.1  项目需求分析与功能规划304

13.1.1  项目目标与业务流程分析304

13.1.2  多智能体协同模块划分306

13.1.3  用户交互界面设计要点306

13.1.4  数据结构与模型接口定义307

13.2  核心模块的开发过程310

13.2.1  用户意图识别与入口解析310

13.2.2  工具调用链与异常回退机制313

13.2.3  智能体子系统状态管理与调度315

13.2.4  RAG检索子系统设计与集成318

13.3  协议实现与部署流程321

13.3.1  MCP上下文路由配置321

13.3.2  A2A消息协议的模块注入323

13.3.3  LangChain核心逻辑集成326

13.4  项目测试与性能评估329

13.4.1  对话流程完整性测试流程329

13.4.2  工具调用正确率测试330

13.4.3  多用户并发测试与系统压测334

13.4.4  模型幻觉率与用户满意度评估337

13.5  本章小结341

编辑推荐

1.《AI Agent开发:零基础构建复合智能体》系统地介绍了智能体的核心原理与构建实践,涵盖了当前智能体开发的热点与流行技术,包括:MCP、A2A、RAG、LangChain、LangGrapsh,以及代码平台扣子等,并提供了从单智能体到复杂智能体的全流程开发技术细节。

2.全书以知识点+示例的教学方式,循序渐进,由浅入深,并提供了大量实例演示,以及完整的项目实战,以及智能体的部署与运维技术,可帮助读者系统掌握开发技能,并用于解决业务需求与实际问题。

3.《AI Agent开发:零基础构建复合智能体》还提供了教学视频,以二维码的形式呈现在书中对应章节,读者在阅读过程中可扫码观看,大大提高学习效率,同时,《AI Agent开发:零基础构建复合智能体》还提供配套示例代码,读者可直接调用进行演练。

4.全书尽可能使用通俗易懂的语言进行描述,提供全面的系统的知识与智能体构建方法论,适合对智能体感兴趣的研发人员、初学者、在校学生,以及准备面试智能体开发岗位的各层次读者学习。

本书特色

本文摘自《AI Agent开发:零基础构建复合智能体》,获出版社和作者授权发布。

AI Agent开发:零基础构建复合智能体——jdhttps://item.jd.com/14537283.html

Logo

更多推荐