AI Agent Harness Engineering vs. RPA:谁才是未来自动化的主角
AI Agent Harness Engineering vs. RPA:谁才是未来自动化的主角
一、引言
钩子:你是否见过「只会按指令走的机器」和「会思考能应对的智能助手」同时在企业里干活?
上个月在一家头部零售电商做技术咨询,我目睹了一个非常有趣的「冰火两重天」场景:
左边的财务部: 一群戴着黑框眼镜的会计对着三台亮着的电脑屏幕皱眉。电脑上,RPA机器人正在自动抓取每日电商订单的 Excel 表格、筛选跨区域退货的退款数据、录入到公司的 SAP 财务系统。这本该是个「解放双手」的场景,但突然——某供应商的退货 Excel 把「商品SKU码」列名改成了「产品唯一标识」——所有机器人集体「罢工」,红色的日志像瀑布一样刷屏,财务主管对着运维电话喊:「今天下班前必须修复,否则财报初稿出不来!」
右边的客服部: 没有任何人工接线员的工位(不是裁员,是主动转型做「Agent训练师」),取而代之的是一个巨大的监控屏,显示着几十个不同角色的 AI Agent 的工作状态:有自动回应用户退换货、优惠券使用问题的「前台客服Agent」,有自动去第三方物流平台查包裹轨迹的「物流查询Agent」,有自动去库存系统查替代商品并生成推荐话术的「商品推荐Agent」,还有自动协调供应商换货时间、跟踪换货进度的「售后协调Agent」。监控屏偶尔会亮起黄灯(表示Agent对某个问题有80%以上但不到95%的把握),旁边的训练师只需要轻轻点击「确认」或「补充知识库」,Agent就会继续工作,黄灯消失。更神奇的是,有一天电商平台突然上线了「未使用优惠券退款10%」的临时活动,客服主管只在后台给所有前台Agent加了一条简单的规则提示(不是写死的代码,是自然语言:“如果用户在收货后7天内、未使用过任何平台优惠券且退货率低于1%,请主动提醒他们可以申请10%的额外退款”),然后所有Agent立刻就掌握了这个新技能,当天就处理了2000多笔符合条件的主动提醒申请,提升了用户满意度的同时,也减少了后续的客诉。
同样是自动化,为什么RPA如此「脆弱」,而AI Agent Harness Engineering搭建的系统却如此「灵活」?这两种技术到底有什么本质区别?它们的适用场景分别是什么?未来,到底谁才会主导企业自动化的市场?这就是今天这篇文章要和大家深入探讨的核心内容。
定义问题/阐述背景:自动化的「三次浪潮」与「第四次挑战」
在正式对比之前,我们先回顾一下企业自动化的发展历程——这能帮助我们更好地理解RPA和AI Agent Harness Engineering出现的历史背景,以及它们各自解决的问题。
自动化的「三次浪潮」
-
第一次浪潮:工业革命时期的「机械自动化」(18世纪末-20世纪初)
- 核心目标: 用机器代替人的体力劳动
- 典型案例: 蒸汽机驱动的纺纱机、福特汽车的流水线
- 成果: 极大地提高了制造业的生产效率,降低了生产成本
-
第二次浪潮:计算机时代的「软件自动化」(20世纪中-20世纪末)
- 核心目标: 用软件代替人的标准化脑力劳动
- 典型案例: 企业资源计划(ERP)系统、客户关系管理(CRM)系统、电子表格(Excel)
- 成果: 实现了企业内部数据的集中管理和标准化流程的自动化,但需要大量的人工数据录入和系统维护
-
第三次浪潮:互联网时代的「RPA自动化」(2010年前后-至今)
- 核心目标: 用「软件机器人」代替人的基于UI的重复性体力/脑力劳动
- 典型案例: UiPath、Automation Anywhere、Blue Prism等RPA工具
- 成果: 解决了「软件自动化」时代遗留下来的「系统孤岛」问题——不需要修改现有系统的代码,只需要模拟人的鼠标点击、键盘输入、屏幕识别等操作,就能实现不同系统之间的数据流转和流程自动化。但正如我们在开头看到的,RPA有一个致命的弱点:它只能按照人预先写好的「脚本」或「流程」执行,没有任何「思考能力」和「应变能力」
自动化的「第四次挑战」
随着数字化转型的深入,企业面临的业务环境变得越来越复杂、越来越不确定:
- 业务规则变化快: 像开头提到的电商平台临时上线的促销活动,规则可能每周甚至每天都在变
- 非结构化数据多: 企业里的数据不再只是结构化的Excel、数据库表格,还有大量的非结构化数据——比如用户的聊天记录、邮件、合同文本、产品图片、视频等
- 流程碎片化: 很多业务流程不再是「线性的、标准化的」,而是「非线性的、碎片化的」——比如用户的售后问题,可能需要协调客服、物流、库存、供应商等多个部门,每个部门的操作又可能有很多分支和例外情况
- 需要主动决策: 企业不再只是希望自动化工具「按指令做事」,而是希望它们「主动发现问题、主动分析问题、主动解决问题」——比如客服主动提醒用户可以申请额外退款,供应链主动预测缺货风险并提前补货
RPA显然无法应对这些挑战。 那么,什么技术能应对呢?答案就是——AI Agent Harness Engineering。
亮明观点/文章目标:不是非此即彼,而是「RPA打底,AI Agent Harness Engineering主导」
在正式开始之前,我先亮明我的核心观点——未来的企业自动化,不是AI Agent Harness Engineering完全取代RPA,而是两者的有机结合:RPA负责处理「标准化的、基于UI的、没有例外情况的」重复性工作,AI Agent Harness Engineering负责处理「非标准化的、需要理解语义的、需要处理例外情况的、需要主动决策的」复杂工作。但从长期来看,AI Agent Harness Engineering会逐渐占据主导地位,成为未来自动化的主角。
那么,读完这篇文章,你能学到什么呢?
- 你会理解RPA和AI Agent Harness Engineering的核心概念、本质区别、适用场景、优缺点
- 你会看到两者在电商客服、财务报销、供应链管理、医疗诊断等四个不同实际场景下的详细对比和应用案例
- 你会学到AI Agent Harness Engineering的核心架构、核心要素、核心算法、开发流程、最佳实践
- 你会看到一个基于LangChain和AutoGPT框架搭建的「电商智能客服Agent Harness」的完整实战项目**,包括项目介绍、环境安装、系统功能设计、系统架构设计、系统接口设计、系统核心实现源代码
- 你会了解两者的行业发展历史、当前市场规模、未来发展趋势
- 你会得到一个企业选择自动化技术的「决策框架」
好了,话不多说,我们直接进入正题。
二、基础知识/背景铺垫
2.1 核心概念定义
为了避免大家在后续的讨论中产生概念混淆,我们先把这篇文章中涉及到的几个最核心的概念定义清楚。
2.1.1 RPA(Robotic Process Automation,机器人流程自动化)
RPA是一种基于UI模拟的、非侵入式的、无代码/低代码的软件自动化技术。它通过模拟人的鼠标点击、键盘输入、屏幕识别、文件读写等操作,来执行预先定义好的「脚本」或「流程」,从而实现不同系统之间的数据流转和业务流程的自动化。
通俗理解: RPA就像一个「只会按菜谱做菜的厨师」——你必须把每一个步骤(比如先切菜、再放油、再放菜、再放盐、盐放多少克、火开多大、炒多长时间)都写得清清楚楚、明明白白,它才能做出菜来。如果菜谱写错了一个字(比如把「盐放5克」写成了「糖放5克」),或者厨房里的食材/工具变了(比如原来的炒锅坏了,换成了一个不同尺寸的),它就完全不会做了。
2.1.2 AI Agent(人工智能代理/智能体)
AI Agent是一种具有感知能力、推理能力、决策能力、行动能力、学习能力的自主软件实体。它可以通过传感器(比如API接口、摄像头、麦克风、文本输入框等)感知周围的环境(比如用户的提问、系统的状态、外部的数据等),然后根据自身的目标(比如「回答用户的问题」、「解决用户的售后问题」、「优化供应链的库存」等),利用大语言模型(LLM)、知识图谱(KG)、机器学习(ML)等技术进行推理和决策,最后通过执行器(比如API接口、UI模拟工具、邮件发送工具、短信发送工具等)采取行动,改变周围的环境,并根据行动的结果进行学习和优化。
通俗理解: AI Agent就像一个「会思考能应对的专业厨师」——你只需要告诉它你想吃什么(比如「我想吃一盘清淡的、健康的、适合夏天吃的菜」),它就会根据你的口味偏好(从之前和你的交流中学习到的)、厨房里现有的食材(通过「感知」食材柜得到的)、当前的季节和天气(通过「感知」外部API得到的),自己制定菜谱,自己选择食材,自己调整火候和调料,做出一道符合你要求的菜来。如果厨房里的食材不够,它还会主动建议你换一种食材,或者去附近的超市买。如果这次做的菜你不满意,它还会根据你的反馈进行学习和优化,下次做的菜会更好。
2.1.3 AI Agent Harness(人工智能代理 harness/ harness系统)
「Harness」这个词在英文中有「马具、挽具、控制、利用」的意思。AI Agent Harness就是一种用于「控制、协调、管理、监控、扩展」多个AI Agent的系统框架或平台。它就像一个「马车夫」或者「乐团指挥」,负责把不同角色、不同能力的AI Agent组织起来,让它们协同工作,完成一个复杂的、单一Agent无法完成的任务。
通俗理解: 单一的AI Agent就像一个「只会做一道菜的专业厨师」,而AI Agent Harness就像一个「餐厅的后厨管理系统」——它会根据顾客的订单(复杂任务),把任务拆分成多个子任务(比如洗菜、切菜、炒菜、配菜、传菜),然后把每个子任务分配给最合适的AI Agent(比如洗菜工Agent、切菜工Agent、专业厨师Agent、配菜工Agent、传菜员Agent),协调它们之间的工作顺序和数据流转,监控它们的工作状态,处理它们遇到的问题,最后把所有子任务的结果整合起来,交给顾客。
2.1.4 AI Agent Harness Engineering(人工智能代理 harness工程)
AI Agent Harness Engineering就是一种用于「设计、开发、部署、维护、优化」AI Agent Harness系统的工程学科。它涉及到多个领域的知识,比如大语言模型(LLM)、知识图谱(KG)、机器学习(ML)、软件工程(SE)、人机交互(HCI)、业务流程管理(BPM)等。
2.2 AI Agent Harness的核心架构与核心要素组成
在深入对比RPA和AI Agent Harness Engineering之前,我们先来看一下AI Agent Harness的核心架构和核心要素组成——这能帮助我们更好地理解AI Agent Harness Engineering的本质。
2.2.1 AI Agent Harness的核心架构(通用版)
根据我多年的开发经验和对业界主流AI Agent Harness框架(比如LangGraph、AutoGPT、CrewAI、AgentRunner等)的研究,我总结出了一个通用的AI Agent Harness核心架构,如下图所示(使用Mermaid架构图绘制):
(LLM + KG + RAG)]::: -----------------------^ Expecting 'SQE', 'DOUBLECIRCLEEND', 'PE', '-)', 'STADIUMEND', 'SUBROUTINEEND', 'PIPE', 'CYLINDEREND', 'DIAMOND_STOP', 'TAGEND', 'TRAPEND', 'INVTRAPEND', 'UNICODE_TEXT', 'TEXT', 'TAGSTART', got 'PS'
这个通用架构可以分为六个核心层:
- 用户层(User Layer): 负责与用户进行交互,接收用户提交的复杂任务/问题,返回最终结果/状态。
- Harness核心层(Harness Core Layer): 这是整个AI Agent Harness系统的「大脑」和「心脏」,负责任务拆分、意图识别、子任务分配、Agent选择、任务编排、异常处理、结果整合等核心功能。
- Agent内部层(Agent Internal Layer): 每个AI Agent都有自己的内部层,负责感知环境、推理决策、执行行动、学习优化等核心功能。
- 工具层(Tool Layer): 提供AI Agent可以调用的外部工具,比如API接口、UI模拟工具、邮件发送工具、短信发送工具、文件读写工具、数据处理工具等。
- 环境层(Environment Layer): 指AI Agent所处的外部环境,比如用户、电商平台、物流系统、库存系统、SAP系统、外部数据源等。
- 存储层(Storage Layer): 负责存储整个AI Agent Harness系统的各种数据,比如任务状态、用户会话、共享上下文、Agent信息、工具信息、知识图谱、RAG知识库、推理模型、决策策略等。
2.2.2 AI Agent Harness的核心要素组成
除了核心架构之外,AI Agent Harness还有八个核心要素:
- 目标(Goal): AI Agent Harness系统的最终目标,比如「解决用户的所有售后问题」、「优化供应链的库存周转率」、「提高财务报销的效率和准确率」等。
- Agent(智能体): 具有感知能力、推理能力、决策能力、行动能力、学习能力的自主软件实体。
- 任务(Task): 可以分为「复杂任务」和「子任务」——复杂任务是用户提交的、单一Agent无法完成的任务,子任务是从复杂任务中拆分出来的、单一Agent可以完成的任务。
- 上下文(Context): 指任务执行过程中需要用到的所有信息,比如用户的历史聊天记录、用户的个人信息、任务的执行状态、其他Agent的执行结果、外部系统的状态等。
- 工具(Tool): AI Agent可以调用的外部资源,用于执行特定的行动。
- 知识(Knowledge): AI Agent进行推理和决策的基础,包括「静态知识」(比如知识图谱、公司的规章制度、产品的说明书等)和「动态知识」(比如用户的反馈、任务的执行结果、外部的实时数据等)。
- 反馈(Feedback): 指环境对AI Agent行动的响应,分为「正反馈」(比如用户对Agent的回答满意)和「负反馈」(比如用户对Agent的回答不满意,或者Agent的行动失败)。
- 学习(Learning): AI Agent根据反馈优化自身的推理模型、更新知识库、调整决策策略的过程。
2.3 RPA与AI Agent Harness的核心概念对比(核心属性维度)
为了让大家更直观地理解RPA和AI Agent Harness的本质区别,我制作了一个核心属性维度对比的Markdown表格:
| 核心属性维度 | RPA(机器人流程自动化) | AI Agent Harness(人工智能代理 harness系统) |
|---|---|---|
| 核心驱动 | 预先写好的「脚本」或「流程」(Rule-Based) | 大语言模型(LLM)+ 知识图谱(KG)+ 检索增强生成(RAG)+ 规则(Hybrid: AI-First + Rule-Backed) |
| 感知能力 | 仅能感知「结构化的UI元素」或「结构化的文件」 | 能感知「结构化的UI元素/文件」、「非结构化的文本/图片/音频/视频」、「外部的实时数据」、「用户的情绪/意图」等 |
| 推理能力 | 无(只能按照脚本执行,不能进行任何逻辑推理) | 强(能进行语义理解、意图识别、逻辑推理、归纳总结、联想预测等) |
| 决策能力 | 无(只能按照脚本选择预设的分支,不能进行任何自主决策) | 强(能根据目标、上下文、知识自主制定行动计划、选择工具、处理例外情况) |
| 行动能力 | 仅能执行「模拟鼠标点击/键盘输入/屏幕识别/文件读写」等UI操作 | 既能执行UI操作(可以调用RPA工具),也能执行「API调用/邮件发送/短信发送/数据处理/生成报告」等非UI操作 |
| 学习能力 | 无(脚本不会自动更新,必须人工修改) | 强(能根据用户的反馈、任务的执行结果、外部的实时数据自动优化推理模型、更新知识库、调整决策策略) |
| 应变能力 | 极弱(UI元素稍微变化、业务规则稍微变化、数据格式稍微变化就会「罢工」) | 极强(能应对UI元素变化、业务规则变化、数据格式变化、例外情况等各种不确定性) |
| 处理的数据类型 | 仅能处理「结构化数据」(比如Excel表格、数据库表格、CSV文件等) | 既能处理「结构化数据」,也能处理「非结构化数据」(比如用户的聊天记录、邮件、合同文本、产品图片、视频等) |
| 处理的流程类型 | 仅能处理「线性的、标准化的、没有例外情况的」简单流程 | 既能处理「线性的、标准化的、没有例外情况的」简单流程,也能处理「非线性的、碎片化的、有大量例外情况的」复杂流程 |
| 开发方式 | 无代码/低代码(拖拽式开发,不需要写代码) | 低代码/高代码(可以用LangChain、AutoGPT等框架进行低代码开发,也可以根据需求进行高代码定制) |
| 部署方式 | 本地部署/云端部署 | 本地部署/云端部署/边缘部署 |
| 维护成本 | 极高(需要大量的人工维护脚本,一旦UI/规则/数据变化就必须修改脚本) | 较低(只需要维护Agent的目标、知识、工具,脚本会自动优化和更新) |
| 适用场景 | 标准化的、基于UI的、没有例外情况的、数据格式固定的重复性工作 | 非标准化的、需要理解语义的、需要处理例外情况的、需要主动决策的、数据格式不固定的复杂工作 |
| 初始投入成本 | 较低(无代码/低代码工具价格相对便宜,开发周期短) | 较高(需要购买LLM的API调用服务、搭建知识图谱/RAG知识库、训练Agent,开发周期相对较长) |
| 长期投入成本 | 极高(维护成本随着UI/规则/数据的变化呈指数级增长) | 较低(维护成本相对稳定,甚至会随着Agent学习能力的提升而降低) |
| ROI(投资回报率) | 短期高,长期低(适用于短期的、静态的业务场景) | 短期低,长期高(适用于长期的、动态的业务场景) |
2.4 RPA与AI Agent Harness的概念联系与交互关系(Mermaid架构图)
虽然RPA和AI Agent Harness有很多本质区别,但它们并不是「非此即彼」的关系,而是「有机结合」的关系——AI Agent Harness可以把RPA作为一个「工具」来调用,从而发挥两者的优势:RPA负责处理「标准化的、基于UI的、没有例外情况的」重复性工作,AI Agent Harness负责处理「非标准化的、需要理解语义的、需要处理例外情况的、需要主动决策的」复杂工作。
下面是一个RPA与AI Agent Harness的概念联系与交互关系的Mermaid架构图:
(比如:处理本月所有跨区域退货的退款申请 -----------------------^ Expecting 'SQE', 'DOUBLECIRCLEEND', 'PE', '-)', 'STADIUMEND', 'SUBROUTINEEND', 'PIPE', 'CYLINDEREND', 'DIAMOND_STOP', 'TAGEND', 'TRAPEND', 'INVTRAPEND', 'UNICODE_TEXT', 'TEXT', 'TAGSTART', got 'PS'
三、核心内容/实战演练:四个实际场景的详细对比与应用案例
在这一部分,我们将通过电商客服、财务报销、供应链管理、医疗诊断等四个不同的实际场景,来详细对比RPA和AI Agent Harness的应用效果,并给出每个场景下的具体应用案例。
3.1 场景一:电商客服
3.1.1 问题背景
随着电商行业的快速发展,电商平台的用户数量和订单数量都在呈指数级增长,随之而来的是用户的咨询量和客诉量也在呈指数级增长。传统的人工客服模式已经无法满足用户的需求——人工客服的成本高、效率低、响应时间长、服务质量参差不齐,而且很难24小时不间断工作。
3.1.2 问题描述
某头部零售电商平台(以下简称「A电商」)的日均用户咨询量为100万笔,日均客诉量为5万笔。其中,80%的用户咨询量是标准化的、重复性的问题(比如「如何退换货?」、「我的优惠券怎么用不了?」、「我的包裹什么时候到?」等),20%的用户咨询量是非标准化的、需要处理例外情况的问题(比如「我买的商品和图片不一样,能不能给我换一个更贵的?」、「我错过了退换货的时间,但是商品有质量问题,能不能帮我申请特殊退换货?」等);70%的客诉量是标准化的、重复性的问题(比如「包裹丢失了,怎么赔偿?」、「退款什么时候到账?」等),30%的客诉量是非标准化的、需要协调多个部门的问题(比如「我买的商品在运输过程中损坏了,我要求退款+赔偿+上门取件,能不能帮我协调一下?」等)。
A电商最初尝试用传统的IVR(交互式语音应答)系统和基于关键词匹配的聊天机器人来解决这个问题,但效果非常差——IVR系统的操作复杂,用户体验不好;基于关键词匹配的聊天机器人只能回答标准化的、预设的问题,一旦用户的提问稍微改变一下措辞(比如把「如何退换货?」改成「我想把这个商品退掉,应该怎么做?」),它就回答不了了,只能转人工客服,转人工率高达**90%**以上。
后来,A电商又尝试用RPA工具来辅助人工客服——RPA机器人可以自动去第三方物流平台查包裹轨迹、自动去库存系统查替代商品、自动录入客诉信息到CRM系统等。这确实提高了人工客服的效率,但并没有解决根本问题——80%的标准化咨询量和70%的标准化客诉量仍然需要人工客服来处理,转人工率仍然高达**60%**以上,而且RPA机器人非常脆弱,一旦第三方物流平台或库存系统的UI稍微变化一下,它就会「罢工」。
最后,A电商决定尝试用AI Agent Harness Engineering搭建一个「电商智能客服Agent Harness系统」——结果如何呢?我们接着往下看。
3.1.3 RPA解决方案的详细分析
首先,我们来看一下A电商最初用RPA工具辅助人工客服的详细解决方案:
3.1.3.1 RPA解决方案的架构
3.1.3.2 RPA解决方案的核心功能
- 基于关键词匹配的聊天机器人: 回答标准化的、预设的问题(比如「如何退换货?」、「我的优惠券怎么用不了?」等)
- RPA查件机器人: 自动去第三方物流平台查包裹轨迹
- RPA查库存机器人: 自动去库存系统查替代商品
- RPA录入客诉机器人: 自动录入客诉信息到CRM系统
3.1.3.3 RPA解决方案的优点
- 提高了人工客服的效率: 人工客服不需要自己去查包裹轨迹、查库存、录入客诉信息,节省了大量的时间
- 初始投入成本较低: 无代码/低代码RPA工具价格相对便宜,开发周期短(大概2-3个月就能完成)
3.1.3.4 RPA解决方案的缺点
- 转人工率仍然很高: 基于关键词匹配的聊天机器人只能回答标准化的、预设的问题,转人工率仍然高达**60%**以上
- RPA机器人非常脆弱: 一旦第三方物流平台或库存系统的UI稍微变化一下(比如把「包裹轨迹查询」按钮的位置移动一下,或者把「订单号」输入框的ID改变一下),RPA机器人就会「罢工」,需要人工修改脚本
- 无法处理非标准化的问题: 对于非标准化的、需要处理例外情况的、需要协调多个部门的问题,RPA机器人完全无法处理,只能靠人工客服
- 无法主动决策: RPA机器人只能按照人预先写好的脚本执行,不能主动发现问题、主动分析问题、主动解决问题
- 维护成本极高: 需要大量的人工维护脚本,据A电商统计,他们每月需要花费10万元以上的人力成本来维护RPA机器人的脚本
- 无法学习和优化: RPA机器人的脚本不会自动更新,必须人工修改
3.1.3.5 RPA解决方案的应用效果(数据统计)
A电商用RPA工具辅助人工客服运行了6个月,得到了以下数据统计:
| 指标 | 应用RPA之前 | 应用RPA之后 |
|---|---|---|
| 日均人工客服接待量 | 100万笔 | 60万笔 |
| 转人工率 | 90% | 60% |
| 平均响应时间 | 15分钟 | 10分钟 |
| 平均解决时间 | 30分钟 | 20分钟 |
| 用户满意度(CSAT) | 3.5分(满分5分) | 3.8分(满分5分) |
| 每月人力成本 | 50万元 | 40万元(人工客服成本30万元 + RPA维护成本10万元) |
| 每月RPA工具成本 | 0 | 5万元 |
| 每月总成本 | 50万元 | 45万元 |
从数据统计来看,应用RPA之后,A电商的日均人工客服接待量、转人工率、平均响应时间、平均解决时间都有了一定的改善,用户满意度也有了一定的提升,每月总成本也有了一定的降低——但改善的幅度并不大,并没有解决根本问题。
3.1.4 AI Agent Harness解决方案的详细分析
接下来,我们来看一下A电商后来用AI Agent Harness Engineering搭建的「电商智能客服Agent Harness系统」的详细解决方案:
3.1.4.1 项目介绍
本项目的目标是搭建一个24小时不间断工作、能处理80%以上的标准化咨询量、能处理50%以上的非标准化咨询量、能处理70%以上的标准化客诉量、能处理30%以上的非标准化客诉量、转人工率低于30%、用户满意度(CSAT)高于4.5分的「电商智能客服Agent Harness系统」。
3.1.4.2 环境安装
在正式开发之前,我们需要先安装好以下环境和工具:
- Python 3.10+: 本项目的开发语言
- LangChain 0.1.0+: 本项目的核心框架,用于构建AI Agent和AI Agent Harness
- LangGraph 0.0.20+: LangChain的子框架,用于构建复杂的AI Agent Harness(任务编排、状态管理、异常处理等)
- OpenAI API / 阿里云通义千问API / 百度文心一言API: 本项目的大语言模型(LLM),用于语义理解、意图识别、逻辑推理、归纳总结、联想预测等
- ChromaDB / FAISS / Pinecone: 本项目的向量数据库,用于构建RAG知识库
- Streamlit 1.30.0+: 本项目的前端框架,用于构建用户交互界面
- Docker / Docker Compose: 本项目的容器化工具,用于部署系统
- UiPath / Automation Anywhere / Blue Prism(可选): 本项目的RPA工具,用于处理基于UI的重复性工作(比如录入客诉信息到SAP系统)
下面是一个简单的环境安装命令示例(以OpenAI API、ChromaDB、Streamlit为例):
# 1. 创建虚拟环境
python -m venv ai_agent_harness_env
# 2. 激活虚拟环境
# Windows:
ai_agent_harness_env\Scripts\activate
# Mac/Linux:
source ai_agent_harness_env/bin/activate
# 3. 升级pip
pip install --upgrade pip
# 4. 安装依赖包
pip install langchain langchain-openai langchain-chroma langgraph streamlit python-dotenv
# 5. 创建.env文件,配置API密钥
touch .env
# 编辑.env文件,添加以下内容:
# OPENAI_API_KEY=your_openai_api_key_here
# LANGCHAIN_TRACING_V2=true
# LANGCHAIN_API_KEY=your_langchain_api_key_here(可选,用于LangChain追踪)
3.1.4.3 系统功能设计
根据A电商的需求,我们将「电商智能客服Agent Harness系统」的功能分为六个核心模块:
- 用户交互模块: 负责与用户进行交互,接收用户提交的咨询/客诉,返回最终结果/状态
- 意图识别与任务拆分模块: 负责理解用户的意图,将复杂的咨询/客诉拆分成多个子任务
- Agent注册与选择模块: 负责管理所有可用的AI Agent,根据子任务的类型选择最合适的AI Agent
- 任务编排与状态管理模块: 负责编排子任务的执行顺序,管理子任务的执行状态和共享上下文
- 异常处理与人工干预模块: 负责处理AI Agent执行子任务过程中遇到的异常,触发人工干预
- 结果整合与反馈模块: 负责整合所有子任务的结果,返回给用户;同时收集用户的反馈,用于优化AI Agent的性能
同时,我们还设计了六个不同角色的AI Agent:
- 前台接待Agent(Front Desk Agent): 负责第一时间接待用户,理解用户的意图,将咨询/客诉转交给对应的专业Agent;同时回答一些非常简单的、不需要调用外部工具的问题(比如「你们的客服电话是多少?」、「你们的营业时间是多少?」等)
- 退换货咨询Agent(Return & Refund Agent): 负责处理用户的退换货咨询和退换货申请;需要调用电商平台的退换货规则知识库、订单系统、库存系统等外部工具
- 优惠券咨询Agent(Coupon Agent): 负责处理用户的优惠券咨询和优惠券使用问题;需要调用电商平台的优惠券规则知识库、订单系统、用户系统等外部工具
- 物流查询Agent(Logistics Agent): 负责处理用户的物流查询问题;需要调用第三方物流平台的API接口
- 客诉处理Agent(Complaint Agent): 负责处理用户的客诉问题;需要调用电商平台的客诉规则知识库、订单系统、物流系统、库存系统、CRM系统等外部工具;对于标准化的客诉问题,可以自动处理;对于非标准化的、需要协调多个部门的客诉问题,可以协调多个专业Agent一起处理,或者触发人工干预
- 售后协调Agent(After-Sales Coordinator Agent): 负责协调多个专业Agent一起处理复杂的售后问题;比如协调物流查询Agent查包裹轨迹、协调退换货咨询Agent处理退换货申请、协调客诉处理Agent处理客诉问题等
3.1.4.4 系统架构设计
本项目的系统架构采用了分层架构设计,分为用户层、前端层、API层、Harness核心层、Agent层、工具层、存储层、环境层,如下图所示(使用Mermaid架构图绘制):
(Web/App/微信公众号)| Fro -----------------------^ Expecting 'SQE', 'DOUBLECIRCLEEND', 'PE', '-)', 'STADIUMEND', 'SUBROUTINEEND', 'PIPE', 'CYLINDEREND', 'DIAMOND_STOP', 'TAGEND', 'TRAPEND', 'INVTRAPEND', 'UNICODE_TEXT', 'TEXT', 'TAGSTART', got 'PS'
更多推荐




所有评论(0)