https://qclaw.qq.com/?channel=5004&trafficsource=109877&bd_vid=16260801159315855388

1,WorkBuddy下载:

https://qclaw.qq.com/?channel=5004&trafficsource=109877&bd_vid=16260801159315855388

可通过配置飞书对话框操作本地的workBuddy,从而远程操作本地环境。

例如:在本地编写简单的html文件, 本质是通过powershell将命令写入文件实现。

2,实现ReAct Agent 

迭代过程:

观察-->思考(分析并思考下一步)-->行动(执行工具调用)-->再观察....-->最终输出

3,agent分类
        产品维度:

                通用型: 任务发散,边界模糊的全能型,例如:Manus openclaw。

                垂直型: 深耕细分场景的领域专家,聚焦单一业务流,例如: cursor 企业内部自动财务报销审计系统。

        架构维度:

                workflow-工作流编排 :企业中有明确流程的工作流,按照预定执行路径严格执行,杜绝大模型幻觉偏离既定流程, 适用场景:金融打款,订单审批等。

                agentic-智能体自驱: 底层ReAct等框架为核心,仅提供目标不预设步骤,大模型自主规划调用与评估, 缺点是黑盒状态,易陷入死循环或token消耗, 适用场景: 研发辅助,不适合接入核心代码。

        开发方式:

                1,基于LLMops的可视化开发--平台级

                例如: Coze Dify FastGPT

                特点: 声明式编排,托拉拽,适合敏捷验证MVP与非核心业务上线, 其中Dify私有化部署是解决中小企业数据隐私的主流方案。

                2,基于框架的代码开发--工程级

                例如: spring AI Alibaba LangChain4j

                特点: 编程式调用,定义Function Calling接口,在代码中对接公司内部系统。

4,spring AI Alibaba+graph+alibaba agent framework

基本底座+任务编排+智能体架构

自定义智能体架构缺点:

代码流程臃肿,缺乏自主决策,流程控制还是通过java代码, 大模型只是被动调用工具,跨项目跨流程跨类调用麻烦。

Spring alibaba agent framwork:

现成组件直接使用-->reactagent API-->自定义智能体+智能体编排对象, 例如顺序编排,并行,路由等编排模式,并提供拦截器对智能体前后进行增强 ,比如流程的流转放到上hooks中执行。

Alibaba Graph:

1,state状态:在node与edge之间传递数据,整个agent上下文传递数据的载体,具体实现上是一个map。

2,node节点:执行具体逻辑的单元,接收state作为输入,执行某些操作对接LLM。

3,边edge:定义一个node到下一个node的连接,也可以通过状态条件判断决定执行方向。

function call:

 解决如何通过大模型调用自己业务系统的方法。

MCP:

调用第三方平台接口, 提供统一协议,解决多个tool在多个ai应用中不能共享的问题,是应用层的协议, 需要大模型支持function call, 将MCP调用返回的数据交由大模型调用。

skills:

1,解决和LLM交互中提示词大量,占用token和上下文的问题。

2,通过md文件提供标准:是什么 什么时候调 怎么调 执行脚本等内容, 在function call中将md中描述先发给LLM, LLM通过分析返回调用信息, 调用skill中对应方法的具体执行内容,进一步提高共享效率。

3,通过自定义的skill和alibaba agent框架提供的系统操作tools, 操作本地环境的资源, 从而实现简易openclaw。

例如: 文件读写, 浏览器操作等tools

集成IM:

将本地实现部署外网, 在飞书配置回调地址,即可实现远程操作

更多推荐