logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MetaGPT详解:用 Agent 团队重新定义软件开发

MetaGPT是一个创新的多Agent框架,通过模拟软件公司的工作流程实现自动化软件开发。它将真实团队角色映射到AI Agent(如产品经理、架构师等),每个Agent继承自Role基类,具有明确的目标、能力和约束。系统采用三种工作模式(响应式、顺序执行、规划后执行)和发布-订阅消息机制,通过Message类实现Agent间高效通信,包含自然语言和结构化数据双重表示。

#人工智能#python#自然语言处理 +4
深度解析 Open-AutoGLM:让 AI 自己操作手机的技术实现

Open-AutoGLM:AI自主操作手机的视觉语言模型框架 摘要: Open-AutoGLM是智谱AI开源的基于多模态大模型的手机智能助理框架,支持通过自然语言指令实现手机自动化操作。该系统结合视觉理解(屏幕截图分析)和语言模型推理,采用AutoGLM-9B特化模型,支持50+主流中文应用的跨操作。技术架构包含ADB控制层、多模态模型推理层和任务规划层,通过坐标归一化、动作指令标准化等技术实现精

#人工智能#python#计算机视觉 +3
MetaGPT详解:用 Agent 团队重新定义软件开发

MetaGPT是一个创新的多Agent框架,通过模拟软件公司的工作流程实现自动化软件开发。它将真实团队角色映射到AI Agent(如产品经理、架构师等),每个Agent继承自Role基类,具有明确的目标、能力和约束。系统采用三种工作模式(响应式、顺序执行、规划后执行)和发布-订阅消息机制,通过Message类实现Agent间高效通信,包含自然语言和结构化数据双重表示。

#人工智能#python#自然语言处理 +4
深度解析 Open-AutoGLM:让 AI 自己操作手机的技术实现

Open-AutoGLM:AI自主操作手机的视觉语言模型框架 摘要: Open-AutoGLM是智谱AI开源的基于多模态大模型的手机智能助理框架,支持通过自然语言指令实现手机自动化操作。该系统结合视觉理解(屏幕截图分析)和语言模型推理,采用AutoGLM-9B特化模型,支持50+主流中文应用的跨操作。技术架构包含ADB控制层、多模态模型推理层和任务规划层,通过坐标归一化、动作指令标准化等技术实现精

#人工智能#python#计算机视觉 +3
到底了