logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【GUI-Agent】阶跃星辰 GUI-MCP 解读---(5)---命令解析和工具映射

25年底,阶跃星辰升级发布了全新的AI Agent系列模型Step-GUI,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议:GUI-MCP(Graphical User Interface - Model Context Protocol),这是首个专为图形用户界面自动化而设计的 MCP 实现,兼顾标准化与隐私保护。因此,我们就来解读这个MCP协议,顺便看看端侧Agent的实

#microsoft#人工智能#机器学习
【GUI-Agent】阶跃星辰 GUI-MCP 解读---(5)---命令解析和工具映射

25年底,阶跃星辰升级发布了全新的AI Agent系列模型Step-GUI,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议:GUI-MCP(Graphical User Interface - Model Context Protocol),这是首个专为图形用户界面自动化而设计的 MCP 实现,兼顾标准化与隐私保护。因此,我们就来解读这个MCP协议,顺便看看端侧Agent的实

#microsoft#人工智能#机器学习
【GUI-Agent】阶跃星辰 GUI-MCP 解读---(4)---GUI-MCP 整体架构

25年底,阶跃星辰升级发布了全新的AI Agent系列模型Step-GUI,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议:GUI-MCP(Graphical User Interface - Model Context Protocol),这是首个专为图形用户界面自动化而设计的 MCP 实现,兼顾标准化与隐私保护。因此,我们就来解读这个MCP协议,顺便看看端侧Agent的实

#架构#人工智能
AI Agent 框架探秘:拆解 OpenHands(4)--- 服务

本篇结合官方文档进行解读OpenHands的服务器,这是OpenHands系统的立身基础。因为本系列借鉴的文章过多,可能在参考文献中有遗漏的文章,如果有,还请大家指出。

#人工智能#语言模型#服务器
AI Agent框架探秘:拆解 OpenHands(12)--- Function call

“会说话的只是ChatBot,会调工具做事的才叫Agent”。大模型本质上是一个文本生成器,它不能直接操作系统、调用 API、访问数据库。所有这些能力都需要额外的工程实现。Agent 工具使用模式是突破大语言模型(LLM)固有局限、实现 Agent 与现实世界交互的核心架构范式,其本质是让 LLM 从单纯的文本生成器转变为具备感知、推理和行动能力的智能体,核心依托 ReAct 循环中模型对工具调用

#人工智能#microsoft
AI Agent框架探秘:拆解 OpenHands(1)--- 核心理念

掌握Agent的底层逻辑,不仅是熟练使用的基础,更是设计、评估和扩展的关键。对于产品经理、人工智能工程师和技术决策者来说,只有深入理解Agent的技术蓝图,才能在AI应用的落地过程中做出精准布局,抓住未来的机遇。构建一个实用的AI Agent需要哪些核心技术模块的支持?这些核心模块如何协同工作,形成完整的任务执行闭环?AI Agent系统在落地过程中会面临哪些关键挑战,OpenHands如何解决这

#人工智能
AI Agent 框架探秘:拆解 OpenHands(13)--- Memory

大模型正在从生成工具演化为具有长期交互能力的智能体,这对“记忆能力”提出了更高的要求,因为大模型的 “记忆能力”,决定了它能走多远,从单轮问答到多轮协作,从通用助手到垂直 Agent,核心都是 “能否记住关键信息、锚定核心目标”——只有记忆突破,AI才能“持续陪伴”,这是增加用户黏性的必然。构建持久化、结构化、可检索的 Agent 记忆系统,成为解决上述问题、支撑复杂任务执行的关键,它记录 Age

#人工智能
AI Agent 框架探秘:拆解 OpenHands(2)--- CodeAct论文

综上,ReAct 作为早期 Agent 的核心范式,在 单一任务、短任务链、弱约束 的场景中依然有价值,但作为企业级、跨域、强约束 Agent 系统的基础架构时,其局限性已经是结构性的,而不是简单通过加强提示词或增加工具种类就能弥补的问题。CodeAct 的核心洞见在于,与其让智能体(Agent)扮演 “文书” 角色生成静态指令,不如使其成为 “程序员”—— 直接生成可执行的 Python 代码,

#人工智能
【GUI-Agent】阶跃星辰 GUI-MCP 解读---(1)---论文

25年底,阶跃星辰升级发布了全新的AI Agent系列模型Step-GUI,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议:GUI-MCP(Graphical User Interface - Model Context Protocol),这是首个专为图形用户界面自动化而设计的 MCP 实现,兼顾标准化与隐私保护。GitHub仓库技术论文GUI-MCP 提供一套标准化、跨平

#人工智能#机器学习
AI Agent 框架探秘:拆解 OpenHands(5)--- 交互&会话

有意义的多轮对话要求智能体能够理解上下文。就像人类一样,智能体需要记住对话历史:已经说过和做过什么,以保持连贯性并避免重复。以下是OpenHands Applications的示例图,本篇就来看看会话和交互如何进行。因为本系列借鉴的文章过多,可能在参考文献中有遗漏的文章,如果有,还请大家指出。WebSession 是一个 Web 服务器绑定的会话包装器,负责管理单个 Web 客户端连接并协调 Ag

#交互#网络#人工智能 +1
    共 106 条
  • 1
  • 2
  • 3
  • 11
  • 请选择