agent学习笔记

以灰桦

44人浏览 · 2026-06-21 22:00:31

以灰桦 · 2026-06-21 22:00:31 发布

摘要：本周主要学习了AI智能体（Agent）的核心概念、核心特性与运行逻辑，同时深入研究了智能体主流的ReAct行动框架。明确了AI Agent具备自主感知、决策、执行的闭环智能能力，区别于传统被动交互AI；掌握了ReAct框架推理与行动协同的核心原理，熟悉其“观察-推理-行动-循环迭代”的完整运行流程，理解该框架能够有效解决大模型静态推理局限性，助力智能体自主完成复杂多步骤任务。

abstract：This week, we mainly studied the core concepts, core characteristics and operation logic of AI Agent, and deeply explored the mainstream ReAct action framework of agents. It is clarified that AI Agent has the closed-loop intelligent capabilities of autonomous perception, decision-making and execution, which is different from traditional passive interactive AI. The core principle of the ReAct framework integrating reasoning and action is mastered, and the complete operation process of "observation-reasoning-action-iterative cycle" is familiarized. This framework can effectively solve the limitations of static reasoning of large models and help agents independently complete complex multi-step tasks.

一、agent智能体介绍

AI智能体（AI Agent）是依托大语言模型驱动，具备独立环境感知、自主决策、主动执行任务及迭代优化能力的智能实体，是区别于传统对话AI的新一代人工智能形态。与传统仅能被动应答的聊天机器人不同，AI Agent构建了“感知-规划-执行-反馈”的完整运行闭环，无需人工实时干预即可独立拆解复杂目标、调用各类工具、处理任务流程。其核心特性包含自主性、反应性、主动性、协作性与学习适应性，能够实时响应环境变化、主动推进任务落地，并可根据执行反馈持续优化决策策略，广泛适用于智能办公、自动化任务处理、智能问答、场景化服务等各类人工智能应用场景，是当前大模型落地实用场景的核心技术载体。

二、agent流的ReAct行动框架

ReAct（Reasoning + Acting）行动框架是2022年由普林斯顿大学与谷歌团队提出的AI Agent主流运行框架，核心核心是融合大模型推理能力与外部行动执行能力，打破传统大模型仅依赖静态知识推理的局限，解决单一推理无法对接真实环境、信息滞后、任务落地性差等问题。该框架摒弃了AI单纯思考或单纯执行的单一模式，通过观察、推理、行动、迭代反馈的循环机制，模拟人类思考做事的逻辑，让智能体在任务执行过程中动态感知环境信息、实时推理决策、落地具体行动，并根据行动结果修正策略，逐步趋近并完成最终任务目标，是目前轻量化、高适配的智能体任务执行框架。

ReAct框架核心运行流程：

1. 观察（Observation）：智能体接收用户任务目标、读取当前环境状态、获取工具返回结果或历史执行反馈，收集全部有效信息，为后续推理提供数据支撑；

2. 推理（Reasoning）：大模型基于观察到的信息，分析当前任务进度、梳理信息缺口、拆解下一步执行步骤，制定合理的行动策略，明确需要调用的工具或执行的具体操作；

3. 行动（Action）：智能体根据推理结论执行具体动作，包括调用搜索、数据库查询、代码运行、API调用等外部工具，落地可执行的任务操作；

4. 迭代判断：完成单次行动后，智能体重新感知环境与执行结果，判断任务是否完成。若未达成目标，重复“观察-推理-行动”循环；若任务完成，输出最终结果并终止流程。

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

如何衡量 AI Agent Harness Engineering 的投资回报率

AI Agent Harness Engineering（简称Harness工程）是面向AI Agent全生命周期的通用底座工程，类比于传统软件工程的DevOps平台，为所有Agent应用提供标准化的开发、测试、部署、运行、管控、安全、可观测能力，是支撑多Agent规模化落地的核心基础设施。这里必须明确边界划分，这是后续ROI计算的前提：通用底座的研发人力成本（架构设计、开发、测试）底座本身的云资

龙虾开发者社区

AI Agent Harness Engineering 技术选型误区：为什么越先进的技术越难落地？

2024年3月，OpenAI在GPT-4 Turbo开发者大会上发布了，新增了“深度Agent工具链（Deep Agent Toolchains）”、“Stateful GPTs（有状态自定义Agent）”、“多Agent协作网络（Multi-Agent Swarm Lite）”三个核心功能；几乎同一时间，斯坦福HAI团队开源了（企业版AutoGen可视化开发平台），字节跳动火山引擎推出了，阿里云

龙虾开发者社区

低代码开发 AI Agent Harness Engineering：Coze_Dify 平台的高级玩法与局限性

AI Agent（人工智能代理）是指能够感知环境、做出决策并执行动作的智能系统。与传统的单次调用大模型不同，AI Agent 具备记忆能力工具使用能力和规划能力。AgentLLMMemoryToolsPlanningAgentLLMMemoryToolsPlanning: 作为 Agent 的“大脑”，负责理解、推理和生成内容。Memory (记忆)