从零理解AI Agent：极简框架MiniAgent的设计哲学与实战应用

AI Agent作为人工智能领域的关键技术，其核心在于让大型语言模型（LLM）具备自主思考和行动的能力。其工作原理基于经典的ReAct（推理与行动）循环，通过观察、思考、行动、反思的迭代过程完成任务。这项技术的价值在于将LLM从单纯的内容生成器升级为能够操作工具、执行复杂工作流的智能体，极大地提升了自动化水平。在实际应用场景中，AI Agent可广泛应用于代码生成、数据分析、自动化办公等多个领域。

长野君

198人浏览 · 2026-04-24 09:41:13

长野君 · 2026-04-24 09:41:13 发布

1. 项目概述：一个极简主义的AI Agent框架

最近在折腾AI Agent，发现市面上的框架要么是“全家桶”式的大而全，动辄几十上百个依赖，源码读起来像天书；要么就是封装得太好，把工具调用、上下文管理这些核心逻辑藏得严严实实，想学点东西都无从下手。作为一个喜欢刨根问底的开发者，我总觉得，如果连自己用的工具是怎么工作的都搞不明白，那用起来心里也不踏实。

于是，我动手搓了一个叫 MiniAgent 的东西。它的核心目标就一个： 做一本最好的AI Agent教科书 。整个框架的核心引擎，就一个 agent.py 文件，不到500行代码，把LLM循环、工具调用、上下文管理这些核心逻辑写得清清楚楚。你不仅能用它快速搭建一个功能强大的命令行AI助手，具备类似Claude Code的编程能力和Manus的系统操控能力，更重要的是，你能通过阅读这区区几百行代码，彻底搞懂一个AI Agent到底是怎么“思考”和“行动”的。

这个项目特别适合两类人：一是想快速拥有一个私人AI编程/办公助手的实用派，二是想深入理解Agent工作原理、甚至自己动手魔改的学习派。它没有魔法，只有清晰的逻辑和极简的设计。

2. 设计哲学：为什么“简单”反而更强大？

在开始动手之前，我想先聊聊MiniAgent背后的设计哲学。这决定了它和LangChain、AutoGPT这些“巨无霸”框架的根本区别。

2.1 核心思想：LLM是思考者，不是执行者

很多复杂的Agent框架试图教会LLM使用成百上千个专用工具：截图工具、鼠标控制工具、文件压缩工具等等。这带来两个问题：一是工具库膨胀，维护成本高；二是LLM需要学习大量工具的具体用法，容易“幻觉”或调用错误。

MiniAgent走了另一条路： 只给LLM最核心、最通用的工具，把复杂任务的“组合”权交还给LLM本身。 我们的工具箱里，代码操作靠 read / write / edit / bash ，系统操控靠 bash 和几个关键OS工具（如 open_browser ）。听起来很少，对吧？但这就是精髓。

举个例子，你需要让AI帮你截屏。在其他框架里，你可能需要调用一个专门的 screenshot() 工具。但在MiniAgent里，LLM会自己“思考”并组合出解决方案：

bash: python -c "from mss import mss; mss().shot(output='screenshot.png')"

它知道要用 bash 工具执行Python命令，知道Python里有个 mss 库可以截图。 这本质上是在利用LLM强大的代码生成和知识检索能力，而不是试图把它训练成一个“工具调用专家”。 我们需要的是一个能“思考”的助手，而不是一个只会按按钮的机器人。

2.2 实现路径：透明化与可学习性

基于上述思想，MiniAgent在实现上坚持两个原则：

透明化 ：所有核心逻辑，从接收用户输入，到调用LLM，到解析工具调用，再到执行并返回结果，整个过程在一个文件里线性展开，没有复杂的继承和抽象层。你甚至可以直接在 agent.py 里加打印语句，一步步跟踪Agent的“心路历程”。
可学习性 ：框架提供了 双模式工具调用 。默认的“文本解析模式”下，LLM的思考过程（包括它决定调用哪个工具、参数是什么）会以结构化的文本形式完整输出。这就像给LLM的思维过程开了个“上帝视角”，是理解Agent决策逻辑的绝佳教材。当你对原理了然于胸后，可以切换到更稳定、高效的“原生Function Calling模式”。

这种设计让MiniAgent在“可用”和“可学”之间找到了一个完美的平衡点。你用它来干活，它很高效；你想学它怎么干活，它毫无保留。

3. 从零开始：环境搭建与核心配置

理论说再多，不如动手跑一遍。我们这就把MiniAgent运行起来。

3.1 基础环境准备

首先，确保你的系统有Python 3.8或更高版本。然后，克隆项目并安装依赖：

git clone https://github.com/ZhuLinsen/MiniAgent.git
cd MiniAgent
pip install -r requirements.txt
pip install -e .

这里有个小细节： pip install -e . 这个命令是以“可编辑模式”安装当前目录的包。这样做的好处是，你之后直接修改项目里的任何Python文件（比如 agent.py ），修改会立刻生效，无需重新安装。对于学习和魔改来说，这个操作非常方便。

注意：安装过程如果遇到网络问题，可以尝试使用国内的PyPI镜像源，例如 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple 。依赖包不多，主要是 openai 、 rich 、 python-docx 等，安装很快。

3.2 模型配置：连接你的LLM大脑

MiniAgent本身没有绑定任何特定的LLM，它通过兼容OpenAI的API接口与模型通信。这意味着你可以使用DeepSeek、GPT、Claude（如果提供兼容API）、智谱GLM等任何模型。

配置的核心是创建一个 .env 文件：

cp .env.example .env

然后编辑 .env 文件，填入你的API信息。以使用DeepSeek为例：

LLM_API_KEY=sk-your-deepseek-api-key-here
LLM_MODEL=deepseek-chat
LLM_API_BASE=https://api.deepseek.com/v1

如果你使用OpenAI的GPT，配置类似：

LLM_API_KEY=sk-your-openai-api-key-here
LLM_MODEL=gpt-4o-mini
LLM_API_BASE=https://api.openai.com/v1 # 此项通常可省略，除非你用代理

实操心得 ： .env 文件是管理敏感配置的最佳实践，千万不要把API Key硬编码在代码里。另外，首次运行前，务必确认你的API Key有足够的余额或权限，并且网络能正常访问对应的API地址。如果遇到连接超时，可能需要检查网络环境或代理设置。

3.3 首次运行与验证

配置完成后，在终端直接输入 miniagent 即可启动交互式命令行界面。

miniagent

如果一切正常，你会看到一个漂亮的、带有提示符的界面。试着输入一句简单的问候，比如“你好”，看看LLM是否能正常回复。

此时，你可以进行一个简单的功能测试，验证核心工具是否工作：

you: 帮我创建一个名为 test.txt 的文件，内容写“Hello MiniAgent”

如果看到类似 ● write test.txt (1 lines) 这样的工具调用记录，并且文件成功创建，那么恭喜你，MiniAgent已经成功运行起来了！

4. 核心引擎深度解析：agent.py 是如何工作的？

作为MiniAgent的“大脑”， agent.py 文件值得逐行研读。我们来拆解它的核心工作流程。

4.1 主循环：观察、思考、行动、反思

MiniAgent的核心是一个经典的ReAct（Reasoning and Acting）循环，但实现极其简洁。主要逻辑在 MiniAgent.run 方法中，可以概括为以下几步：

观察（Observe） ：将用户的问题（或上一轮工具执行的结果）与历史对话记录（上下文）组合，形成当前发送给LLM的“提示”（prompt）。
思考（Think） ：调用LLM API，获取模型的回复。在“文本模式”下，我们期望LLM的回复是结构化的文本，其中明确包含了它想调用的工具名称和参数。
行动（Act） ：解析LLM的回复。如果发现工具调用指令（例如 ● tool_name(arg1="value") ），则从已注册的工具集中找到对应工具，传入参数并执行。
反思（Reflect） ：将工具执行的结果（成功或失败）作为新的“观察”，反馈给LLM，开启下一轮循环。直到LLM认为任务完成，输出最终答案。

这个循环在代码中就是一个 while 循环，配合对LLM回复的解析逻辑。它的美妙之处在于，你可以在任何一步插入日志或调试代码，亲眼看到Agent是如何一步步推进任务的。

4.2 工具调用的双模式实现

这是MiniAgent教学价值的核心体现。

模式一：文本解析模式（默认） 在这个模式下，我们给LLM的Prompt里会详细说明输出格式，例如要求它用 ● tool_name(key=value) 这样的格式来指示工具调用。LLM回复后， agent.py 里会用正则表达式去匹配和解析这行文本。

# 简化后的解析逻辑示意
import re
tool_call_pattern = r"●\s*(\w+)\((.*?)\)"
match = re.search(tool_call_pattern, llm_response)
if match:
    tool_name = match.group(1)
    # 进一步解析参数部分 (如 arg1="value", arg2=123)
    # ...
    result = self._execute_tool(tool_name, parsed_args)

这种方式 完全透明 。你在聊天界面里能看到LLM“说”出了 ● write(file="hello.py", content="print('Hello')") ，然后框架再执行它。这就像老师在黑板上一步步板书解题过程。

模式二：原生Function Calling模式 当你使用 agent.run(prompt, mode="native") 时，框架会利用OpenAI API原生的 tools 参数。在请求LLM时，我们会把工具列表（每个工具的名称、描述、参数schema）一并发送过去。LLM会在内部进行理解，并以特定的JSON格式返回它想要调用的工具信息。这种方式更可靠，支持并行工具调用，且不依赖LLM严格遵守特定的文本格式，但过程对用户是“黑盒”的。

为什么保留文本模式？ 因为它是最好的调试和学习工具。当你的Agent行为不符合预期时，看看LLM在文本模式下“想”调用什么工具、参数对不对，能瞬间定位问题：是Prompt没写清楚？还是LLM理解有误？或者是工具描述不够准确？

4.3 上下文管理与记忆

Agent需要记住之前的对话和工具调用结果。MiniAgent采用了一种轻量但有效的记忆方式。

对话历史 ：一个简单的列表，轮流存储用户消息和AI的回复（包含工具调用和最终回答）。
上下文窗口 ：LLM有token限制。当历史对话太长时， agent.py 会触发压缩逻辑。它并不是简单粗暴地丢弃最早的消息，而是会尝试调用LLM，对之前的对话进行总结，然后用总结来替代旧的历史，从而在有限的token内保留核心信息。
会话持久化 ：虽然当前版本的 memory.py 比较简单，但你可以很容易地扩展它，将会话保存到文件或数据库，实现跨对话的记忆。

5. 工具箱详解：如何用有限的工具实现无限的可能？

MiniAgent内置的工具分为几大类，但正如其哲学，工具不在于多，而在于精和通用。

5.1 代码工具集：程序员的瑞士军刀

这是MiniAgent作为“Coding Assistant”的基石，全部在 tools/code_tools.py 中。

read(file_path) ：读取文件内容。简单，但关键是处理了各种编码和文件不存在的异常。
write(file_path, content) ：创建或覆盖文件。这里有个 重要细节 ：它会自动确保目标目录存在（ os.makedirs ），并且默认使用 utf-8 编码。这在处理多级目录下的文件创建时非常省心。
edit(file_path, start_line, end_line, new_content) ：这是个“杀手级”工具。它允许LLM精确地修改文件的某几行，而不是重写整个文件。实现原理是读取文件，替换指定行号范围内的内容，再写回。这对于修改大型配置文件或代码文件中的几行错误极其高效。
grep(pattern, file_path) ：在文件中搜索文本。支持简单的字符串匹配，对于代码检索足够用。
glob(pattern) ：使用通配符查找文件。例如， glob("*.py") 列出所有Python文件。
bash(command, timeout=30) ： 最强大的工具，没有之一 。它允许执行任何Shell命令。 timeout 参数至关重要，可以防止某些命令长时间挂起。执行后，它会返回命令的 stdout 、 stderr 和返回码。

安全警告 ： bash 工具能力强大，也意味着风险。MiniAgent内置了一个简单的危险命令拦截列表（如 rm -rf / , format C: 等），并在执行前要求用户确认。但在实际使用中，尤其是将Agent开放给他人时， 务必仔细审查并扩充这个黑名单 ，或者考虑在沙箱环境中运行。

5.2 系统与办公工具：连接数字世界

这些工具在 tools/basic_tools.py ，让Agent能与我们日常使用的软件交互。

open_browser(url) ：用系统默认浏览器打开网页。如果传入的不是URL而是普通文本，它会自动拼接成Google搜索的URL。实现就是调用 webbrowser.open() 。
open_app(app_name) ：启动本地应用。在Windows上，它利用 os.startfile 或 subprocess.Popen ；在macOS/Linux上，则尝试用 xdg-open 或直接调用程序名。
create_docx(content, title, file_path) ：使用 python-docx 库创建格式化的Word文档。LLM可以指定标题和段落内容。
clipboard_copy(text) / clipboard_read() ：读写系统剪贴板。依赖 pyperclip 库。这个工具在整合工作流时很好用，比如让Agent把生成的一段代码复制到剪贴板，你直接去IDE里粘贴。

5.3 其他实用工具

calculator(expression) ：一个安全的数学计算器。它使用Python的 ast.literal_eval 来安全地求值数学表达式，避免了直接使用 eval() 的安全风险。
web_search(query) ：需要配置搜索引擎API（如Serper API）才能使用。它演示了如何集成网络搜索能力。
http_request(method, url, **kwargs) ：一个通用的HTTP请求工具，可以发送GET、POST等请求，处理JSON数据。这是连接外部Web服务的桥梁。

工具扩展的核心 ：所有工具都通过 @register_tool 装饰器注册。这个装饰器主要做两件事：1. 收集工具的元信息（名字、描述、参数schema）；2. 将其加入全局工具库。你想加新工具？模仿现有工具写个函数，加上装饰器，然后在Agent初始化后 load_builtin_tool 即可。

6. 高级特性应用：Skill、MCP与编排器

掌握了核心，我们就可以玩点更花的了。MiniAgent提供了一些高级特性，让单个Agent变身“团队”。

6.1 Skill系统：为Agent赋予专业角色

Skill的本质是一组预配置：一个定制的System Prompt（角色设定） + 一个工具白名单 + 一些模型参数（如temperature）。

from miniagent import MiniAgent

agent = MiniAgent()
agent.load_all_tools() # 加载所有工具
agent.load_skill("coder") # 加载“程序员”技能

加载 coder skill后，Agent的System Prompt会变成“你是一个专注于编写、分析和调试代码的专家…”，并且只能使用 read , write , edit , bash 等代码相关工具。这相当于给通用的Agent大脑戴上了一顶“程序员”的帽子，让它更专注于代码任务，减少无关的“幻觉”。

你可以很容易地创建自己的Skill。在 skills.py 里，仿照已有的格式，定义一个新的 Skill 对象，然后 register_skill 即可。比如，定义一个“数据分析师”Skill，Prompt强调处理CSV、绘图，工具白名单只放 read , bash (用来运行pandas脚本), glob 。

6.2 连接MCP：接入庞大的工具生态

MCP（Model Context Protocol）是由Anthropic提出的一种协议，它让LLM可以安全、标准化地使用外部工具（服务器）。MiniAgent内置了一个MCP客户端。

假设你有一个提供了“数据库查询”工具的MCP服务器在运行，你可以这样连接：

from miniagent.extensions.mcp_client import load_mcp_tools

mcp_tools = load_mcp_tools("npx -y @modelcontextprotocol/server-postgres postgresql://user:pass@localhost/db")
for tool in mcp_tools:
    agent.add_tool(tool)

之后，你的Agent就能直接使用“查询用户表”这样的工具了。这意味着MiniAgent的能力边界可以被无限扩展，你可以利用社区里已有的各种MCP服务器（操作文件系统、管理数据库、发送邮件等），而无需自己从头编写工具。

6.3 多Agent编排：让专业的人做专业的事

对于复杂任务，比如“研究一下WebSocket，写一个Demo，然后测试它的性能”，让一个Agent干所有事可能效率不高。 Orchestrator （编排器）可以自动将任务分解，并分配给不同的专业Agent（基于Skill）去执行。

from miniagent import Orchestrator

orch = Orchestrator(model="deepseek-chat", api_key="...")
result = orch.run("研究Python异步编程，写一个爬虫demo，并给出优化建议")

幕后发生了什么？

规划：Orchestrator自己也是一个LLM，它先分析任务，将其分解为“研究”、“编码”、“评审”等子任务。
分配：为每个子任务创建或指定一个具有相应Skill的Worker Agent（例如， researcher , coder , reviewer ）。
执行与协调 ：按顺序或并行地执行这些子任务，将上一个任务的结果作为下一个任务的输入。
汇总：收集所有结果，合成最终答案。

这模拟了一个小团队的协作流程，非常适合处理涉及多领域知识的复杂项目。

7. 实战演练：用MiniAgent自动化日常任务

光说不练假把式。我们来看几个具体的例子，感受一下MiniAgent如何融入工作流。

7.1 场景一：自动化代码重构助手

假设你有一个旧的Python脚本，想把它从使用 requests 库同步调用改为使用 aiohttp 异步调用。

你可以对MiniAgent说 ： “请帮我分析当前目录下的 old_script.py 文件，将其中的 requests.get 和 requests.post 调用改为使用 aiohttp 的异步方式，并考虑添加适当的 async/await 和错误处理。将修改后的内容保存为 new_async_script.py 。”

Agent可能会执行以下步骤 ：

使用 read(“old_script.py”) 读取文件。
（在内部思考如何重构）。
使用 write(“new_async_script.py”, content=...) 直接写出新文件。或者，为了更谨慎，它可能先用 write 生成一个草稿，再用 edit 进行多次精细调整。
最后，它可能还会用 bash(“python -m py_compile new_async_script.py”) 来检查语法是否正确。

在这个过程中，你可以通过文本模式观察它每一步的决策，如果觉得它某次修改不合理，可以及时中断并给出更明确的指令。

7.2 场景二：数据报告生成流水线

你需要定期从某个API拉取JSON数据，分析后生成一份Word报告。

你可以编写一个脚本，用程序调用MiniAgent ：

from miniagent import MiniAgent
import json

agent = MiniAgent()
agent.load_skill(“data_analyst”) # 假设你自定义了这个Skill

# 1. 获取数据
with open(“data.json”, “r”) as f:
    data = json.load(f)

# 2. 给Agent布置任务
task = f”””请分析以下JSON数据，总结出关键指标，并生成一份格式清晰的Word报告。
数据：{data}
报告需要包含概述、主要发现和结论。将报告保存为‘weekly_report.docx’。
“””
result = agent.run(task)
print(“报告生成完成！”)

Agent会调用 calculator 计算一些统计值，用 create_docx 生成Word文件，甚至可能用 clipboard_copy 把关键结论复制出来。

7.3 场景三：个人学习与研究伙伴

你想学习一个新的技术概念，比如“Rust中的所有权系统”。

you: 帮我搜索一下Rust所有权(ownership)的概念，找三篇中文博客，把核心观点总结到一个markdown文件里。

Agent会：

使用 web_search （如果配置了）或 open_browser 打开浏览器让你手动搜索（取决于工具可用性）。
在你告知它找到了哪些页面后，它可能会尝试用 bash 调用 curl 或 pandoc 来抓取和转换网页内容（这需要系统有相应命令）。
最后，使用 write 生成总结的 rust_ownership_summary.md 文件。

避坑技巧 ：对于需要联网获取信息的任务， web_search 工具通常更可靠，因为它返回的是结构化的文本摘要。而依赖 bash 和 curl 进行网页抓取，很容易因为网站结构变化或反爬机制而失败。建议将这类任务分解：让Agent指导你手动搜索和复制关键文本到剪贴板，然后让它分析剪贴板内容。

8. 常见问题与故障排查实录

在实际使用中，你肯定会遇到各种问题。这里记录了一些典型情况和解决思路。

8.1 Agent行为异常或“幻觉”

症状：Agent不调用工具，而是空想；或者调用了错误的工具和参数。
排查步骤 ：
1. 开启文本模式 ：这是最重要的调试手段。在初始化Agent时或运行时指定 mode=“text” ，查看LLM完整的、未解析的回复。看看它到底“想”干什么。
2. 检查Prompt ：System Prompt是否清晰定义了角色和工具使用规范？用户提问是否足够明确？尝试将问题描述得更具体、更步骤化。
3. 检查工具描述 ： @register_tool 装饰器里的函数文档字符串（docstring）是LLM理解工具功能的唯一依据。确保描述准确、参数意义清晰。可以参考现有工具的写法。
4. 降低Temperature ：在 MiniAgent 初始化或 load_skill 时，尝试设置 temperature=0.1 或更低，让LLM的输出更确定、更少“天马行空”。

8.2 工具执行失败

症状：Agent正确调用了工具，但工具执行报错（如文件不存在、命令执行失败）。
排查步骤 ：
1. 查看错误信息 ：MiniAgent会将工具执行的异常信息返回给LLM，并显示在界面上。仔细阅读这些错误信息。
2. 权限问题 ： bash 命令或文件操作是否涉及没有权限的目录？Agent以你的用户权限运行。
3. 环境依赖 ：工具依赖的第三方库是否已安装？例如 create_docx 需要 python-docx ， clipboard_copy 需要 pyperclip 。确保 requirements.txt 中的包都已正确安装。
4. 路径问题 ：文件路径是相对路径还是绝对路径？Agent的当前工作目录（CWD）是什么？在复杂任务中，最好使用绝对路径，或者先用 bash(“pwd”) 确认当前目录。

8.3 API连接与网络问题

症状：启动时卡住，或提示API错误、超时。
排查步骤 ：
1. 验证API Key和Base URL ：确认 .env 文件中的 LLM_API_KEY 和 LLM_API_BASE 完全正确，没有多余的空格或换行。
2. 测试网络连通性 ：在终端用 curl 命令测试是否能访问API地址。例如： curl https://api.deepseek.com/v1/chat/completions -H “Authorization: Bearer YOUR_KEY” -H “Content-Type: application/json” -d ‘{“model”:“deepseek-chat”,“messages”:[{“role”:“user”,“content”:“hi”}]}’ 。如果失败，检查网络或代理设置。
3. 检查模型名称 ：确保 LLM_MODEL 的值是API提供商支持的确切模型名，例如 deepseek-chat 而不是 deepseek 。
4. 查看详细日志 ：初始化Agent时，可以设置更详细的日志级别，或者直接修改 agent.py ，在发送API请求和接收响应的地方添加 print 语句，查看原始请求和响应。

8.4 性能优化与成本控制

上下文过长 ：长时间对话后，响应变慢，甚至API报错（token超限）。
- 解决方案 ：MiniAgent有自动上下文总结功能。你也可以主动在合适的时机（如一个任务完成后）告诉Agent“请总结一下我们刚才关于XX的讨论”，或者直接开始一个新会话。
API调用成本 ：频繁使用会产生费用。
- 解决方案 ：对于简单的、确定性的任务（如文件操作），考虑直接写脚本。将Agent用于真正需要“智能”和“决策”的环节。也可以考虑使用更经济的模型（如DeepSeek）进行日常对话和编码，仅在需要极高推理能力时切换更强大的模型。

9. 扩展与魔改：打造属于你自己的超级助手

MiniAgent的极简架构使得扩展变得异常容易。这里提供几个方向。

9.1 添加一个自定义工具

假设你想添加一个“发送邮件”的工具。

在 tools/ 目录下新建一个文件 email_tools.py （或添加到现有文件）。
编写工具函数，并用 @register_tool 装饰。

from miniagent.tools import register_tool
import smtplib
from email.mime.text import MIMEText

@register_tool
def send_email(to: str, subject: str, body: str) -> str:
    “””
    发送电子邮件。
    Args:
        to: 收件人邮箱地址。
        subject: 邮件主题。
        body: 邮件正文内容。
    “””
    # 这里需要配置你的SMTP服务器信息（建议从环境变量读取）
    msg = MIMEText(body)
    msg[‘Subject’] = subject
    msg[‘From’] = ‘your_email@example.com’
    msg[‘To’] = to
    # ... 连接SMTP服务器并发送
    return f“邮件已发送至 {to}”

为了让Agent能使用它，你需要在创建Agent后手动加载：

from miniagent.tools.email_tools import send_email # 假设工具放在这里
agent = MiniAgent()
agent.add_tool(send_email) # 直接添加函数对象

或者，更规范的做法是修改 tools/__init__.py ，将你的新工具模块导入，并加入到 __all__ 列表中，这样就能通过 agent.load_all_tools() 一键加载了。

9.2 修改Agent的核心行为

想改变工具调用的解析逻辑？或者想增加一个工具调用前的确认环节？直接去改 agent.py ！

修改解析器 ：找到 _parse_tool_call 方法（文本模式）或处理native function call的部分，按你的需求调整正则表达式或JSON解析逻辑。
增加安全钩子 ：在 _execute_tool 方法里，可以在真正执行工具前，插入一段代码，对特定工具或参数进行二次确认或安全检查。
改变记忆策略 ：修改 memory.py 中的 Memory 类，比如实现一个基于向量数据库的长期记忆，或者改变上下文总结的策略。

因为代码结构清晰，这些修改通常都能在很短时间内完成并验证。

9.3 集成到其他系统

MiniAgent的 MiniAgent 类本身就是一个Python对象，你可以轻松地将它集成到你的Web应用、自动化脚本或桌面程序中。

from miniagent import MiniAgent

class MyAutomationSystem:
    def __init__(self):
        self.agent = MiniAgent()
        self.agent.load_skill(“coder”)

    def handle_code_review_request(self, code_snippet):
        prompt = f”请审查以下Python代码，指出潜在bug和改进建议：\n{code_snippet}”
        result = self.agent.run(prompt)
        return result.final_output

system = MyAutomationSystem()
feedback = system.handle_code_review_request(“def foo(x): return x * 2”)
print(feedback)

你可以把它做成一个Flask/FastAPI的HTTP服务，一个VS Code插件，或者一个计划任务中的自动代码审查机器人。可能性只受你的想象力限制。

经过这一番从原理到实战的拆解，相信你已经不仅会使用MiniAgent，更理解了它每一行代码背后的意图。这个项目的价值远不止于其提供的功能，更在于它像一份清晰的蓝图，展示了AI Agent技术的核心部件是如何精巧地组装在一起的。我鼓励你在使用过程中，多去阅读 agent.py ，多尝试修改和扩展它。只有亲手拆解和重组过，你才能真正宣称自己掌握了这项技术。