《AI不是魔法》

写给软件工程师的AI工程课

第七堂:AI Agent到底是什么?

这一篇适合谁:

如果你好奇Agent为什么突然火了、想知道它和普通AI到底有什么区别、以及它凭什么能自己干活——那么这一篇值得看完。

上一堂课,我们知道:

MCP不是工具,它是AI连接工具的统一插座。

这一堂课,我们继续回答:

为什么LLM突然从“问一句答一句”,变成了自己规划任务?

老板说:“帮我安排一场会议,周二下午3点,张总、李总、王总参加。”

没有Agent时:

你:帮我安排一场会议。
AI:好的,请提供参会人员、时间和议题。
你:周二下午3点,张总、李总、王总。
AI:好的,我建议您使用日历工具手动创建。

每一步都要你指挥。AI像个刚入职的实习生,什么都要问。

有Agent时:

你:帮我安排一场会议,周二下午3点,张总、李总、王总。
AI:(调用日历API查张总日程)张总周二下午有空。
(调用日历API查李总日程)李总3点到4点有会。
(调用日历API查王总日程)王总全天有空。
分析:李总3点有冲突,建议改到4点半。
你:行。
AI:(调用会议室预定API)已预定会议室A。
(发送邀请)已发送邀请给三位。

同一个任务,同一个AI。区别在于:前者等你指挥每一步,后者自己规划、自己执行、自己判断。

这,就是Agent带来的变化。

一、为什么普通LLM每回答一次,就结束了?

前六篇我们一直在讲一件事:LLM的本质,是在预测下一个Token。

它每一次收到输入,做一次预测,输出一个回答,然后结束。

用户提问 → LLM → 预测(Prediction) → Answer → 结束

它不会自己继续。它不会说:“等等,我还需要查个资料。”它不会说:“刚才的结果不对劲,我再试一次。”

为什么?因为它没有被设计成“继续”。它的设计是一次交互,一次预测,一次结束。

所以,你让它安排会议,它只能告诉你“建议使用日历工具手动创建”。它知道该怎么做,但它不会自己开始做。

普通LLM的问题,从来不是不知道下一步,而是它没有机会进行下一次预测(Prediction)。

二、Agent的本质:持续更新Context的循环

Agent和普通AI的唯一区别,就是多了两个字:循环。

普通AI:

输入 → Context → Prediction → Answer(单次,结束)

Agent:

输入 → Context → Prediction → Action → Result → Context更新 → Prediction → Action → Result → Context更新 → …… → 完成

配合一张图:

Context
    ↓
Prediction
    ↓
Action
    ↓
Result
    ↓
Context Update
    ↺

Agent不是一种新的智能。它只是让Prediction可以不断继续发生。

注意看:这个循环里,没有出现任何新能力。查资料用的是RAG,调工具用的是Function Calling,连接工具用的是MCP——全都是前六篇已经讲过的东西。

Agent不是突然冒出来的,而是前面几项能力成熟后的自然组合:LLM更强了,RAG能补充知识了,Function Calling能调用工具了,MCP让工具连接更稳定了。零件凑齐后,循环才跑得起来。

RAG负责查知识,Function Calling负责调工具,MCP负责统一连接,而Agent负责决定下一步该用谁。

三、一个真实的工程案例

一个开发团队用Agent处理CI失败。

以前,CI失败了,开发同学要手动做这些事:

  1. 登录CI平台查看失败日志

  2. 分析日志,定位问题

  3. 如果是配置文件问题,修改yaml

  4. 重新提交部署

  5. 验证是否通过

  6. 如果还失败,继续排查

每一步都要人来做。

接入Agent后:

CI失败通知 → Agent收到
    ↓
Agent读取CI日志(调用CI工具)
    ↓
Agent分析日志:发现是Kubernetes配置文件中的image tag写错了
    ↓
Agent生成yaml修复方案
    ↓
Agent创建Merge Request,提交修复代码
    ↓
人工Review,确认无误后合并
    ↓
合并后自动重新部署
    ↓
Agent验证部署状态(调用监控工具)
    ↓
部署成功
    ↓
Agent通知Slack:“CI已修复,部署成功,变更已合并。”

Agent没有真正“理解”CI。它只是不断获得新的Context,不断产生新的Prediction,直到任务完成。

一个一分钟思维实验

想象你有一个非常聪明的实习生。他什么都知道,什么工具都会用。

但你每次都要告诉他:先做A,再做B,再做C。

有一天,你试着说了一句:“把这个CI失败修好。”

他自己想了想:先读日志,再定位问题,再修改配置,再提交MR,再验证结果。

从“你指挥每一步”到“你只给目标”,这就是Agent带来的变化。

工程师容易踩的坑

🚫 错误做法:
让Agent直接执行高风险操作(删除数据、修改生产配置、批量发消息),不加人工确认。

为什么错:
Agent可能错误理解意图,或者在循环中做出意想不到的操作。没有人工确认环节,可能导致严重事故。

✅ 正确做法:
为Agent设置“人工确认节点”——在执行关键操作前,暂停并询问用户确认。同时设置最大循环次数,防止Agent陷入死循环。

今天记住这一句话

Agent不是一种新的智能。它只是让Prediction可以不断继续发生。

如果今天只带走一个观点,那就是:Agent没有让LLM变聪明。它只是让LLM拥有了继续预测的机会。

系列世界观升级

走到第七篇,整本书的世界观完成了一次重要升级。

以前:

用户 → Context → Prediction → Answer

现在:

用户 → Context → Prediction → Action → Result → Context更新 → Prediction → Action → Result → Context更新 → …… → 完成

Loop不是一种能力,而是一种运行方式。

前六篇建立的是“Context → Prediction”,第七篇升级到了“Context → Prediction → Loop”。

你会发现:Agent没有任何新能力。它只是把第五篇的Function Calling、第六篇的MCP,放进了一个能够不断循环运行的系统。

很多人觉得Agent出现以后,AI拥有了自主意识。其实不是。

AI没有开始思考。它只是开始不断预测。

到这里,我们终于可以回答一个问题:为什么AI越来越聪明?

很多人认为是因为模型越来越大。但工程师真正使用AI以后会发现:

AI越来越聪明,不只是因为模型越来越强,更因为它能够不断获得新的Context,并持续进行Prediction。

Prompt、RAG、Function Calling、MCP、Agent,从来不是五种AI能力。

它们只是让Prediction能够持续发生的五种方式。

下一篇预告:

Agent已经能够不断循环完成任务了。

但随着任务越来越复杂,一个新的问题开始出现:

它需要记住过去,需要管理任务,需要协调工具,还需要处理越来越多的工作。

当这些能力不断叠加,你会发现:

AI开始越来越不像一个聊天机器人,而越来越像一个操作系统。

下一篇,我们聊:AI为什么越来越像操作系统?

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐