AI Agent到底是什么?——为什么AI突然从“回答问题”变成“主动做事”?
《AI不是魔法》
写给软件工程师的AI工程课
第七堂:AI Agent到底是什么?
这一篇适合谁:
如果你好奇Agent为什么突然火了、想知道它和普通AI到底有什么区别、以及它凭什么能自己干活——那么这一篇值得看完。
上一堂课,我们知道:
MCP不是工具,它是AI连接工具的统一插座。
这一堂课,我们继续回答:
为什么LLM突然从“问一句答一句”,变成了自己规划任务?
老板说:“帮我安排一场会议,周二下午3点,张总、李总、王总参加。”
没有Agent时:
你:帮我安排一场会议。
AI:好的,请提供参会人员、时间和议题。
你:周二下午3点,张总、李总、王总。
AI:好的,我建议您使用日历工具手动创建。
每一步都要你指挥。AI像个刚入职的实习生,什么都要问。
有Agent时:
你:帮我安排一场会议,周二下午3点,张总、李总、王总。
AI:(调用日历API查张总日程)张总周二下午有空。
(调用日历API查李总日程)李总3点到4点有会。
(调用日历API查王总日程)王总全天有空。
分析:李总3点有冲突,建议改到4点半。
你:行。
AI:(调用会议室预定API)已预定会议室A。
(发送邀请)已发送邀请给三位。
同一个任务,同一个AI。区别在于:前者等你指挥每一步,后者自己规划、自己执行、自己判断。
这,就是Agent带来的变化。
一、为什么普通LLM每回答一次,就结束了?
前六篇我们一直在讲一件事:LLM的本质,是在预测下一个Token。
它每一次收到输入,做一次预测,输出一个回答,然后结束。
用户提问 → LLM → 预测(Prediction) → Answer → 结束
它不会自己继续。它不会说:“等等,我还需要查个资料。”它不会说:“刚才的结果不对劲,我再试一次。”
为什么?因为它没有被设计成“继续”。它的设计是一次交互,一次预测,一次结束。
所以,你让它安排会议,它只能告诉你“建议使用日历工具手动创建”。它知道该怎么做,但它不会自己开始做。
普通LLM的问题,从来不是不知道下一步,而是它没有机会进行下一次预测(Prediction)。
二、Agent的本质:持续更新Context的循环
Agent和普通AI的唯一区别,就是多了两个字:循环。
普通AI:
输入 → Context → Prediction → Answer(单次,结束)
Agent:
输入 → Context → Prediction → Action → Result → Context更新 → Prediction → Action → Result → Context更新 → …… → 完成
配合一张图:
Context
↓
Prediction
↓
Action
↓
Result
↓
Context Update
↺
Agent不是一种新的智能。它只是让Prediction可以不断继续发生。
注意看:这个循环里,没有出现任何新能力。查资料用的是RAG,调工具用的是Function Calling,连接工具用的是MCP——全都是前六篇已经讲过的东西。
Agent不是突然冒出来的,而是前面几项能力成熟后的自然组合:LLM更强了,RAG能补充知识了,Function Calling能调用工具了,MCP让工具连接更稳定了。零件凑齐后,循环才跑得起来。
RAG负责查知识,Function Calling负责调工具,MCP负责统一连接,而Agent负责决定下一步该用谁。
三、一个真实的工程案例
一个开发团队用Agent处理CI失败。
以前,CI失败了,开发同学要手动做这些事:
-
登录CI平台查看失败日志
-
分析日志,定位问题
-
如果是配置文件问题,修改yaml
-
重新提交部署
-
验证是否通过
-
如果还失败,继续排查
每一步都要人来做。
接入Agent后:
CI失败通知 → Agent收到
↓
Agent读取CI日志(调用CI工具)
↓
Agent分析日志:发现是Kubernetes配置文件中的image tag写错了
↓
Agent生成yaml修复方案
↓
Agent创建Merge Request,提交修复代码
↓
人工Review,确认无误后合并
↓
合并后自动重新部署
↓
Agent验证部署状态(调用监控工具)
↓
部署成功
↓
Agent通知Slack:“CI已修复,部署成功,变更已合并。”
Agent没有真正“理解”CI。它只是不断获得新的Context,不断产生新的Prediction,直到任务完成。
一个一分钟思维实验
想象你有一个非常聪明的实习生。他什么都知道,什么工具都会用。
但你每次都要告诉他:先做A,再做B,再做C。
有一天,你试着说了一句:“把这个CI失败修好。”
他自己想了想:先读日志,再定位问题,再修改配置,再提交MR,再验证结果。
从“你指挥每一步”到“你只给目标”,这就是Agent带来的变化。
工程师容易踩的坑
🚫 错误做法:
让Agent直接执行高风险操作(删除数据、修改生产配置、批量发消息),不加人工确认。
为什么错:
Agent可能错误理解意图,或者在循环中做出意想不到的操作。没有人工确认环节,可能导致严重事故。
✅ 正确做法:
为Agent设置“人工确认节点”——在执行关键操作前,暂停并询问用户确认。同时设置最大循环次数,防止Agent陷入死循环。
今天记住这一句话
Agent不是一种新的智能。它只是让Prediction可以不断继续发生。
如果今天只带走一个观点,那就是:Agent没有让LLM变聪明。它只是让LLM拥有了继续预测的机会。
系列世界观升级
走到第七篇,整本书的世界观完成了一次重要升级。
以前:
用户 → Context → Prediction → Answer
现在:
用户 → Context → Prediction → Action → Result → Context更新 → Prediction → Action → Result → Context更新 → …… → 完成
Loop不是一种能力,而是一种运行方式。
前六篇建立的是“Context → Prediction”,第七篇升级到了“Context → Prediction → Loop”。
你会发现:Agent没有任何新能力。它只是把第五篇的Function Calling、第六篇的MCP,放进了一个能够不断循环运行的系统。
很多人觉得Agent出现以后,AI拥有了自主意识。其实不是。
AI没有开始思考。它只是开始不断预测。
到这里,我们终于可以回答一个问题:为什么AI越来越聪明?
很多人认为是因为模型越来越大。但工程师真正使用AI以后会发现:
AI越来越聪明,不只是因为模型越来越强,更因为它能够不断获得新的Context,并持续进行Prediction。
Prompt、RAG、Function Calling、MCP、Agent,从来不是五种AI能力。
它们只是让Prediction能够持续发生的五种方式。
下一篇预告:
Agent已经能够不断循环完成任务了。
但随着任务越来越复杂,一个新的问题开始出现:
它需要记住过去,需要管理任务,需要协调工具,还需要处理越来越多的工作。
当这些能力不断叠加,你会发现:
AI开始越来越不像一个聊天机器人,而越来越像一个操作系统。
下一篇,我们聊:AI为什么越来越像操作系统?
更多推荐

所有评论(0)