收藏 | AI Agent 学习路线:从小白到能交付的大模型实践指南
本文基于 Datawhale 开源项目 Agent-Learning-Hub,为想从调用大模型 API 走到能做出可靠 Agent 项目的学习者提供学习路线。文章强调 Agent 的核心在于观察、选择动作、调用工具、检查结果并在出错时拉回,而非追名逐利。学习重点应放在工程本身,如 agent loop、工具调用、RAG、记忆、harness、skills、协议、评测和安全。文章拆解了从最小 Agent Loop 到多 Agent 协作,再到技能封装和浏览器操作 Agent 的完整学习路线,并提供了 90 天学习安排和常见坑的避坑指南,旨在帮助学习者稳扎稳打,最终交付一个真实可用的 Agent 项目。

本文基于 Datawhale 开源项目 Agent-Learning-Hub 整理。
适合想从“会调用大模型 API”,走到“能做出一个可靠 Agent 项目”的学习者。
最近学 AI Agent 的人很多,但真正卡住的地方往往不是“资料太少”,而是“资料太多”。
今天看到 LangGraph,明天看到 CrewAI,后天又刷到 AutoGen、MCP、A2A、Browser Agent、Coding Agent。收藏夹越来越厚,项目却还是没有跑起来。
如果你也有这种感觉,先别急着补框架。
学 Agent 最重要的不是追名词,而是先搞清楚一件事:
一个 Agent 到底怎样观察问题、选择动作、调用工具、检查结果,并在出错时把事情拉回来。
这也是 Datawhale 这份 Agent-Learning-Hub 最值得参考的地方。它没有把路线做成“框架大全”,而是把学习重点放回了工程本身:agent loop、工具调用、RAG、记忆、harness、skills、协议、评测和安全。
下面这篇文章,就按这条思路,把 AI Agent 学习路线拆成一套可以照着执行的教程。
一、先说清楚:什么是 Agent?
很多人第一次接触 Agent,会把它理解成“更聪明的聊天机器人”。
这个理解只对了一小半。
聊天机器人主要做一件事:你问,它答。
工作流主要做一件事:你提前写好流程,它按流程走。
而 Agent 要解决的是另一类问题:任务不完全确定,过程中需要根据观察结果不断调整下一步。
举个简单例子。
你让普通聊天机器人“帮我调研某个行业”,它可能直接给你一段总结。
你让工作流系统做调研,它会按固定步骤:搜索 3 个关键词、抓 5 篇文章、生成总结。
而一个更像样的 Agent,会先判断任务目标,再搜索资料;如果结果太泛,会改关键词;如果发现资料冲突,会继续验证;如果需要引用,会保留来源;最后再输出报告。
它不是一次性回答,而是在做一个循环。

这个循环可以简化成四步:
观察: 读取用户输入、当前状态、历史上下文、工具返回结果。
思考: 判断下一步该回答、该调用工具,还是该继续查证。
行动: 按明确的 schema 调用搜索、文件、数据库、浏览器、代码执行等工具。
复盘: 看工具结果是否有效,决定继续、修正,还是结束任务。
所以,Agent 的核心不是“模型会不会说话”,而是:
它能不能在不确定任务里稳定地做事。
这句话很关键。
因为很多 Demo 看起来惊艳,只是因为模型写了一段漂亮的话;但真正能用的 Agent,必须能追踪、能复现、能控制风险。
二、现在学 Agent,主线应该放在哪里?
Agent-Learning-Hub 里有一个很清醒的判断:
当前更值得投入的,不是老式“角色扮演多 Agent 框架”,而是更贴近真实生产力的方向。
可以把重点记成五个词。
1. Coding Agent
比如 Claude Code、OpenAI Codex 这类产品。
它们不是只会聊天,而是能进入真实代码库,读文件、改文件、跑测试、看报错、申请权限、处理上下文压缩。
如果你想理解 Agent 如何真正工作,Coding Agent 是非常好的样本。
因为软件工程场景天然要求闭环:不能只说“我改好了”,还要能运行、测试、回滚、解释。
2. Agent Harness
Harness 可以理解成 Agent 的“工程外壳”。
模型只是大脑的一部分,真正让 Agent 可用的,是外面这一整套系统:
工具怎么注册?
权限怎么控制?
状态怎么保存?
失败怎么重试?
上下文太长怎么压缩?
每一步怎么追踪?
发布前怎么评测?
很多时候,Agent 能力不是单纯来自模型,而是来自这个 harness。
3. Personal Agent
也就是更接近“个人操作系统”的 Agent。
它可能长期运行,接入本地文件、浏览器、消息入口、日程、知识库和技能包。
这类 Agent 的难点不只是回答问题,而是记忆、权限、长期任务、跨应用协作和安全边界。
4. Skills / MCP / A2A / ACP
这几个词很容易混。
简单说:
Tool 是一个可调用接口,比如搜索、读文件、发请求。
Skill 是一套可复用流程,比如“如何做代码审查”“如何写研究报告”。
MCP 让 Agent 标准化连接外部工具和数据源。
A2A 让不同 Agent 之间发现、通信和协作。
ACP 更偏 Agent 与宿主应用之间的连接协议。
如果说模型负责“想”,工具负责“做”,那 skills 和协议解决的是“能力如何复用、如何连接、如何扩展”。
5. Evaluation and Safety
这是很多入门教程会轻轻带过,但真实项目绕不开的部分。
Agent 一旦能调用工具,就不只是“说错话”的问题。
它可能误删文件、误发邮件、误查隐私数据、误把不可靠内容当证据。
所以,一个能交付的 Agent 至少要有:
固定测试集;
trace 记录;
成本和延迟统计;
工具权限边界;
高风险操作的人类确认;
prompt injection 和数据泄露防护意识。
没有这些,Agent 再会说,也只是 Demo。
三、完整学习路线:从 0 到能交付
先看一张总图。

下面按阶段拆开说。
Stage 0:先分清边界
这一阶段不要写太多代码,先把概念分清。
你需要能说清楚:
chatbot 适合什么?
workflow 适合什么?
agent 适合什么?
multi-agent 又适合什么?
更重要的是,要知道什么时候不该用 Agent。
如果一个任务流程稳定、规则明确、普通脚本就能完成,那硬上 Agent 反而会增加不确定性。
这一阶段的产出很简单:
写一页短笔记,回答“我的场景为什么需要 Agent,而不是普通 workflow?”
能回答这个问题,再往下走。
推荐资料与主要内容:
Agent-Learning-Hub:Stage 0
主要内容:原教程对 Stage 0 的要求很清楚:区分 chatbot、workflow、agent、multi-agent,理解 observe -> think -> act -> observe 的基本循环,并知道什么时候不该用 Agent。建议先按这里列出的 todo 自测一遍。
Anthropic:Building effective agents
主要内容:这篇文章很适合建立第一性理解。它强调大多数场景应先用简单 workflow,只有任务需要动态决策时再使用 agent,并给出 prompt chaining、routing、parallelization、orchestrator-workers、evaluator-optimizer 等常见模式。
OpenAI:A practical guide to building agents
主要内容:偏产品和工程落地视角,讲什么时候适合构建 Agent、Agent 由模型、工具、指令、护栏等部分组成,以及如何从小场景开始验证价值。
Stage 1:写一个最小 Agent Loop
别一上来就装框架。
先自己写一个 50 到 150 行的小 Agent。
它只需要做到几件事:
调用一次 LLM API;
让模型输出结构化 JSON;
定义一个工具,比如 calculator、search、read_file;
解析模型的 tool call;
执行工具;
把工具结果再喂回模型;
设置最大步数、超时和错误处理。
这一阶段的目标不是功能强,而是让你真正理解 Agent 是怎么“转起来”的。
如果你跳过这一步,后面学任何框架都会停留在“会调 API”,但不知道它内部为什么这么设计。
推荐资料与主要内容:
OpenAI Docs:Function Calling
主要内容:学习如何把工具描述成结构化 schema,让模型返回可解析的工具调用参数。重点看“工具定义、参数校验、调用结果回传”这几件事。
Anthropic Docs:Tool use
主要内容:学习 Claude 的工具调用机制,尤其是模型如何请求使用工具、开发者如何执行工具、再把 tool result 返回给模型。适合对比不同厂商的 tool call 设计。
Gemini API:Function calling
主要内容:Google Gemini 的函数调用文档。建议不要只学一家 API,而是横向比较“函数声明、参数类型、调用模式、错误处理”这些共性。
ReAct 论文
主要内容:Reasoning + Acting 的经典范式。初学者不用逐字啃论文,重点理解“推理轨迹”和“行动调用”为什么要交替出现。
Stage 2:工具、RAG 与记忆
这一阶段开始做一个有实际用途的 Agent。
推荐项目是:资料研究助手。
输入一个主题,它可以自动搜索、筛选、总结,并输出引用来源。
你需要掌握:
文档如何切块;
embedding 怎么做;
如何检索相关内容;
如何让回答带 citations;
搜索、数据库、文件、浏览器怎么接成工具;
工具失败、空结果、重复调用怎么处理;
短期上下文、会话记忆、长期记忆有什么区别。
很多人以为 RAG 只是“向量库 + 大模型”。
但真正难的地方在于:怎么让 Agent 不乱引用、不把检索不到的内容编出来、不在工具失败时假装成功。
这一阶段做完,你应该能完成一个能用的研究类 Agent。
推荐资料与主要内容:
LlamaIndex:RAG 入门
主要内容:系统理解 RAG 的基本链路:加载文档、切块、索引、检索、生成回答。适合用来补“知识库 Agent”的底层概念。
LlamaIndex:Agents
主要内容:学习如何把 query engine、检索器和外部工具交给 Agent 使用。适合把普通 RAG 升级成“能选择工具的 RAG Agent”。
Model Context Protocol:Introduction
主要内容:MCP 解决的是 Agent 如何标准化连接外部工具、数据源和上下文。Stage 2 不必深入协议细节,但要知道“工具接入”正在走向标准化。
mem0 / Letta
主要内容:两个都适合学习 Agent 记忆层。mem0 更偏记忆组件,Letta 更偏 stateful agents 和上下文管理。建议先看它们如何区分用户偏好、事实记忆和任务上下文。
GPT Researcher
主要内容:一个非常接近“资料研究助手”的开源项目。适合学习多轮搜索、资料筛选、引用整理和长报告生成。
Stage 3:深入学一个现代 Agent Harness
到了这里,可以开始选一个系统学深。
注意,不是学十个框架的 Hello World,而是选一个现代 Agent 系统,把它拆开看。
你要找这些东西:
agent loop 在哪里;
tool registry 怎么设计;
permission gate 怎么拦截危险操作;
session store 怎么保存状态;
context compaction 怎么处理长上下文;
trace 如何记录每一步;
失败时如何重试和恢复。
可以研究的方向包括 Claude Code、Codex、OpenClaw、Hermes、LangGraph、hello-agents 等。
这一阶段的产出是:
一个可调试的 agent harness demo。
它应该有 README、运行步骤、示例输入输出,以及至少一次失败记录。
别害怕失败记录。
真正的工程能力,往往就是从“为什么失败”里长出来的。
推荐资料与主要内容:
Agent-Learning-Hub:Stage 3
主要内容:原教程在这一阶段列出了 Claude Code、learn-claude-code、OpenClaw、Hermes、LangGraph 等方向。重点不是都学一遍,而是选一个系统,拆它的目录结构、agent loop、tool registry、permission gate、session store 和 trace。
Claude Code Docs
主要内容:研究 coding agent 产品形态。重点看 CLI 如何进入代码库、如何使用工具、如何请求权限、如何与 GitHub/MCP/hooks/subagents 等能力配合。
OpenAI Agents SDK
主要内容:学习轻量但完整的 Agent SDK 设计:agents、tools、handoffs、guardrails、sessions、tracing。适合写一个生产化雏形。
LangGraph Overview
主要内容:学习状态图、可恢复执行、checkpoint、人类介入和长期运行任务。适合复杂流程、审批流、多步任务和需要明确状态管理的 Agent。
learn-claude-code
主要内容:从零复刻 Claude Code-like harness 的开源教程。适合想真正理解 coding agent 内部机制的人。
Stage 4:多 Agent 是协调,不是魔法
很多多 Agent Demo 看起来很热闹:一个 planner,一个 writer,一个 critic,一个 reviewer,大家聊来聊去,最后输出一篇报告。
但真实项目里,多 Agent 的重点不是“角色越多越聪明”,而是“职责边界越清楚越可靠”。
你需要学习:
planner / executor / reviewer / router 分别做什么;
如何定义每个 Agent 的输入输出 schema;
如何设定停止条件;
如何避免循环、争论和任务漂移;
什么时候单 Agent 反而更好。
推荐练习:
做一个 research -> write -> review -> revise 的小系统。
研究 Agent 只负责找资料;
写作 Agent 只负责成文;
审稿 Agent 只负责指出证据不足、结构混乱、表达不清;
修订 Agent 根据意见改稿。
这样做,才是多 Agent 协作。
推荐资料与主要内容:
Claude Code:Subagents
主要内容:学习“专用子代理”的思路:不同 agent 拥有不同职责、上下文和工具权限。适合理解多 Agent 不是聊天群,而是上下文隔离和任务委派。
Google Agent Development Kit
主要内容:Google 的 Agent 开发框架,覆盖 agents、tools、sessions、multi-agent、evaluation 和 deployment。适合从框架角度理解多 Agent 协作。
LangGraph:Multi-agent Systems
主要内容:学习 supervisor、handoff、network、hierarchical 等多 Agent 组织方式。重点看“谁调度谁、状态如何传递、什么时候停止”。
Agent2Agent Protocol
主要内容:A2A 关注的是不同 Agent 之间如何发现、通信和协作。Stage 4 可以先看概念,理解未来多 Agent 不一定都在同一个框架里。
AutoGen
主要内容:经典多 Agent 对话框架。现在不建议把它作为唯一主线,但适合了解多 Agent 对话、角色协作和历史演进。
Stage 5:学习 Skills、协议和能力封装
Agent 变强,不只是因为模型变强,也因为它能复用经验。
Skill 就是把一类任务的做法沉淀下来。
一个好的 skill 通常包含:
什么时候使用;
具体步骤;
需要哪些脚本或模板;
如何验证结果;
失败时怎么处理。
举个例子。
“写研究报告”不是一个普通 prompt,而可以变成一个 skill:
先确认主题和受众;
再搜索资料;
保留来源;
整理大纲;
写初稿;
检查引用;
生成最终版本。
这个流程可以反复复用,也可以被版本化、测试和分发。
同时,你还需要理解 MCP、A2A、ACP 这些协议。它们不是炫技名词,而是解决一个实际问题:
Agent 如何稳定接入外部工具、其他 Agent 和宿主应用。
推荐资料与主要内容:
Claude Code:Skills
主要内容:学习 skill 的文件结构、触发机制和渐进式加载。重点理解 skill 不是一段 prompt,而是可发现、可复用、可版本化的能力包。
Anthropic:Agent Skills
主要内容:从更通用的 Agent 视角理解 skills:什么时候该封装成 skill、skill 里应该放步骤还是脚本、如何让模型按需加载额外资料。
Model Context Protocol
主要内容:MCP 用来连接工具和数据源。和 skill 的区别是:MCP 负责“接进来”,skill 负责“怎么做一类任务”。
Agent Client Protocol
主要内容:ACP 更偏 Agent 与编辑器、IDE、应用宿主之间的交互协议。适合理解 Agent 如何嵌入真实软件,而不是只在命令行里运行。
OpenClaw Skills
主要内容:适合观察本地个人 Agent 如何组织 skills、系统工具、权限边界和长运行任务。不要只看功能,要看它如何把能力变成可复用模块。
Stage 6:浏览器和电脑操作 Agent
Browser Agent 和普通 API Tool 不一样。
API 是结构化的,浏览器页面是变化的。
你要处理:
页面加载慢;
按钮位置变了;
弹窗挡住内容;
元素定位失败;
网页内容和截图不一致;
平台规则和账号安全限制。
这一阶段可以用 Playwright 或 browser-use 做练习。
但请记住一个边界:
只操作公开网页,不登录敏感账号,不绕过平台规则。
浏览器 Agent 很有用,但安全边界要比普通工具更严。
推荐资料与主要内容:
Playwright Docs
主要内容:浏览器自动化基础。重点看 locator、click、fill、screenshot、trace、等待策略。做 Browser Agent 前,最好先能自己写稳定的 Playwright 脚本。
Anthropic:Computer use
主要内容:学习模型如何观察屏幕、移动鼠标、点击和输入。重点不在炫技,而在安全限制、任务边界和人类监督。
browser-use
主要内容:浏览器 Agent 开源项目。适合学习如何把网页观察、动作执行、失败恢复、任务规划组合起来。
WebArena / VisualWebArena
主要内容:真实网页环境下的 Agent benchmark。适合理解为什么网页任务很难:页面状态复杂、视觉信息不稳定、任务需要长期规划。
Stage 7:评测、安全和可观测
如果前面几个阶段让 Agent “能做事”,这一阶段就是让它“做得可靠”。
你需要给 Agent 准备固定测试集,而不是每次只看一个漂亮 demo。
至少记录这些信息:
任务是否成功;
失败发生在哪一步;
调用了几次工具;
花了多少 token;
耗时多久;
有没有越权风险;
回答有没有引用依据。
建议做一个 eval 表格,先写 20 条任务。
每次你改 prompt、改工具、换模型、换检索策略,都跑一遍。
这一步会让你明显感觉到:Agent 工程不是玄学,它可以被观测、被比较、被改进。
推荐资料与主要内容:
OpenAI Evals
主要内容:学习如何给模型或 Agent 准备评测集,记录期望输出、实际输出和评分方式。重点是把“感觉更好”变成“有数据对比”。
LangSmith Evaluation
主要内容:学习 trace、dataset、experiment、regression testing 等概念。适合做 Agent 调试、回放和版本对比。
OWASP Top 10 for LLM Applications
主要内容:学习 prompt injection、敏感信息泄露、供应链风险、过度授权等安全问题。Agent 一旦能调用工具,安全问题就不只是“答错”。
AgentBench / SWE-bench
主要内容:两个典型 benchmark。AgentBench 用来理解通用 Agent 能力评测,SWE-bench 用来理解真实 GitHub issue 修复为什么难。
Stage 8:交付一个真实 Agent
最后,不要只停在本地 demo。
做一个别人能 clone 下来运行的项目。
它需要有:
明确用户;
明确任务;
明确成功标准;
日志和 trace;
错误重试和超时;
成本上限;
权限边界;
高风险动作人工确认;
部署方式;
README 和限制说明。
到这一步,你才算真正从“学 Agent”走到了“交付 Agent”。
推荐资料与主要内容:
OpenAI Agents SDK:Tracing
主要内容:交付前必须能看见每一步。重点看如何记录 Agent 运行轨迹、工具调用、handoff、错误和耗时。
OpenAI:Production best practices
主要内容:上线前检查速率限制、重试、超时、错误处理、监控、成本控制和安全边界。适合作为 Agent 项目的生产化 checklist。
FastAPI:Deployment
主要内容:如果你把 Agent 做成 Web API,需要理解进程模型、环境变量、反向代理、容器部署和健康检查。
Docker Docs:Get Started
主要内容:把 Agent 项目的运行环境封装起来,避免“我电脑能跑,你电脑跑不了”。README 里最好包含 Docker 启动方式。
GitHub Actions Docs
主要内容:适合做 CI、定时任务、自动评测和发布前检查。一个可交付 Agent,至少应该能自动跑 smoke test 或 eval 子集。
四、项目阶梯:按这个顺序练
学习 Agent 最怕只看文章不做项目。
如果不知道从哪开始,可以按下面这个阶梯练。

推荐顺序是:
第 1 层:Calculator Agent
只做最小 tool call loop。目标是理解模型如何选择工具、如何接收工具结果。
第 2 层:Web Research Agent
加入搜索、筛选、引用和总结。目标是做出一个真的能帮你查资料的小助手。
第 3 层:PDF QA Agent
学习 RAG、chunk、retrieval、citation。目标是让 Agent 回答你自己的文档。
第 4 层:Coding Review Agent
读取 git diff,按风险排序,给测试建议。目标是理解 coding agent 的基本工作方式。
第 5 层:Browser Agent
让 Agent 操作公开网页,提取信息,并处理失败恢复。
第 6 层:Nano Coding Agent
接入 shell、文件编辑、权限控制、session。不要做太大,先做一个迷你版。
第 7 层:Reusable Skill Pack
写一个自己的 SKILL.md,加入脚本、模板、触发条件和 smoke test。
第 8 层:Multi-Agent Writer
做 planner、writer、reviewer 的协作系统,重点练职责边界。
第 9 层:Personal Agent
加入记忆、skills、消息入口,尝试做一个个人长期助手。
第 10 层:Production Harness
补齐 evals、trace、权限、CI、回放,让项目从 demo 走向可维护。
每层都不要贪大。
真正有效的练习标准是:
能运行、能复现、能解释。
五、给你一份 90 天学习安排
如果你每天能拿出 1 到 2 小时,可以按下面节奏推进。
第 1-14 天:把最小闭环跑起来
目标只有一个:写出最小 Agent Loop。
每天做一点:
第 1-2 天:熟悉 LLM API 和结构化输出。
第 3-5 天:定义 calculator / search / read_file 这类简单工具。
第 6-8 天:解析 tool call,并把工具结果送回模型。
第 9-11 天:加入最大步数、超时、异常处理。
第 12-14 天:整理 README,写清楚一次完整运行过程。
这两周结束,你应该不再把 Agent 当成黑盒。
第 15-30 天:做一个研究助手
目标是完成 Web Research Agent。
你要学会搜索、抓取、筛选、引用、总结。
这段时间重点练三件事:
第一,回答要有来源。
第二,找不到资料要承认不知道。
第三,工具失败不能假装成功。
这会逼你开始关注 Agent 的可靠性。
第 31-45 天:补 RAG 和记忆
把 PDF、网页、Markdown 文档接入进来。
学习 chunk、embedding、retrieve、rerank 和 citations。
再加一点记忆能力:
短期上下文用于当前任务;
会话记忆用于连续对话;
长期记忆用于跨任务偏好和事实。
不要一开始就做复杂记忆系统。
先让它能“记得必要的东西”,再考虑长期演化。
第 46-60 天:拆一个现代 Harness
选一个系统学深。
可以是 LangGraph、OpenAI Agents SDK、Claude Code 相关学习项目、OpenClaw、hello-agents,任选一个。
这一阶段不要只看 API。
你要画出它的结构:
入口在哪里;
状态怎么传;
工具怎么注册;
权限怎么过;
trace 怎么看;
失败怎么恢复。
然后给它加一个自己的工具。
第 61-75 天:做 skills、协议和多 Agent
先写一个 skill。
比如:
code-review;
research-report;
pdf-extraction;
release-note-writer。
然后理解 MCP 的作用:让 Agent 用标准方式连接工具和数据源。
最后再做一个小型多 Agent 系统。
记住,多 Agent 的重点是协调,而不是让几个角色自由聊天。
第 76-90 天:加评测、安全和部署
最后 15 天,专门做工程化。
准备 20 条 eval 测试任务;
记录成功率、失败原因、成本和延迟;
给危险工具加人工确认;
写部署文档;
把项目整理成别人能运行的样子。
如果能做到这一步,你已经不是“看过 Agent 教程”,而是有了一个能展示、能改进、能继续扩展的 Agent 项目。
六、几个很常见的坑
坑 1:一上来就学多 Agent
多 Agent 不是入门捷径。
如果单 Agent 的工具调用、状态管理、失败处理都没搞清楚,多 Agent 只会把问题放大。
先做单 Agent,再做协作。
坑 2:只看框架,不看 trace
Agent 失败时,最有价值的信息在 trace 里。
它为什么调用这个工具?
工具返回了什么?
它为什么又调用了一次?
哪一步开始跑偏?
不会看 trace,就很难调 Agent。
坑 3:工具 schema 写得太随意
工具不是“给模型一个函数名”就完事。
参数要清楚,返回要稳定,错误要可读,权限要明确。
工具越随意,Agent 越容易乱用。
坑 4:没有 eval,却不断调 prompt
没有测试集的 prompt 优化,很容易变成玄学。
你觉得变好了,可能只是刚好命中了一个样例。
固定测试集能帮你判断:这次修改到底是进步,还是只是换了一种失败方式。
坑 5:忘了判断“是否需要 Agent”
不是所有任务都该用 Agent。
如果普通脚本能稳定完成,就用脚本。
如果固定流程能解决,就用 workflow。
只有在任务有不确定性、需要动态决策、需要调用多种工具时,Agent 才真正有价值。
七、最后:一条最朴素的学习原则
学 Agent,不要只问“哪个框架最强”。
更好的问题是:
这个 Agent 能不能完成闭环?
工具调用是否可靠?
失败能不能定位?
危险动作有没有权限边界?
有没有固定评测?
别人能不能运行我的项目?
能回答这些问题,你的学习就不会被新名词带着跑。
从一个 50 行的最小 Agent 开始。
再做一个研究助手。
再加 RAG、记忆、trace、skills、评测和安全。
最后把它整理成一个真实项目。
这条路看起来慢,但它最稳。
因为真正能用的 Agent,从来不是靠“角色设定”堆出来的。
它是一个能观察、能行动、能复盘、能被约束的工程系统。
最后
如果说程序员已经是高薪职业,那么干AI的程序员,就是高薪中的高薪。

现在的市场,已经用数据给程序员指明了方向:学AI大模型,就是冲刺高薪的最优解!

看着身边越来越多的同行转型大模型、拿到高薪offer,很多人心里都动了心,但真正的难题来了:零基础小白不知道从哪入门?有基础的程序员找不到系统学习路径?实战项目练手无门?面试不知道考什么?
别慌!今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包,覆盖从入门到实战、从理论到面试、从基础到进阶的全流程,所有资料均已整理归档,无冗余、无套路,免费分享给每一位想抓住AI风口的程序员和小白!
👇👇扫码免费领取全部内容👇👇

1、大模型系统化学习路线

2、大模型学习书籍&文档

3、AI大模型最新行业报告

4、大模型项目实战&配套源码

5、大模型大厂面试真题

四阶段精细化学习规划(附时间节点,可直接照做)
结合上述资源,给大家整理了一份可直接落地的四阶段学习规划,总时长约2个月,小白可循序渐进,程序员可根据自身基础调整节奏,高效掌握大模型核心能力,快速实现从“入门”到“能落地、能面试”的跨越。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
👇👇扫码免费领取全部内容👇👇

6、这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多推荐



所有评论(0)