大模型开发工程师攻略:从零到AI应用开发,一条龙学习路线,建议收藏!
很多同学说想学习AI,但是不知道从哪里开始,学习路线是什么。我学习AI已经有一段时间了,这篇文章来聊聊我是如何学习AI的,欢迎各位大佬补充和指点。
很多同学说想学习AI,但是不知道从哪里开始,学习路线是什么。我学习AI已经有一段时间了,这篇文章来聊聊我是如何学习AI的,欢迎各位大佬补充和指点。
我是怎么开始的
16年的时候我是零基础自学前端,所以开始学习AI的时候我想将自学前端的那一套搬过来使用。
以前我是这样自学前端的:
- 知乎上面搜索前端学习路线和入门经典书
- 淘宝上面9.9元买培训班的前端视频
- 看视频、跟着视频敲代码、看书、跟着视频写项目、找工作
按照这个套路去学AI,结果把我搞得很迷茫。
先去知乎上面去搜索AI学习路线,基本得到的都是这种回答:
- 学习python
- 学习高数
- 学习机器学习
- 学习深度学习
- 大模型训练
- 大模型应用
看的我一脸蒙蔽,直接劝退。
【首先说明】不是这种路线不好,而是不适合我们这种工程师去学习(不管是前端工程师还是后端工程师)。
我们工程师擅长的是在技术更上层去做更贴近用户的产品,而不是去研究底层原理。当然你想要在技术上面有更大的突破,研究原理肯定是需要的。但是不应该在连hello world都还没写出来的情况下去学习底层原理。
刚刚接触AI,上面的学习路径里面除了python之外,其他每个字我都认识,但是连起来我就不认识了(高数也早就还给老师了)。
知乎的学习路线图看来是行不通了(我没有在知乎找到适合工程师的AI学习路线图),然后我就想到了B站,毕竟B站号称“B站大学”。
B站上面各种搜,最后找到看着播放量和评论都不错的系列视频。
bilibili
这个视频是培训机构发的,是往期的培训视频录播,看着播放量和评论都不错。
初看感觉干货挺多的,讲的内容我都能听懂。
现在回过头来看,里面主要就是在讲一些大模型概念和如何调用接口和框架API。在前端深耕多年,我最擅长的就是调接口和使用框架API了。。。。。
所以现在回过头来看,这个算是踩坑了,浪费了不少时间。这个视频适合那种纯小白,不适合我们这种工程师。
油管学习
看完B站的视频后对AI的基础概念和langchain开发有了一定的了解,但是仅停留在表面。
之前关注了不少大厂的技术公众号:
我发现今年他们都只发AI相关的内容了,这也算是一个风向标,我也跟着这些公众号学习。但是有个问题,知识都太零散了,我现在需要的是一个有深度的成体系的小册或者系列视频。
日常学习,刷到一篇关于Transformer和大模型底层原理的文章:
说实话,那会儿看不懂这篇文章。于是去看这篇文章的参考资料,看到一篇很牛逼的参考文章:
从知乎的1.5万点赞量就可以看出来这篇文章不一般了,文章开头就推荐去看李宏毅老师的视频,作者还觉得李老师关于Transformer的讲解是史上最强的!
跳过文章,直接去油管上面看李宏毅老师的视频:
youtube
李宏毅老师是台湾大学的老师,油管上面每一年的系列视频都是他那一年在台大开设的课程,这刚好就是我苦苦寻找的,还是免费的。
他的讲课风格非常有趣,不会看着想睡觉。面向的是小白,但是内容很有深度。课程中的内容我基本都看懂了,之前那些大模型原理文章我看不懂可能真不是我的问题。
我看完了他的2024年和2025年的课程,基本对大模型的底层原理有了系统性的认知,还有一个2021年机器学习课程还没看,准备过段时间来看。
真的很推荐大家去油管看看李宏毅老师的课程!!!! 油管上面有很多免费课程比国内的那些付费课程甩了可能有几百个太阳系的距离吧。
从开源项目中学习
光看理论知识还是不够的,还是得做项目才行。要做项目肯定需要学习一个大模型的开发框架,我选择了langchain这个最流行的框架。
将langchain的文档全部看了一遍,并且也跟着文档中的例子写了一些demo。
在看langchain文档的时候,发现他推荐agent开发使用langgraph,所以又将langgraph也学了一遍。
学习完langchain和langgraph后,并且也写了一些代码。
但是总感觉自己很“虚”,因为我一直都在研究理论和写demo级别的代码,不虚才有鬼了。
如何破局呢?
付费加入AI项目训练营?靠忽悠去找一份agent开发的工作?
这两个方案我觉得都不怎么靠谱。
回想一下自己入行前端的经历或许可以参考,那会儿行情不错,我入职第一家公司的时候其实和现在一样也很“虚”。
那会儿入职后领导就给我加了一个代码仓库的权限,然后就安排开发新需求。
从没做过真实项目的我,迫于压力硬着头皮啃代码,看不懂就问隔壁的大佬,那段时间是我技术成长最快的时候。
那么如何找一个AI的真实项目呢?
今年国内死命卷开源大模型,那么开源AI项目是不是也应该有不少呢?
上GitHub上面一顿搜索,还真让我找到很多优秀的开源项目。
研究的第一个项目是字节开源的deer-flow
,这是一个基于langgraph开发的深度研究agent项目。将项目搞懂,差不多能够达到初中级的程度。
这个项目是python开发的,在研究的过程中我复刻了一个nodejs版本,基本就将项目掌握的七七八八了。
还有一个这个月开源的清华大学教授团队的深度研究项目(我还没细看):
MiroMind
今天,经过一个季度的努力,MiroMind正式亮相并发布我们重磅开源项目,MiroMind Open Deep Research (Miro ODR)。MiroODR是当前开源最强Deep Research模型,真全开源且可复现,核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源,复现无压力。我们将以每月一次开源更新的速度,同社区一起创作最强Deep Research模型。
这个是真开源,基本将所有东西都开源了,很适合学习。
还有一个vibe coding的开源项目值得推荐去看:
这个项目中包含了前端和后端的所有代码,原名为“OpenDevin”。从名字你应该就能看出来这个是Devin的开源版本,里面的项目代码复杂度很高,适合进阶学习。
总结
从现在的视角来看我之前的学习路线是有问题的,如果让我给学习路线的建议,我觉得应该是这样的:
- 注册大模型平台账号获取自己的token
- 看langchain文档和langgraph文档,跟着文档写demo,并且使用自己的token将demo跑起来
- 研究GitHub字节开源的deer-flow项目,复刻一个js版本
- 看油管上面李宏毅老师的大模型底层原理课程
- 研究GitHub上面企业级复杂度的agent项目
chain文档和langgraph文档,跟着文档写demo,并且使用自己的token将demo跑起来 - 研究GitHub字节开源的deer-flow项目,复刻一个js版本
- 看油管上面李宏毅老师的大模型底层原理课程
- 研究GitHub上面企业级复杂度的agent项目
- 做一个自己的AI agent产品
AI大模型从0到精通全套学习大礼包
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!
01.从入门到精通的全套视频教程
包含提示词工程、RAG、Agent等技术点
02.AI大模型学习路线图(还有视频解说)
全过程AI大模型学习路线
03.学习电子书籍和技术文档
市面上的大模型书籍确实太多了,这些是我精选出来的
04.大模型面试题目详解
05.这些资料真的有用吗?
这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。
所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势,构建起"前沿课程+智能实训+精准就业"的高效培养体系。
课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!
应届毕业生:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能 突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
更多推荐
所有评论(0)