一本让你超越90%大模型初学者的入门好书！！这本书彻底杀死了我学大模型的混乱逻辑

《大模型基础》是浙江大学DAILY Lab推出的开源教材，系统讲解大语言模型的基础原理与核心技术。全书分为基础篇、核心篇和进阶篇，涵盖从传统语言模型到前沿技术如Prompt工程、参数高效微调等六大主题。内容特色包括：融入浙大原创研究成果、理论与实践结合、中文语境案例分析、AI伦理探讨等。适合高校学生、研究人员及开发者阅读，配套丰富资源如在线课程和代码仓库。该书电子版及完整学习资料可免费领取。

大耳朵爱学习

170人浏览 · 2025-10-10 13:55:36

大耳朵爱学习 · 2025-10-10 13:55:36 发布

《大模型基础》 是浙江大学 DAILY Lab（Database and Big Data Analytics Laboratory）推出的一本开源教材，系统讲解大语言模型（LLM）的基础原理、核心技术与前沿方法。覆盖从传统语言模型、架构演化、Prompt 工程、参数高效微调、模型编辑，到检索增强生成（RAG）等六大主题。

这本《大模型基础》PDF已经整理好，还有完整版的大模型 AI 学习资料，朋友们如果需要可以微信扫描下方二维码免费领取【`保证100%免费`】👇👇

一、内容介绍

本书内容设计遵循“夯实基础—深入原理—拓展应用—展望未来”的逻辑脉络，全面覆盖大模型领域的关键知识点。

基础篇：

系统介绍机器学习与深度学习的基本概念，包括神经网络结构、反向传播、优化算法（如SGD、Adam）、正则化技术等。同时涵盖自然语言处理的基础任务，如词向量表示（Word2Vec、GloVe）、序列模型（RNN、LSTM）和注意力机制的起源。
核心篇：

深入剖析大模型的核心架构与训练范式。重点讲解Transformer模型的自注意力机制、位置编码、前馈网络等组件；详细阐述预训练-微调范式（Pre-training & Fine-tuning），包括语言建模目标（如MLM、NSP）、大规模语料库构建、分布式训练技术（数据并行、模型并行、流水线并行）以及混合精度训练。
进阶篇：

探讨大模型的高效训练与推理技术，如模型压缩（知识蒸馏、剪枝、量化）、提示工程（Prompt Engineering）、上下文学习（In-context Learning）、思维链（Chain-of-Thought）等。同时介绍多模态大模型（如CLIP、Flamingo）的架构与融合机制。