
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
第二讲的核心不是背启动流程,而是理解操作系统为什么必须和硬件合作。让普通操作直接执行,保证性能;让危险操作受控进入内核,保证安全;让 OS 能随时抢回 CPU,保证控制权。这就是第二讲最重要的主线。

操作系统是硬件和应用/用户之间的桥梁。更具体一点:操作系统是一个特殊的软件层,它管理应用程序对硬件资源的访问,例如 CPU、内存、磁盘、I/O 设备等。Users↓Applications: 浏览器、微信、Office、游戏、编译器↓↓Hardware Resources: CPU、GPU、内存、磁盘、网卡、键盘、鼠标、显示器为什么中间必须有 OS?不安全:一个程序可能随便读写别人的内存。不公平:

user code↓这可以叫 downcall,因为用户向下请求内核服务。kernel↓它允许应用程序实现一些类似 OS 的功能,然后由 OS 在合适的时候通知它。异步 I/O 通知:I/O 完成后通知用户程序进程间通信:调试器暂停某个进程用户级异常处理:程序退出前保存文件用户级资源管理:Java garbage collection所以用户态和内核态并不是只有“用户请求内核”这一种关系。有时候内

本文通过直观的比喻和极简的 PyTorch 代码,彻底拆解文生图模型里的一个关键魔法:Cross-Attention(交叉注意力)。它到底是怎么做到“文本控制图像局部”的?为什么一句提示词里的“红色”“猫”“戴帽子”会分别跑到不同区域生效?

摘要:Classifier-Free Guidance(CFG)是扩散模型实现精准条件生成的核心技术。其核心思想是通过对比模型在有条件预测(基于提示词)和无条件预测**(通用去噪)的噪声差异,构造一个强化条件引导的修正方向。公式上,CFG通过加权放大条件与无条件预测的差值(w·(ϵ_cond - ϵ_uncond)),使采样轨迹更偏向提示词目标,而权重w控制引导强度。过高的w虽增强语义贴合性,但可

本文通过直观的比喻和极简的 PyTorch 代码,彻底拆解扩散模型最核心的数学骨架——为什么模型能从噪声里“洗”回图像?以及你必须真正搞懂的四个关键词:q(xt∣x0)q(xt∣x0)、反向采样、scheduler、DDPM/DDIM。

本文摘要: 斯坦福CS336课程第二讲聚焦PyTorch底层机制与资源核算技术。主要内容包括:1) 混合精度训练中BF16的优势及其与FP32/FP16的对比;2) PyTorch张量的内存布局与视图操作原理;3) 大模型训练的算力(FLOPs)估算方法,包括前向/反向传播的计算量分析;4) 显存占用的四大部分(参数、梯度、优化器状态、激活值)核算方法;5) 初始化策略与优化器选择建议。课程强调通

斯坦福CS336课程第十七讲深入探讨了大语言模型强化学习的核心算法与实现细节。课程首先明确了RL在LLM中的独特设定:状态为prompt+生成文本,动作为生成token,奖励为可验证结果。针对稀疏奖励问题,讲解了策略梯度算法及其改进方案,特别是引入基线函数降低方差的方法。重点剖析了GRPO算法的实现,包括奖励塑形、中心化处理等技巧,并演示了代码实现中的关键步骤(如概率比率计算与PPO截断)。

斯坦福CS336课程第十一讲深入探讨了大模型缩放定律的工业实践与数学机制。重点分析了Cerebras-GPT、MiniCPM等开源案例,揭示了最大更新参数化(MUP)的关键作用:通过1/width缩放实现超参数迁移稳定性。课程还对比了传统余弦退火与新型WSD学习率策略的优劣,指出WSD的分段式设计能动态调整训练周期,极大降低了Scaling Laws验证成本。最新趋势显示,工业界正利用缩放定律优化

《斯坦福CS336课程:大模型评估的挑战与方法》摘要:本文深入探讨了语言模型评估的复杂性和现实挑战。评估不仅是测试模型性能的机械过程,更是影响研发方向的关键环节。课程详细分析了评估框架的四个核心环节(输入、模型调用、输出评估和结果解释),并介绍了困惑度等评估指标的优缺点。文章还探讨了各类基准测试(如MMLU、GPQA)的现状与局限,开放式生成评估的难题,以及智能体和安全性评估的特殊要求。特别指出当








