logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Pytorch可视化(五)之训练过程可视化WandB

在上一节中,我们使用了TensorBoard。:换台电脑就看不到实验结果,且不方便多人协作。:当实验多达几十个时,在 TensorBoard 里对比不同超参的效果非常混乱。完美解决了这些问题。它被誉为“深度学习界的 GitHub”,不仅支持云端保存、多人协作,还能自动记录系统性能(显存、CPU)、保存模型权重,并提供极其优雅的对比界面。

#pytorch#人工智能#python +1
Pytorch可视化(四)之训练过程可视化TensorBoard

当我们的实验变得复杂(对比不同超参数、观察深层梯度)时,Matplotlib 的静态绘图就显得捉襟见肘。TensorBoard 作为深度学习领域事实上的标准可视化工具,能为我们提供动态、交互式的实验追踪。

#pytorch#人工智能#python
AI范式跃迁:从大模型LLM到Agent,再到工程化智能体

它不再只是一个插件,而是一个拥有独立工作位的工程师。

#人工智能
Pytorch进阶训练技巧(三)之学习率调度与训练节奏控制

不同调度器的更新粒度不同:Warmup 通常按 Step 更新,Step/Cosine 多按 Epoch 更新,而 Plateau 则由验证指标触发。策略适用场景核心价值Warmup大模型、AdamW、大 Batch防止训练初期崩溃绝大多数分类、检测任务追求极限精度,过程丝滑平稳数据规模小、经典 CNN逻辑简单,实验可复现性极强调参经验不足、指标震荡指标驱动、减少手动调参,但依赖验证指标质量。

#pytorch#学习#人工智能 +1
Pytorch深入浅出(十四)之完整的模型训练测试套路

在 PyTorch 等主流深度学习框架中,模型迭代训练的核心套路模板本质上只有两种:1️⃣ 在 epoch 循环内直接写 train / eval 逻辑(内联写法)2️⃣ 将 train / eval 封装成函数,在 epoch 循环中调用(模块化写法)二者在训练语义上等价,差异仅在代码组织与工程可维护性是否存在“第三种本质套路”?之后可能看到的:PyTorch Lightning、Hugging

#pytorch#人工智能#python +1
Pytorch深入浅出(八)之学习率调整(Scheduler)

虽然官方 API 很全,但有时我们需要特殊的策略(比如前 5 个 Epoch 线性增长做 Warmup,后面再衰减)。我们可以通过自定义函数来实现。

#pytorch#人工智能#深度学习
到底了