typical_yyc 个人主页

@typical_yyc

typical_yyc

2025-07-07 20:58:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Pytorch可视化（五）之训练过程可视化WandB

在上一节中，我们使用了TensorBoard。：换台电脑就看不到实验结果，且不方便多人协作。：当实验多达几十个时，在 TensorBoard 里对比不同超参的效果非常混乱。完美解决了这些问题。它被誉为“深度学习界的 GitHub”，不仅支持云端保存、多人协作，还能自动记录系统性能（显存、CPU）、保存模型权重，并提供极其优雅的对比界面。

#pytorch #人工智能 #python +1

Pytorch可视化（四）之训练过程可视化TensorBoard

当我们的实验变得复杂（对比不同超参数、观察深层梯度）时，Matplotlib 的静态绘图就显得捉襟见肘。TensorBoard 作为深度学习领域事实上的标准可视化工具，能为我们提供动态、交互式的实验追踪。

#pytorch #人工智能 #python

AI范式跃迁：从大模型LLM到Agent，再到工程化智能体

它不再只是一个插件，而是一个拥有独立工作位的工程师。

#人工智能

Pytorch进阶训练技巧（三）之学习率调度与训练节奏控制

不同调度器的更新粒度不同：Warmup 通常按 Step 更新，Step/Cosine 多按 Epoch 更新，而 Plateau 则由验证指标触发。策略适用场景核心价值Warmup大模型、AdamW、大 Batch防止训练初期崩溃绝大多数分类、检测任务追求极限精度，过程丝滑平稳数据规模小、经典 CNN逻辑简单，实验可复现性极强调参经验不足、指标震荡指标驱动、减少手动调参，但依赖验证指标质量。

#pytorch #学习 #人工智能 +1

Pytorch深入浅出（十四）之完整的模型训练测试套路

在 PyTorch 等主流深度学习框架中，模型迭代训练的核心套路模板本质上只有两种：1️⃣ 在 epoch 循环内直接写 train / eval 逻辑（内联写法）2️⃣ 将 train / eval 封装成函数，在 epoch 循环中调用（模块化写法）二者在训练语义上等价，差异仅在代码组织与工程可维护性是否存在“第三种本质套路”？之后可能看到的：PyTorch Lightning、Hugging

#pytorch #人工智能 #python +1

Pytorch深入浅出（八）之学习率调整（Scheduler）

虽然官方 API 很全，但有时我们需要特殊的策略（比如前 5 个 Epoch 线性增长做 Warmup，后面再衰减）。我们可以通过自定义函数来实现。

#pytorch #人工智能 #深度学习

到底了