logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

动手学深度学习——PyTorch 基础:使用 GPU 详解

前面学习 PyTorch 时,我们已经逐步接触了很多基础内容,比如:模型构造参数管理自定义层读写文件前向传播和训练流程但当模型开始稍微复杂一点、数据量稍微大一点之后,很快就会遇到一个现实问题:为什么训练这么慢?CPU 跑一轮都要很久,有没有办法加速?这时候,GPU 就登场了。在深度学习中,GPU 几乎是最重要的计算设备之一。因为神经网络训练里有大量矩阵运算,而这正是 GPU 特别擅长的事情。如何让

文章图片
#深度学习#pytorch#人工智能
动手学深度学习——PyTorch 基础:读写文件详解

前面学习 PyTorch 时,我们已经逐步掌握了很多核心内容,比如:如何构造模型如何管理参数如何自定义层如何让模型完成前向传播但当真正开始训练模型时,很快就会遇到一个非常实际的问题:模型辛辛苦苦训练了很久,训练完之后怎么保存?下次还想继续用,怎么重新加载?不只是模型,普通张量、参数、结果文件又该怎么存?这就是“读写文件”这一节要解决的问题。这一部分内容非常重要,因为在真实项目里,我们几乎不可能每次

文章图片
#深度学习#pytorch#人工智能
动手学深度学习——PyTorch 神经网络基础:自定义层详解

nn.Linearnn.ReLU这些层已经足够我们搭建很多基础神经网络。但随着学习深入,我们很快会发现一个问题:现实中的网络结构,不一定总能完全靠现成层直接拼出来。比如有时候我们可能想实现:一个带特殊计算规则的层一个没有可学习参数、只做固定变换的层一个带自定义权重逻辑的层一个按照自己想法组织前向传播的模块自定义层。如果说前面的“模型构造”是在学怎么用现成零件搭模型,如何自己造零件。这一节非常关键,

文章图片
#深度学习#pytorch#神经网络
动手学深度学习——PyTorch 神经网络基础:参数管理详解

在上一节“模型构造”中,我们已经知道了如何用 PyTorch 定义一个神经网络,比如:用搭建顺序模型继承nn.Module自定义网络在__init__()中定义层在forward()中定义前向传播过程但当我们真正开始训练模型时,很快就会遇到一个更具体的问题:模型里的参数到底存在哪里?我们该怎么查看、访问、初始化、共享和修改这些参数?这就是“参数管理”要解决的核心问题。不断更新模型参数,使模型输出越

文章图片
#深度学习#pytorch#神经网络
动手学深度学习——PyTorch 神经网络基础:模型构造详解

在前面学习深度学习基础时,我们已经接触过很多核心概念,比如:线性回归多层感知机模型初始化激活函数数值稳定性房价预测实战如何在 PyTorch 中构造模型。神经网络在代码里到底怎么定义、怎么组织、怎么调用。“模型构造”这一节非常重要,因为后面无论是:多层感知机卷积神经网络循环神经网络本质上都离不开“如何构造模型”这个基础。如果这一节学扎实了,后面你看到再复杂的网络结构,也不会觉得神秘,因为你会明白:

文章图片
#深度学习#pytorch#神经网络
《动手学深度学习》风格延伸版:课程竞赛——加州 2020 年房价预测

假设有三种取值:ABC那么编码后会变成三列:是否为 A是否为 B是否为 C对应取值是 0 或 1。“课程竞赛:加州 2020 年房价预测”是一个非常适合机器学习入门和课程实战训练的题目。它不像纯理论章节那样偏抽象,而是非常贴近真实项目流程。通过这个题目,我们可以系统练到:表格数据读取缺失值处理数值特征标准化类别特征编码回归模型训练验证误差分析模型改进思路设计如果你能把这一题真正做扎实,后面再做其他

#深度学习#人工智能
李沐《动手学深度学习》——模型初始化和激活函数

模型初始化,就是在训练开始之前,先给神经网络中的参数一个初始值。在神经网络中,最核心的参数就是:权重weight偏置bias例如一个全连接层:y = Wx + b这里的 (W) 和 (b) 在训练前都需要先赋值,这个过程就叫初始化。激活函数(Activation Function)是神经网络中非常关键的一部分。一个线性层本身只是:y = Wx + b如果整个网络只是一层层线性变换叠加,那么无论叠多

#深度学习#人工智能
动手学深度学习笔记:数值稳定性

在刚开始学习深度学习时,很多人都会遇到这样几个问题:模型刚训练几轮,loss直接变成nan学习率明明不大,但参数更新后结果越来越离谱网络层数一深,梯度不是特别大,就是特别小同样的代码,别人能跑,我一跑就崩一开始我以为这是代码写错了,后来学习了李沐老师《动手学深度学习》中关于**数值稳定性(Numerical Stability)**的内容后,才明白:很多深度学习训练问题,不一定是模型设计错了,而是

#深度学习#人工智能
《从 0 到 1:我在 WSL2 中部署 OpenClaw 的完整实战记录(含安全配置、MiniMax 接入、踩坑复盘)》

环境变量可以理解成:进程启动时能读取到的一组键值对配置。这里就是变量名,xxxxx是值。程序运行时可以去读它。我不是简单地安装了 OpenClaw,而是借这个过程补上了本地 AI Agent 部署、安全配置、认证机制、Linux 服务管理和 provider 接入的一整套基础能力。这次踩了很多坑:OpenAI OAuth 失败token 用错位置当前会话模型残留systemd 服务拿不到环境变量但

文章图片
#安全
《从 0 到 1:我在 WSL2 中部署 OpenClaw 的完整实战记录(含安全配置、MiniMax 接入、踩坑复盘)》

环境变量可以理解成:进程启动时能读取到的一组键值对配置。这里就是变量名,xxxxx是值。程序运行时可以去读它。我不是简单地安装了 OpenClaw,而是借这个过程补上了本地 AI Agent 部署、安全配置、认证机制、Linux 服务管理和 provider 接入的一整套基础能力。这次踩了很多坑:OpenAI OAuth 失败token 用错位置当前会话模型残留systemd 服务拿不到环境变量但

文章图片
#安全
    共 20 条
  • 1
  • 2
  • 请选择