logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习 - 第16章 - 西瓜书 - 笔记(上)(马尔科夫决策过程 - ϵ-贪心 - 蒙特卡洛方法 - On-Policy 同策略 - Off-Policy 异策略)

强化学习 (Reinforcement Learning, RL) 讨论的是智能体 (agent) 如何在复杂、不确定的环境 (environment) 中通过学习来最大化它能获得的累积奖励。在我们深入技术细节之前,先从你熟悉的监督学习出发,建立一个对强化学习的宏观认识。这对于理解其核心思想至关重要

文章图片
#机器学习#深度学习
[实验日志] VS Code 连接服务器上的 Python 解释器远程调试 (含 Pytorch 分布式 torch.distributed.launch 的调试.json配置)

PyCharm的缺点是:不能实时同步、操作繁琐,需要维护两份代码。而VS Code是通过SSH(Secure Shell)的方式连接到远程服务器,换句话说,VS Code在远程开发过程中扮演的角色更像是一款终端模拟工具,它不需要繁琐的上传和下载步骤,实时性更好,只需要在Windows上保存一下,就会瞬间同步到远程服务器。

文章图片
#服务器#python#运维 +4
Diffusion 到 Flow Matching ( 从 DDPM 到 Stable Diffusion ) 丝滑入门

随着深度生成模型对高质量、多样化输出的需求提升,扩散模型凭借 “破坏 - 修复” 的核心逻辑脱颖而出,成为学习数据分布的强大框架。其通过噪声预测实现生成,经条件控制突破 “盲盒式” 生成局限,适配文本等导向需求。后续为解决效率问题,Flow Matching 以确定性路径优化推理速度。如今,这类生成式监督框架已超越图像生成,延伸至 VLA 模仿学习等领域

文章图片
《动手学深度学习》笔记1.7——模型选择 + 过拟合-欠拟合

李沐老师:过拟合不一定是坏事,为了把泛化误差往下降,不得不承受一定程度的过拟合;首先是模型容量要足够(模型足够大)(伴随一定的过拟合);其次才是通过(缩减容量)调整模型容量,缩小误差(这是整个深度学习的核心)

文章图片
#深度学习#人工智能#python +1
RNN (循环神经网络 - 从mlp到rnn - 困惑度 - 梯度剪裁) + 代码实现 —— 笔记3.4《动手学深度学习》

我们在本节中会训练一个基于循环神经网络的字符级语言模型,根据用户提供的文本的前缀生成后续文本。一个简单的循环神经网络语言模型包括输入编码、循环神经网络模型和输出生成。循环神经网络模型在训练以前需要初始化状态,不过随机抽样和顺序划分使用初始化方法不同。当使用顺序划分时,我们需要分离梯度以减少计算量。在进行任何预测之前,模型通过预热期进行自我更新(例如,获得比初始值更好的隐状态)。梯度裁剪可以防止梯度

文章图片
#rnn#人工智能#深度学习 +2
1. 如何在服务器上租GPU跑实验 (以AutoDL为例) - 深度学习·科研实践·从0到1

后期很多操作可以看帮助文档,比如将咱刚刚创建的实例连接pycharm (专业版),同步代码,将数据传入,使用常用的jupyter lab终端可视化控制咱的Linux服务器,等等,都有详细教学文档

文章图片
#深度学习#人工智能#服务器
2. 将GitHub上的开源项目导入(clone)到(Linux)服务器上——深度学习·科研实践·从0到1

目录1. 在github上搜项目 (以OpenOcc为例)2. 转移到码云Gitee上3. 进入Linux服务器终端 (jupyter lab)4. 常用Linux命令5. 进入对应文件夹中导入项目(代码)

文章图片
#深度学习#人工智能#github +2
《动手学深度学习》笔记2.5——神经网络从基础→使用GPU (CUDA-单卡-多卡-张量操作)

我们可以指定用于存储和计算的设备,例如CPU或GPU。默认情况下,数据在主内存中创建,然后使用CPU进行计算。深度学习框架要求计算的所有输入数据都在同一设备上,无论是CPU还是GPU。不经意地移动数据可能会显著降低性能。一个典型的错误如下:计算GPU上每个小批量的损失,并在命令行中将其报告给用户(或将其记录在NumPyndarray中)时,将触发全局解释器锁,从而使所有GPU阻塞。最好是为GPU内

文章图片
#pytorch#python#深度学习 +3
2. 将GitHub上的开源项目导入(clone)到(Linux)服务器上——深度学习·科研实践·从0到1

目录1. 在github上搜项目 (以OpenOcc为例)2. 转移到码云Gitee上3. 进入Linux服务器终端 (jupyter lab)4. 常用Linux命令5. 进入对应文件夹中导入项目(代码)

文章图片
#深度学习#人工智能#github +2
    共 48 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择