logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【转载】光流法基本原理+深度学习中的应用【FlowNet】【RAFT】

① 基于梯度的方法(微分法)利用时变图像灰度的时空微分(时空梯度函数)来计算像素的速度矢量。② 基于匹配的方法有基于特征和基于区域两种。基于特征的方法是对目标特征进行定位和跟踪,目标大的运动和亮度具有更好的鲁棒性。基于区域的方法是对类似的区域进行定位,通过相似区域的位移计算光流。③ 基于能量的方法(频率)要获得均匀光流场的准确的速度估计,必须对输入图像进行时空滤波处理,即对时间和空间进行整合。④

文章图片
#深度学习#人工智能
【debug】nvidia-smi:Failed to initialize NVML: Unknown Error

上执行 Docker 命令,因为容器本身没有权限直接重启自己。只能联系宿主机那边给重启一下容器。尚未以systemd作为初始系统启动。检查方法:ps -p 1 -o comm=今天用服务器时又突然报错cuda不可用,输入nvidia-smi检查,报错如题。想重启 Docker 容器中,通常需要在。尝试 exit 退出容器再进入:无效。等字样,那么是在某种虚拟化环境中。,那么说明没有虚拟化。但是文中

文章图片
#linux#深度学习#运维
【资源】stable diffusion常用checkpoint

翻墙下载实在太慢了,还不稳定,就把常用的一些checkpoint传网盘了,需要自取~

文章图片
【复现】FreeU以及结合stable diffusion

才发现AnimateDiff更新v3了,以及又发了篇CVPR的改进工作:在这个版本中,我们通过域适配器LoRA对图像模型进行了微调,以便在推理时具有更大的灵活性。实现了两个(RGB图像/scribble) SparseCtrl编码器,可以采用固定数量的条件映射来控制生成过程。域适配器是一个在训练视频数据集的静态帧上进行训练的LoRA模块。这个过程是在训练运动模块之前完成的,并帮助运动模块专注于运动

文章图片
#人工智能
【思路】stable diffusion应用场景细分及实现设想

通过调整风格编码或其他控制参数,可以对生成的姿势序列进行精确的控制,以满足特定的音乐风格要求。通过使用稳定扩散,可以根据音频特征来引导网络生成相应的姿势,并确保姿势序列与音频的节奏、情感或其他特征相匹配。表情动画生成:结合人脸姿势和表情建模以及表情特征,生成具有逼真和连贯表情的动画序列。姿势合成和转换:根据生成的姿势序列,可以进行后处理和优化,确保流畅和连贯性。可控性参数:提供一些可调整的参数,如

文章图片
【nvidia-smi】Failed to initialize NVML: Driver/library version mismatch

这意味着系统中安装的驱动包与正在使用的内核模块版本不匹配,导致了 GPU 驱动问题。可以看到目前系统安装的 NVIDIA 驱动包版本是。,但是内核模块显示的版本是。

文章图片
#linux#运维#服务器
【debug】nvidia-smi:Failed to initialize NVML: Unknown Error

上执行 Docker 命令,因为容器本身没有权限直接重启自己。只能联系宿主机那边给重启一下容器。尚未以systemd作为初始系统启动。检查方法:ps -p 1 -o comm=今天用服务器时又突然报错cuda不可用,输入nvidia-smi检查,报错如题。想重启 Docker 容器中,通常需要在。尝试 exit 退出容器再进入:无效。等字样,那么是在某种虚拟化环境中。,那么说明没有虚拟化。但是文中

文章图片
#linux#深度学习#运维
【nvidia-smi】Failed to initialize NVML: Driver/library version mismatch

这意味着系统中安装的驱动包与正在使用的内核模块版本不匹配,导致了 GPU 驱动问题。可以看到目前系统安装的 NVIDIA 驱动包版本是。,但是内核模块显示的版本是。

文章图片
#linux#运维#服务器
【扩散模型】数学基础和原理解析

其中 time_embedding 和 text_embedding 都是不变的,在每一个块里边都对模型提供当前Unet所处time信息以及全局text的指导信息(就是prompt),Resnet 中 xx_embeding 的生效方式就是直接加上去(简单粗暴),Transformer 中执行交叉注意力来使用指导信息 xx_embeding,大部分区域中 time_embeding 和 text_

文章图片
#人工智能#深度学习
【思路】stable diffusion应用场景细分及实现设想

通过调整风格编码或其他控制参数,可以对生成的姿势序列进行精确的控制,以满足特定的音乐风格要求。通过使用稳定扩散,可以根据音频特征来引导网络生成相应的姿势,并确保姿势序列与音频的节奏、情感或其他特征相匹配。表情动画生成:结合人脸姿势和表情建模以及表情特征,生成具有逼真和连贯表情的动画序列。姿势合成和转换:根据生成的姿势序列,可以进行后处理和优化,确保流畅和连贯性。可控性参数:提供一些可调整的参数,如

文章图片
    共 14 条
  • 1
  • 2
  • 请选择