logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

扩散模型与强化学习(7):用DPO改进音频驱动视频生成实践

本文提出了一种创新的人类偏好对齐扩散框架,用于生成音频和骨骼运动驱动的高质量肖像动画。该框架包含两个核心技术:1)针对肖像动画的定向偏好优化,通过构建人类偏好数据集优化生成结果;2)时间运动调制机制,将不同采样率的运动信号有效整合到扩散模型中,保持高频运动细节。实验表明,该方法在唇音同步、表情自然度和运动连贯性方面显著优于现有基线方法,同时提升了人类偏好评价指标。研究还发布了专门构建的肖像动画偏好

文章图片
#音视频#深度学习#人工智能
每日AIGC最新进展(84):清华大学提出高效视频理解FastVID、多伦多大学提出长时间视频理解模型Vamba、杭州电子科技大学提出反事实推理多模态大模型Bench COVER

清华大学提出高效视频理解FastVID、多伦多大学提出长时间视频理解模型Vamba、杭州电子科技大学提出反事实推理多模态大模型Bench COVER

文章图片
#AIGC
详细解读视频生成模型Wan2.1代码

这篇博客的初稿写于8个月前Wan2.1刚刚开源之际,如今Wan2.1已经成为了做视频生成方向最最常用的基础模型,据不完全统计,半年间基于Wan2.1发表的顶会顶刊就超过了100篇。这篇博客详细解读一下这篇现代视频生成模型的原理和代码。

文章图片
#人工智能#深度学习#视频生成 +1
《大型网站性能优化指南——从前端、网络、CDN到后端、大促的全链路性能优化详解》读后感和一点思考

前言:这几天拜读了阿里的这本书,这本书全栈式地讲了一个成熟稳定的大型高并发高容量系统的优化过程,读下来很有收获,也有一些自己的思考。CDN-DNS、网络部分讲的挺精彩的,值得一读的一本书。由于我是后端方向,前端的部分就没出现在这篇文章里(因为看不懂)。目录先挑剔一下本书整体结构高性能网站建设指南 12条基本准则用户体验性能指标QPS相关公式CPU利用率影响因素压测的意义QPS预估-二八法则网络同步

QML开发——PropertyAnimation属性动画元素

目录效果动图Rect1.qmlRect2.qmlRect3.qmlRect4.qmlmain.qml效果动图Rect1.qml//属性值源矩形import QtQuick 2.0Rectangle{id: rect1width: 80height: 80color: "orange"radius: 1...

常用四大最短路径算法——Floyd、Dijkstra、Bellman-Ford及其变种

Floyd算法核心思想:找到第三个点代替使两点间的距离更短核心代码就五行://flody核心for(int k=0;k<n;k++)for(int i=0;i<n;i++)for(int j=0;j<n;j++)if(M[i][j]>M[i][k]+M[k][j])...

强化学习——Sarsa Lambda找宝藏

目录在Sarsa的基础上改进的sarsa lambda算法Sarsa存在的问题改进方法2:Sarsa Lambda参考开始每天被老师抓着写周报,以后想摸鱼都摸不了,心态baozha……在Sarsa的基础上改进的sarsa lambda算法算法流程和数学推导就不写了,弄清楚lambda的含义:如果 lambda = 0, Sarsa-lambda 就是 Sarsa, ...

扩散模型与强化学习(0):专栏汇总与导航

最近强化学习在Diffusion Models得到了越来越多广泛的应用,本专栏将系统性地介绍当前Diffusion Models中实用且前沿的技术进展。

文章图片
#人工智能#深度学习
如何在服务器上并行化快速下载VFHQ数据集?A High-Quality Dataset and Benchmark for Video Face Super Resolution

虽然VFHQ是一个2022年的工作,但是数据集的质量非常高,导致三年过去了还是非常好用。那时候huggingface还没有流行,所以并没有托管到huggingface上,导致现在非常难快速下载。这篇博客提供一种并行化快速下载的方法,能够快速下载这个超大数据集。

文章图片
#服务器#运维#人工智能 +2
《图解HTTP》笔记(三)构建Web、Web安全、HTTP追加协议

这部分内容作者写的比较浅,科普文目录HTMLCSS动态HTMLCGI(Comment Gateway Interface)通用网关接口ServletXMLRSS针对Web应用的攻击模式Web应用的安全策略跨站脚本攻击SQL注入攻击OS命令注入攻击HTTP首部注入攻击/HTTP响应截断攻击邮件首部注入攻击目录遍历攻击远程文件包含漏洞...

到底了