logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习系列38:Dalle2模型

diffusion模型从原始图片出发增加噪声,然后再尝试重建

#深度学习#pytorch#人工智能
深度学习系列86:funasr

【代码】深度学习系列86:funasr。

#深度学习
深度学习系列48:超分模型Real-ESRGAN

首先训练数据使用了2个first-order:最后一步加入了振铃和过冲现象:将CNN用到超分领域的第一篇文章:论文中卷积核和通道数的实验设置为:SRGAN将GAN引入超分领域,用于解决如下问题:1)高频细节(high-frequency details) 的丢失,整体图像过于平滑/模糊;2)与人的视觉感知不一致,超分图像的精确性与人的期望不匹配(人可能更关注前景,而对背景清晰度要求不高)。提出如下

#深度学习#计算机视觉#人工智能
强化学习系列13:基于pytorch的框架“天授”

1. 基本架构1.1 架构图底层实现的关系如下:1.2 组件介绍(重要)1.2.1 数据组(Batch)数据组是平台内部各个模块之间传递数据的基本数据结构。它支持任意关键字初始化、对任意元素进行修改,以及嵌套调用和格式化输出的功能。如果数据组内各个元素值的第0维大小相等,还可支持切分(split)操作。数据组保留了如下7个关键字:obs:t 时刻的观测值 oto_tot​;act: t 时刻策略采

运筹系列93:VRP精确算法

MTZ是Miller-Tucker-Zemlin inequalities的缩写。除了定义是否用到边xij​外,还需要定义一个ui​用来表示此时车辆的当前载货量。注意这里x变量需要定义为有向。MTZ的求解速度不快,10个点3辆车都需要3秒左右时间。

文章图片
#算法#java#javascript
python系列24:用python爬取ajax请求

使用F12打开chrome的开发者界面,然后执行一遍页面,我们能看到:点击执行时间最长的ajax请求,我们就能看到真实的请求(headers里)和参数(payload里)了url:Header中的request urlheaders:Header中的request headersparams:Payload中的Query String Parametersdata:Payload中的From Da

#python#ajax#爬虫
强化学习系列12:使用julia训练深度强化模型

1. 介绍使用flux作为深度学习的框架,入门代码:using ReinforcementLearningrun(E`JuliaRL_BasicDQN_CartPole`)显示:This experiment uses three dense layers to approximate the Q value.The testing environment is CartPoleEnv.Agent

深度学习系列49:面部迁移

一般地,deepfake可划分为如下四类:重现(reenactment),替换(replace),编辑(editing)和合成(synthesis)。针对人脸的4种类别展示如下:重现和替换的区别是:重现相当于安吉拉宝贝上阵,但是脸部表情按照替身去演绎;替换则相当于替身直接上阵,然后换成安吉拉宝贝的脸。核心技术:第一种是使用自动编码器然后操纵中间的latent向量来达到目的;第二种是使用GAN进行迁

#深度学习#人工智能#计算机视觉
深度学习系列48:超分模型Real-ESRGAN

首先训练数据使用了2个first-order:最后一步加入了振铃和过冲现象:将CNN用到超分领域的第一篇文章:论文中卷积核和通道数的实验设置为:SRGAN将GAN引入超分领域,用于解决如下问题:1)高频细节(high-frequency details) 的丢失,整体图像过于平滑/模糊;2)与人的视觉感知不一致,超分图像的精确性与人的期望不匹配(人可能更关注前景,而对背景清晰度要求不高)。提出如下

#深度学习#计算机视觉#人工智能
深度学习系列84:使用kokoros生成tts语音

Kokoro TTS 以其轻量级设计和高效性能脱颖而出。作为一个仅有82M参数的文本转语音(TTS)模型,Kokoro 在 TTS Spaces Arena 中击败了许多参数规模更大的竞争对手,成为语音合成领域的一颗新星。

#深度学习#人工智能
    共 124 条
  • 1
  • 2
  • 3
  • 13
  • 请选择