logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习代码|Multi-Headed Attention (MHA)多头注意力机制的代码实现

定义多头自注意力机制中的线性变换操作(在自注意力机制中,需要将输入的特征向量通过线性变换映射到不同的空间中,以便进行多头注意力的计算。将向量拆分为给定数量的头部,以获得多头注意。'''d_model:模型输入的特征维度;heads:注意力机制中的头数;d_k:每个头部中以向量表示的维度数;bias:是否使用偏置项'''#线性变换的线性层,输入为d_model,输出为heads*d_k'''

文章图片
#深度学习#人工智能#pytorch +1
pix2pix:使用条件对抗网络进行图像到图像的转换

pix2pix模型本质上是cGAN的一种特殊实现。一种Image-to-Image的实现,是一种基于GAN的图像到图像翻译架构,生成部分G用U-Net代替Encoder-Decoder。文章的主要目的是开发一个通用框架来解决图像-图像转换(从像素预测像素)的所有问题:非结构化: 图像到图像的转换问题通常被表述为每像素分类或回归。这些公式将输出空间视为“非结构化”,因为每个输出像素被认为有条件地独立

文章图片
#AIGC#人工智能#深度学习 +1
李沐《动手学深度学习》循环神经网络 经典网络模型

系列文章李沐《动手学深度学习》预备知识 张量操作及数据处理李沐《动手学深度学习》预备知识 线性代数及微积分李沐《动手学深度学习》线性神经网络 线性回归李沐《动手学深度学习》线性神经网络 softmax回归李沐《动手学深度学习》多层感知机 模型概念和代码实现李沐《动手学深度学习》多层感知机 深度学习相关概念李沐《动手学深度学习》深度学习计算李沐《动手学深度学习》卷积神经网络 相关基础概念李沐《动手学

文章图片
#深度学习#人工智能#pytorch +1
【论文精读】ResNet: Deep Residual Learning for Image Recognition 用于图像识别的深度残差学习

更深层次的神经网络更难训练。提出了一个残差学习框架,以简化比以前使用的网络更深的网络训练。

文章图片
#学习#算法#深度学习 +1
【每日算法】理论: 扩散模型+深度学习基础 刷题:力扣哈希表回顾

去噪扩散隐式模型(DDIM)是一类更有效的迭代隐式概率模型,具有与DDPM相同的训练程序,但是它不再限制扩散过程必须是一个马尔卡夫链,这使得DDIM可以采用更小的采样步数来加速生成过程,DDIM的另外是一个特点是从一个随机噪音生成样本的过程是一个确定的过程(中间没有加入随机噪音)。核心思路:定义一个数组叫做record用于遍历增加记录字符串s里字符出现的次数,然后遍历减少记录字符串t里字符出现的次

文章图片
#算法#leetcode#深度学习 +2
统计计算五|MCMC( Markov Chain Monte Carlo)

系列文章目录统计计算一|非线性方程的求解统计计算二|EM算法(Expectation-Maximization Algorithm,期望最大化算法)统计计算三|Cases for EM统计计算四|蒙特卡罗方法(Monte Carlo Method)文章目录系列文章目录一、基本概念(一)马尔科夫链1、定义2、性质3、常返4、平稳分布(二)MCMC原理1、核心思想2、连续状态3、MCMC估计期望的步骤

文章图片
#学习
huggingface学习 | 云服务器使用git-lfs下载huggingface上的模型文件

点击clone repository,可以发现提供了两种下载方式,方式一为HTTPS,代码如下,然而国内使用代理访问的时候采用这种方式会报错:Failed to connect to huggingface.co port 443 after 127293 ms: Couldn’t connect to server。如果直接输入:git clone git@hf.co:runwayml/stab

文章图片
#服务器#git#AIGC +1
T2I-Adapter:学习适配器为文本到图像扩散模型挖掘更多可控能力

注意,Fc的维度与UNet降噪器的编码器中的中间特征Fenc = {Fe1nc, Fe2nc, Fe3nc, Fe4nc}相同。在第一阶段,SD 训练了一个自动编码器,它可以将图像 X0 转换为潜在空间,然后重建它们。扩散模型中的时间嵌入是采样的重要条件。T2I-Adapter 具有良好的泛化性,可以支持各种结构控制,包括草图、深度图、语义分割图和关键姿势。因此,为了加强adapter的训练,采用

文章图片
#人工智能#深度学习#AIGC +1
【每日算法】理论:常见AIGC模型; 刷题:力扣单调栈

图像编码器VAE Encoder会将输入的图像转换为低维的Latent特征,而文本信息则会通过CLIP Text Encoder模型进行编码,处理过后的文本信息和图像信息会输入到图像优化模块中,图像优化模块进行优化迭代后,将其输出的低维Latent特征输入回图像解码器(VAE Decoder)中,重建成像素级图。这道题需要分别寻找元素右边和左边的最大元素来计算雨水面积,由于单调栈的作用是寻找一个元

文章图片
#算法#AIGC#leetcode +2
    共 102 条
  • 1
  • 2
  • 3
  • 11
  • 请选择