logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

昇思25天学习打卡营第23天|DCGAN生成漫画头像

DCGAN(深度卷积对抗生成网络,Deep Convolutional Generative Adversarial Networks)是GAN的直接扩展。不同之处在于,DCGAN会分别在判别器和生成器中使用卷积和转置卷积层。它最早由Radford等人在论文中进行描述。判别器由分层的卷积层、BatchNorm层和LeakyReLU激活层组成。输入是3x64x64的图像,输出是该图像为真图像的概率。

文章图片
#学习
昇思25天学习打卡营第2天|快速入门

模型训练的过程主要包括正向计算、反向传播、参数优化三个部分,我们需要定义正向计算函数、反向传播函数、参数优化函数以及用于评估性能的测试函数。基于已经保存好的模型,我们可以通过加载函数来加载模型,直接使用已经训练好的成果。模型的加载主要包括两个步骤:一是重新实例化模型对象,二是将参数从磁盘中读入然后加载到的该实例对象。今天是参加昇思25天学习打卡营的第二天,学习的内容是昇思框架的要给快速入门,这里做

文章图片
#学习
昇思25天学习打卡营第7天|模型训练

今天学习的内容是如何利用前面学习的知识来实现模型训练?构建数据集。定义神经网络模型。定义超参、损失函数及优化器。输入数据集进行训练与评估。在前面的介绍中已经介绍过关于神经网络模型的定义,主要是基于mindspore.nn提供的类来进行创建。训练轮次(epoch):训练时遍历数据集的次数。批次大小(batch size):数据集进行分批读取训练,设定每个批次数据的大小。batch size过小,花费

文章图片
#学习
昇思25天学习打卡营第3天|张量Tensor

张量(Tensor)是一种类似数组、矩阵的数据结构,可以理解为支持嵌套的变长多维数组。稀疏张量是对于张量中大量存在0元素的情况下的一种压缩存储的结构。张量支持加(+)、减(-)、乘(\*)、除(/)、取模(%)、整除(//)等运算。整体来说,张量的整体用起来更像是一个的可变的多维数组,其运算符的复杂程度要低于矩阵。张量的属性包括形状、数据类型、转置张量、单个元素大小、占用字节数量、维数、元素个数和

文章图片
#学习
昇思25天学习打卡营第8天|保存与加载

本节学习的内容就是模型训练结果的保存与加载,整体内容较少。这里主要掌握两种保存的形式,一种是将模型训练后的权重参数保存为的ckpt格式,下次使用时可以创建一个相同的模型实例后直接加载即可进行推理等操作。二是同时保存模型和权重参数,这样可以实现在云端训练,在端侧进行推理,使用时不需要知道模型的结构定义。保存模型使用save_checkpoint接口,要加载模型权重,需要先创建相同模型的实例,然后使用

文章图片
#学习#人工智能#python
昇思25天学习打卡营第9天|使用静态图加速

今天学习的内容是了解动态图模式和静态图模式的区别和应用场景。1.动态图模式2.静态图模型。

文章图片
#学习#java#开发语言
昇思25天学习打卡营第13天|LSTM+CRF序列标注

从今天开始就是学习自然语言处理领域的几个实战案例。今天学习的内容是基于LSTM+CRF来实现序列标注。序列标注任务概述条件随机场(CRF)的基本原理基于LSTM+CRF实现序列标注的主要代码序列标注指给定输入序列,给序列中每个Token进行标注标签的过程。序列标注问题通常用于从文本中进行信息抽取,包括分词(Word Segmentation)、词性标注(Position Tagging)、命名实体

文章图片
#学习#lstm#人工智能
昇思25天学习打卡营第16天|ResNet50图像分类

自卷积神经网络模型取得成功以来,更深、更宽、更复杂的网络成为卷积神经网络搭建的主流。但是随着网络往更深、更宽的方向发展,人们发现模型的准确率并不能一直上升达到100%,甚至会出现下降,这种现象被称为“神经网络的退化”。神经网络退化的产生说明卷积神经网络不能够简单的使用堆叠的方法进行优化。2015年,152层深的ResNet(残差网络)的出现提出了一种新的解决方案,将训练深度扩展到的数数千层的同时保

#学习
昇思25天学习打卡营第15天|FCN图像语义分割

将底层(stride 32)的预测(FCN-32s)进行2倍的上采样得到原尺寸的图像,并与从pool4层(stride 16)进行的预测融合起来(相加),这一部分的网络被称为FCN-16s。语义在图像领域指的是图像的内容,对图片意思的理解。这里面主要学习的要点是理解的FCN模型模型的原理,模型评价指标的计算原理和方法,另外一方面是着重掌握基于mindspore进行模型开发的相关代码。在卷积过程的卷

文章图片
#学习
昇思25天学习打卡营第24天|Diffusion扩散模型

本次学习的扩散模型(Diffusion Models)主要是基于denoising diffusion probabilistic model (DDPM)的模型。DPM已经在(无)条件图像/音频/视频生成领域取得了较多显著的成果,现有的比较受欢迎的的例子包括由OpenAI主导的GLIDE和DALL-E 2、由海德堡大学主导的潜在扩散和由Google Brain主导的图像生成。

文章图片
#学习
    共 21 条
  • 1
  • 2
  • 3
  • 请选择