logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

昇思25天学习打卡营第9天|保存与加载

上一章节主要介绍了如何调整超参数,并进行网络模型训练。在训练网络模型的过程中,实际上我们希望保存中间和最后的结果,用于微调(fine-tune)和后续的模型推理与部署,本章节我们将介绍如何保存与加载模型。

文章图片
#学习#深度学习
昇思25天学习打卡营第1天|昇思平台介绍

本人java程序员,在接触这个课程之前,在B站学习过李沐的深度学习课程视频,对于深度学习的概念有简单的认识,但是对于其原理并不了解,也不知道如何解决实际问题。

文章图片
#学习
昇思25天学习打卡营第6天|网络构建

当我们定义神经网络时,可以继承nn.Cell类,在__init__方法中进行子Cell的实例化和状态管理,在construct方法中实现Tensor操作。construct意为神经网络(计算图)构建,相关内容详见使用静态图加速。nn.ReLU(),nn.ReLU(),构建完成后,实例化Network对象,并查看其结构。Network<我们构造一个输入数据,直接调用模型,可以获得一个十维的Tenso

文章图片
#深度学习
昇思25天学习打卡营第10天|使用静态图加速

支持构建和计算同时发生,是mindSpore的默认模式,优点:是实时得到中间结果的值,方便调试,缺点: 所有节点都需要被保存,导致难以对整个计算图进行优化。

文章图片
#学习#深度学习
昇思25天学习打卡营第2天|昇思平台快速入门

本人java程序员,在接触这个课程之前,在B站学习过李沐的深度学习课程视频,对于深度学习的概念有简单的认识,但是对于其原理并不了解,也不知道如何解决实际问题。

文章图片
#学习
昇思25天学习打卡营第13天|应用实践-热门LLM及其他AI应用-基于MindNLP+MusicGen生成自己的个性化音乐

MusicGen是来自Meta AI的Jade Copet等人提出的基于单个语言模型(LM)的音乐生成模型,能够根据文本描述或音频提示生成高质量的音乐样本,相关研究成果参考论文《MusicGen直接使用谷歌的及其权重作为文本编码器模型,并使用及其权重作为音频压缩模型。MusicGen解码器是一个语言模型架构,针对音乐生成任务从零开始进行训练。MusicGen 模型的新颖之处在于音频代码的预测方式。

文章图片
#学习#人工智能#深度学习
昇思25天学习打卡营第7天|函数式自动微分

神经网络的训练主要使用反向传播算法,模型预测值(logits)与正确标签(label)送入损失函数(loss function)获得loss,然后进行反向传播计算,求得梯度(gradients),最终更新至模型参数(parameters)。自动微分能够计算可导函数在某点处的导数值,是反向传播算法的一般化。自动微分主要解决的问题是将一个复杂的数学运算分解为一系列简单的基本运算,该功能对用户屏蔽了大量

文章图片
#深度学习
昇思25天学习打卡营第12天|应用实践-自然语言处理-RNN实现情感分类

最后我们设计一个预测函数,实现开头描述的效果,输入一句评价,获得评价的情感分类。将输入句子进行分词;使用词表获取对应的index id序列;index id序列转为Tensor;送入模型获得预测结果;打印输出预测结果。最后我们预测开头的样例,可以看到模型可以很好地将评价语句的情感进行分类。

文章图片
#学习#自然语言处理#rnn +1
昇思25天学习打卡营第8天|模型训练

从网络构建中加载代码,构建一个神经网络模型。nn.ReLU(),nn.ReLU(),超参(Hyperparameters)是可以调整的参数,可以控制模型训练优化的过程,不同的超参数值可能会影响模型训练和收敛速度。wt1wt−η1n∑x∈B∇lxwtwt1​wt​−ηn1​x∈B∑​∇lxwt​公式中,nnn是批量大小(batch size),ηηη是学习率(learning rate)。另外,wt

文章图片
#深度学习
昇思25天学习打卡营第11天|应用实践-自然语言处理-LSTM+CRF序列标注

序列标注指给定输入序列,给序列中每个Token进行标注标签的过程。序列标注问题通常用于从文本中进行信息抽取,包括分词(Word Segmentation)、词性标注(Position Tagging)、命名实体识别(Named Entity Recognition, NER)等。输入序列清华大学座落于首都北京输出标注BIIIOOOOOBI如上表所示,清华大学和北京是地名,需要将其识别,我们对每个输

文章图片
#学习#自然语言处理#lstm +1
到底了