logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《昇思25天学习打卡营第22天|基于MindNLP+MusicGen生成自己的个性化音乐》

MusicGen是来自Meta AI的Jade Copet等人提出的基于单个语言模型(LM)的音乐生成模型,能够根据文本描述或音频提示生成高质量的音乐样本,相关研究成果参考论文《Simple and Controllable Music Generation》MusicGen直接使用谷歌的t5-base及其权重作为文本编码器模型,并使用EnCodec 32kHz及其权重作为音频压缩模型。Music

文章图片
#学习#人工智能#nlp
《昇思25天学习打卡营第20天|LLM原理和实践》

自己输入推理数据,展示模型的泛化能力。predict("今天天气很好啊,蓝蓝的天空,白白的云")

文章图片
#学习#人工智能
《昇思25天学习打卡营第15天|计算机视觉-ShuffleNet图像分类》

ShuffleNet最显著的特点在于对不同通道进行重排来解决Group Convolution带来的弊端。通过对ResNet的Bottleneck单元进行改进,在较小的计算量的情况下达到了较高的准确率。

文章图片
#学习#计算机视觉#分类 +1
《昇思25天学习打卡营第10天|计算机视觉-FCN图像语义分割》

FCN主要用于图像分割领域,是一种端到端的分割方法,是深度学习应用在图像语义分割的开山之作。通过进行像素级的预测直接得出与原图大小相等的label map。因FCN丢弃全连接层替换为全卷积层,网络所有层均为卷积层,故称为全卷积网络。全卷积神经网络主要使用以下三种技术:卷积化:FCN模型使用卷积层来提取图像特征。与传统的CNN不同,FCN中的卷积层不使用池化层,以保持图像的空间分辨率。这使得网络能够

文章图片
#学习#计算机视觉#人工智能 +1
《昇思25天学习打卡营第23天|K近邻算法实现红酒聚类》

近邻算法(K-Nearest-Neighbor, KNN)是一种用于分类和回归的非参数统计方法,最初由 Cover和Hart于1968年提出(Cover等人,1967),是机器学习最基础的算法之一。它正是基于以上思想:要确定一个样本的类别,可以计算它与所有训练样本的距离,然后找出和该样本最接近的k个样本,统计出这些样本的类别并进行投票,票数最多的那个类就是分类的结果。

文章图片
#学习#近邻算法#聚类
《昇思25天学习打卡营第18天|生成式-CycleGAN图像风格迁移互换》

该模型一个重要应用领域是域迁移(Domain Adaptation),可以通俗地理解为图像风格迁移。其实在 CycleGAN 之前,就已经有了域迁移模型,比如 Pix2Pix ,但是 Pix2Pix 要求训练数据必须是成对的,而现实生活中,要找到两个域(画风)中成对出现的图片是相当困难的,因此 CycleGAN 诞生了,它只需要两种域的数据,而不需要他们有严格对应关系,是一种新的无监督的图像迁移网

文章图片
#学习#人工智能#生成对抗网络
《昇思25天学习打卡营第16天|生成式-GAN图像生成》

生成式对抗网络(Generative Adversarial Networks,GAN)是一种生成式机器学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。

文章图片
#学习#计算机视觉#生成对抗网络 +1
《昇思25天学习打卡营第21天|基于MobileNetv2的垃圾分类》

MobileNet网络是由Google团队于2017年提出的专注于移动端、嵌入式或IoT设备的轻量级CNN网络,相比于传统的卷积神经网络,MobileNet网络使用深度可分离卷积(Depthwise Separable Convolution)的思想在准确率小幅度降低的前提下,大大减小了模型参数与运算量。并引入宽度系数 α和分辨率系数 β使模型满足不同应用场景的需求。

文章图片
#学习#分类#人工智能
    共 26 条
  • 1
  • 2
  • 3
  • 请选择