logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【昇思技术公开课笔记-大模型】Bert理论知识

2018年Google发布了BERT(来自Transformer的双向自编码器)预训练模型,旨在通过联合左侧和右侧的上下文,从未标记文本中预训练出一个深度双向表示模型。因此,BERT可以通过增加一个额外的输出层来进行微调,就可以达到为广泛的任务创建State-of-the-arts 模型的效果,比如QA、语言推理任务。当时将预训练模应用于下游任务的策略通常有两种:基于特征的(feature-bas

文章图片
#bert#人工智能
【昇思25天学习打卡营打卡指南-第十六天】K近邻算法实现红酒聚类

K近邻算法(K-Nearest-Neighbor, KNN)是一种用于分类和回归的非参数统计方法,最初由 Cover和Hart于1968年提出(Cover等人,1967),是机器学习最基础的算法之一。它正是基于以上思想:要确定一个样本的类别,可以计算它与所有训练样本的距离,然后找出和该样本最接近的k个样本,统计出这些样本的类别并进行投票,票数最多的那个类就是分类的结果。KNN的三个基本要素:K值,

文章图片
#学习#近邻算法#聚类
【昇思25天学习打卡营打卡指南-第二十天】DCGAN生成漫画头像

在下面的教程中,我们将通过示例代码说明DCGAN网络如何设置网络、优化器、如何计算损失函数以及如何初始化模型权重。在本教程中,使用的共有70,171张动漫头像图片,图片大小均为96*96。

文章图片
#学习
【CANN训练营】基于CANN8.0.0.alpha003学习Ascend C上Add算子基于自定义算子工程的算子开发

"ND"],"type": ["fp16"},"ND"],"type": ["fp16"],"ND"],"type": ["fp16"使用msopgen生成工程项目文件-i:算子原型定义文件add_custom.json所在路径。代表算子在AI Core上执行,<soc_version>*为昇腾AI处理器的型号。<soc_version>可以通过命令查看昇腾AI处理器的型号AddCustom├──

#学习#c语言#chrome
【CANN训练营】基于CANN8.0.0.alpha003学习Ascend C上Add算子基于Kernel直调工程的算子开发

核函数实现文件:add_custom.cpp调用算子的应用程序:main.cpp。输入数据和真值数据生成脚本文件:gen_data.py。验证输出数据和真值数据是否一致的验证脚本:verify_result.py。编译cpu侧或npu侧运行的算子的编译工程文件:CMakeLists.txt。编译运行算子的脚本:run.sh。

#学习#c语言#数据库
【CANN训练营】在CANN8.5上体验Hello World开启Ascend C学习

Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,兼具开发效率和运行性能。基于Ascend C编写的算子程序,通过编译器编译和运行时调度,运行在昇腾AI处理器上。使用Ascend C,开发者可以基于昇腾AI硬件,高效的实现自定义的创新算法。您可以通过了解更详细的内容。Ascend C提供多层级API,满足多维场景算子开发诉求。

#c语言#学习#开发语言 +1
【CANN训练营】在CANN8.5上体验Hello World开启Ascend C学习

Ascend C是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,兼具开发效率和运行性能。基于Ascend C编写的算子程序,通过编译器编译和运行时调度,运行在昇腾AI处理器上。使用Ascend C,开发者可以基于昇腾AI硬件,高效的实现自定义的创新算法。您可以通过了解更详细的内容。Ascend C提供多层级API,满足多维场景算子开发诉求。

#c语言#学习#开发语言 +1
【Datawhale组队学习-动手学大模型应用全栈开发】大模型微调实战

MAX_LENGTH = 384 # Llama分词器会将一个中文字切分为多个token,因此需要放开一些最大长度,保证数据的完整性def process_func(example) : MAX_LENGTH = 384 # Llama分词器会将一个中文字切分为多个token,因此需要放开一些最大长度,保证数据的完整性 instruction = tokenizer(f" {

#学习#python#深度学习
【Datawhale组队学习-动手学大模型应用全栈开发】大模型开发基础知识

为了对人类语言的内在规律进行建模,研究者们提出使用语言模型(language model)来准确预测词序列中 下一个词 或者 缺失的词 的概率。

#学习#python
【Datawhale课程笔记-简单学点大模型】模型架构

与仅仅根据频率进行拆分不同,一个更“有原则”的方法是定义一个目标函数来捕捉一个好的分词的特征,这种基于目标函数的分词模型可以适应更好分词场景,Unigram model就是基于这种动机提出的。您可能已经注意到,根据定义,标记的嵌入不依赖于其在序列中的位置,因此两个句子中的𝗆𝗈𝗎𝗌𝖾将具有相同的嵌入,从而在句子位置的角度忽略了上下文的信息,这是不合理的。然而,自然语言并不是以标记序列的形式

    共 25 条
  • 1
  • 2
  • 3
  • 请选择