logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型应用开发-基础理论

大模型应用开发:1.CoT2.零样本推理能力3.ToT4.Toolformer5.Plan and Solve6.ReAct7.AgnetVerse8.AutoGen

文章图片
大模型应用开发-基础理论

大模型应用开发:1.CoT2.零样本推理能力3.ToT4.Toolformer5.Plan and Solve6.ReAct7.AgnetVerse8.AutoGen

文章图片
大模型训练-流水线并行/张量并行/ZeRO/Prefix/Prompt tunning/LoRA

大模型训练:1.流水线并行2.张量并行3.ZeRO4.Prefix/Prompt tunning5.LoRA

文章图片
大模型训练-流水线并行/张量并行/ZeRO/Prefix/Prompt tunning/LoRA

大模型训练:1.流水线并行2.张量并行3.ZeRO4.Prefix/Prompt tunning5.LoRA

文章图片
大模型基础理论-BPE/DeepNorm/FlashAttention/GQA/RoPE

大模型基础理论介绍:1.BPE分词2.DeepNorm3.FlashAttention4.GQA5.RoPE

文章图片
#语言模型#transformer
大模型基础理论-BPE/DeepNorm/FlashAttention/GQA/RoPE

大模型基础理论介绍:1.BPE分词2.DeepNorm3.FlashAttention4.GQA5.RoPE

文章图片
#语言模型#transformer
深度学习推荐算法模型-论文和PyTorch实现

注意,这篇文章里的代码是我按照论文所述自己写的,里面肯定有些细节没表达出来,也难免有错误,推荐看论文的原代码了解更多模型细节,如果发现代码中存在错误,麻烦在评论区指正一 AutoRec1.1 论文论文题目:《AutoRec: Autoencoders Meet Collaborative Filtering》2015 WWW论文地址:《AutoRec: Autoencoders Meet Coll

#深度学习#pytorch#推荐算法
刷题常用算法(python)

牛客ID:483622毓毓子最可爱一 图论1.1 图以及图在计算机中的表示图由节点和边组成,节点代表对现实中物体的抽象,边代表这些物体之间关系的抽象。从相互关系的层面来看,线性表和树结构都可以看做是图的特例。图中的常见术语有:有向图无向图入度出度度路径环路在理解了图的基本概念和术语之后,接下来的问题就是如何将图这种数据结构放在计算机中,使得计算机能够处理图.图在计算机中的表示有两种方法,一种是用矩

文章图片
#算法#python#蓝桥杯
机器学习模型原理及代码

目录一 什么是线性模型1.1 定义1.2 回归和分类的转换1.3 几何解释二 线性回归2.1 定义2.2 参数学习方法三 Logistic回归3.1 定义3.2 参数学习方法四 SoftMax回归4.1 定义4.2 参数学习方法五 感知机5.1 定义5.2 参数学习方法六 支持向量机6.1 定义6.2 核函数和核方法6.3 参数学习方法七 Numpy实现代码7.1 Logistic回归7.2 So

文章图片
#机器学习#scikit-learn
“华为杯”第十五届中国研究生数学建模竞赛-对恐怖袭击事件记录数据的量化分析(Python,Pandas,Scikit-learn,PyTorch,Matplotlib,seaborn)

首先先说一下编程的工具Python:编程语言Pandas:数据处理,清洗,分析的工具Scikit-learn:机器学习工具箱PyTorch:深度学习搭建神经网络,训练等的工具Matplotlib,seaborn:可视化工具一,数据集数据集中的每一行记录了一起恐怖袭击事件的信息,分为以下几部分进行了记录:GTD的标志号和日期:每一起事件发生的起讫时间等。事件信息:每一起事件的时间,地点,人物,内容,

#python
    共 19 条
  • 1
  • 2
  • 请选择