logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLMs基础学习(五)模型微调专题(中)

LLMs基础学习(五)模型微调专题(中)Adapter类微调、Prefix类微调、LoRA

文章图片
#LoRA
LLMs基础学习(七)DeepSeek专题(2)

DeekSeep中的关键技术梳理:MoE、GRPO、MLA、E

文章图片
#DeepSeek
kaggle 数据集下载

参考了好多帖子,使用命令行下载数据集非常地费劲,最好的办法还是在网站上直接下载,不过除了注册外需要完成 手机号的验证*,下面的图片可以供大家参考。

文章图片
#开发语言#学习#深度学习
直观地、透彻地理解RNN、LSTM与Attention,这三种结构

这三个结构(RNN,LSTM和Attention)的理解大多是使用图框进行通俗易懂的理解,至于具体的数学公式就不多赘述了,我需要有一个清晰地认识,至少我用到了LSTM以及Attention,我必须搞明白这是什么样的结构,这些结构在时间尺度上延展,有利于解决带有时序性质的问题。...

文章图片
#rnn#lstm#深度学习
2024-12-26 chrome浏览器的F12 功能(简介) 非常好用的工具

chrome浏览器的F12 功能(简介) 非常好用的工具

文章图片
#chrome#前端#学习
MATLAB/Simulink 通信原理及仿真学习(二)

MATLAB/Simulink 通信原理及仿真学习(二)

文章图片
#matlab#学习#开发语言 +1
2024-12-29-sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现 今夜偏知春气暖,虫声新透绿窗纱。

sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现今夜偏知春气暖,虫声新透绿窗纱。

文章图片
#sklearn#学习#机器学习 +2
LLMs基础学习(七)DeepSeek专题(3)

DeepSeek模型中的一些技术,归一化(Batch Norm、Layer Norm和RMS Norm),动态的Dynamic Tanh(DyT),多令牌预测(MTP)。

文章图片
LLMs基础学习(七)DeepSeek专题(2)

DeekSeep中的关键技术梳理:MoE、GRPO、MLA、E

文章图片
    共 13 条
  • 1
  • 2
  • 请选择