
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
LLMs基础学习(五)模型微调专题(中)
LLMs基础学习(五)模型微调专题(中)Adapter类微调、Prefix类微调、LoRA

LLMs基础学习(七)DeepSeek专题(2)
DeekSeep中的关键技术梳理:MoE、GRPO、MLA、E

自然语言处理(NLP)-总览图学习
自然语言处理(NLP)-总览图学习

kaggle 数据集下载
参考了好多帖子,使用命令行下载数据集非常地费劲,最好的办法还是在网站上直接下载,不过除了注册外需要完成 手机号的验证*,下面的图片可以供大家参考。

直观地、透彻地理解RNN、LSTM与Attention,这三种结构
这三个结构(RNN,LSTM和Attention)的理解大多是使用图框进行通俗易懂的理解,至于具体的数学公式就不多赘述了,我需要有一个清晰地认识,至少我用到了LSTM以及Attention,我必须搞明白这是什么样的结构,这些结构在时间尺度上延展,有利于解决带有时序性质的问题。...

2024-12-26 chrome浏览器的F12 功能(简介) 非常好用的工具
chrome浏览器的F12 功能(简介) 非常好用的工具

MATLAB/Simulink 通信原理及仿真学习(二)
MATLAB/Simulink 通信原理及仿真学习(二)

2024-12-29-sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现 今夜偏知春气暖,虫声新透绿窗纱。
sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现今夜偏知春气暖,虫声新透绿窗纱。

LLMs基础学习(七)DeepSeek专题(3)
DeepSeek模型中的一些技术,归一化(Batch Norm、Layer Norm和RMS Norm),动态的Dynamic Tanh(DyT),多令牌预测(MTP)。

LLMs基础学习(七)DeepSeek专题(2)
DeekSeep中的关键技术梳理:MoE、GRPO、MLA、E








