logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLMs基础学习(七)DeepSeek专题(2)

DeekSeep中的关键技术梳理:MoE、GRPO、MLA、E

文章图片
#DeepSeek
剑指offer笔记(十) 第63题至第68题 完结篇

剑指offer笔记(六) 第40题至第46题 完结篇前言一、JZ63 股票的最大利润二、JZ64 求 1 + 2 + ... + n三、JZ65 不用加减乘除做加法四、JZ66 构建乘积数组五、JZ67 把字符串转换成整数六、JZ68-1 二叉搜索树的最近公共祖先七、JZ68-2 二叉树的最近公共祖先八、总结前言这次主要记录剑指offer的7道题,主要使用的语言是python,下面将对这7道题的一

文章图片
#python#算法#leetcode
2024-12-19-sklearn学习(18)无监督学习-高斯混合模型 残云归太华,疏雨过中条。

sklearn学习(18)无监督学习-高斯混合模型残云归太华,疏雨过中条。

文章图片
#sklearn#学习#人工智能 +2
kaggle 数据集下载

参考了好多帖子,使用命令行下载数据集非常地费劲,最好的办法还是在网站上直接下载,不过除了注册外需要完成 手机号的验证*,下面的图片可以供大家参考。

文章图片
#开发语言#学习#深度学习
直观地、透彻地理解RNN、LSTM与Attention,这三种结构

这三个结构(RNN,LSTM和Attention)的理解大多是使用图框进行通俗易懂的理解,至于具体的数学公式就不多赘述了,我需要有一个清晰地认识,至少我用到了LSTM以及Attention,我必须搞明白这是什么样的结构,这些结构在时间尺度上延展,有利于解决带有时序性质的问题。...

文章图片
#rnn#lstm#深度学习
2024-12-26 chrome浏览器的F12 功能(简介) 非常好用的工具

chrome浏览器的F12 功能(简介) 非常好用的工具

文章图片
#chrome#前端#学习
MATLAB/Simulink 通信原理及仿真学习(二)

MATLAB/Simulink 通信原理及仿真学习(二)

文章图片
#matlab#学习#开发语言 +1
2024-12-29-sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现 今夜偏知春气暖,虫声新透绿窗纱。

sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现今夜偏知春气暖,虫声新透绿窗纱。

文章图片
#sklearn#学习#机器学习 +2
LLMs基础学习(七)DeepSeek专题(3)

DeepSeek模型中的一些技术,归一化(Batch Norm、Layer Norm和RMS Norm),动态的Dynamic Tanh(DyT),多令牌预测(MTP)。

文章图片
    共 14 条
  • 1
  • 2
  • 请选择