
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DeekSeep中的关键技术梳理:MoE、GRPO、MLA、E

自然语言处理(NLP)-总览图学习

剑指offer笔记(六) 第40题至第46题 完结篇前言一、JZ63 股票的最大利润二、JZ64 求 1 + 2 + ... + n三、JZ65 不用加减乘除做加法四、JZ66 构建乘积数组五、JZ67 把字符串转换成整数六、JZ68-1 二叉搜索树的最近公共祖先七、JZ68-2 二叉树的最近公共祖先八、总结前言这次主要记录剑指offer的7道题,主要使用的语言是python,下面将对这7道题的一

sklearn学习(18)无监督学习-高斯混合模型残云归太华,疏雨过中条。

参考了好多帖子,使用命令行下载数据集非常地费劲,最好的办法还是在网站上直接下载,不过除了注册外需要完成 手机号的验证*,下面的图片可以供大家参考。

这三个结构(RNN,LSTM和Attention)的理解大多是使用图框进行通俗易懂的理解,至于具体的数学公式就不多赘述了,我需要有一个清晰地认识,至少我用到了LSTM以及Attention,我必须搞明白这是什么样的结构,这些结构在时间尺度上延展,有利于解决带有时序性质的问题。...

chrome浏览器的F12 功能(简介) 非常好用的工具

MATLAB/Simulink 通信原理及仿真学习(二)

sklearn学习(26)模型选择与评估-交叉验证:评估估算器的表现今夜偏知春气暖,虫声新透绿窗纱。

DeepSeek模型中的一些技术,归一化(Batch Norm、Layer Norm和RMS Norm),动态的Dynamic Tanh(DyT),多令牌预测(MTP)。








