
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习(探险者寻宝藏)
强化学习(探险者寻宝藏)
数据分析实战(基础篇):从数据探索到模型解释
本文着重介绍数据分析实战的基础知识和技巧,探索从数据探索到建模再到模型解释的完整过程。内容包含数据探索、模型建立、调参技巧、SHAP模型解释

大语言模型的简易可扩展增量预训练策略
大语言模型(LLMs)通常需要在数十亿个tokens上进行预训练,一旦有了新数据,又要重新开始训练。更有效的解决方案是增量预训练(Continue PreTraining)这些模型,这与重新训练相比可以节省大量的计算资源。然而,新数据带来的分布偏移通常会导致在旧数据上的性能下降或者对新数据的适应性不佳。

Phi-2小语言模型QLoRA微调教程
微软发布的Phi-2模型在kaggle平台上的QLoRa微调教程

广度优先搜索(模板使用)
广度优先搜索(模板使用)模板出处关于模板出处,来自这里本文仅通过例题对模板的使用进行说明。#include<cstdio>#include<cstring>#include<queue>#include<algorithm>using namespace std;const int maxn=100;bool vst[maxn][maxn]; //
在DARTS空间中进行神经架构搜索(NAS)
在DARTS空间中进行神经网络架构搜索,

时间序列模型SCINet(代码解析)
基于因果神经网络改进的SCINet长时间序列预测模型,在公共数据集上表现仅次于Nlinear

Bayesian Optimization贝叶斯优化(代码详解)
`bayesian-optimization是一个基于贝叶斯推理和高斯过程的约束全局优化包,它试图在尽可能少的迭代中找到未知函数的最值。该技术特别适合优化高成本函数。本文对其代码实现进行了解析。

神经网络超参数调整(基于ray包)
基于ray包的神经网络超参数调整,用简单的示例对使用方法以及有代表性的调参方法进行演示