logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MCMC和泊松过程

马尔可夫链(Markov Chain)是一种描述随机过程(Stochastic Process)的数学模型,具有“无记忆性”(Markov Property),即未来状态只依赖于当前状态,而与过去状态无关。马尔可夫链广泛应用于物理学、生物学、经济学、计算机科学等领域,是随机过程理论中的基础工具之一。以下是马尔可夫链的详细介绍:马尔可夫链是一组随机变量 ( {X_n, n \in T} ),其中:对

文章图片
#机器学习
机器学习—学习曲线

初始阶段,训练集上的性能指标可能较低,随着样本数量的增加,模型逐渐学习到数据的模式和特征,导致性能指标逐渐提升。反之,如果两者的性能都很差,则说明模型欠拟合,需要增加更多的训练数据或改变模型的架构来提高性能。如果模型的训练误差和验证误差都很高,则说明数据集中可能存在偏差,可以通过数据增强、数据清洗等方法来提高模型的性能。通过观察训练集曲线和验证集曲线的变化情况,我们可以了解模型在不同训练集样本数量

文章图片
#机器学习#人工智能
SHAP值理论(一)

交互 SHAP 值帮助我们理解特征之间的交互作用。在这个例子中,A、B、C 两两之间都存在协同效应,即他们一起打车时,对车费的贡献比单独贡献之和更大。发现特征之间的协同或对抗效应:例如,某些特征组合可能对模型输出的影响更大。解释复杂模型:帮助理解模型如何利用特征之间的交互作用进行预测。优化特征工程:识别重要的特征组合,改进模型性能。通过交互 SHAP 值,我们可以更全面地理解特征之间的关系,而不仅

#机器学习
SHAP值理论(二)

颜色编码会显示一定的交互性,比如如果颜色特征的变化导致 SHAP 值的变化趋势改变,说明这两个特征之间存在交互作用,也会显示出一定的交互趋势,但是感觉不如直接看交互效应,如果交互效应很大,看这个图可能还有点用。是 SHAP(SHapley Additive exPlanations)工具包中的一种可视化方法,用于分析。SHAP Dependence Plot没有展示交互作用,主要获取的还是正/负向

文章图片
#机器学习#人工智能
R语言代码中文乱码解决方法尝试

一、Rstudio相关设置改成UTF-8【Tools → Global Options → Default text encoding】三、数据文本要更改为UTF-8编码,工具notepad++,操作:Encoding → Convert to UTF-8,保存,参考。四、读取数据时,在read.csv或其他读取函数中,添加读取文件编码的参数 fileEncoding = "UTF8。二、Rstu

文章图片
#r语言#开发语言
MathType安装

1、安装软件安装软件参考链接控制面板-卸载程序-卸载原来安装的mathtype安装mathtype,安装路径为D:\Program Files (x86)\MathType2、配置wps2.1复制文件放入startup中从D:\Program Files (x86)\MathType\MathPage\32下复制mathpage从D:\Program Files (x86)\MathType\Of

文章图片
#其他
Bagging和Boosting算法

一种方法(集成学习方法大致分为Boosting和Bagging方法,两个方法的不同请参考[10]),集成学习的大致思路是训练多个弱模型打包起来组成一个强模型,强模型的性能要比单个弱模型好很多(三个臭皮匠顶一个诸葛亮。注意:这里的弱和强是相对的),其中的弱模型可以是决策树、SVM等模型,在随机森林中,弱模型选用决策树。在训练阶段,随机森林使用bootstrap采样从输入训练数据集中采集多个不同的子训

文章图片
#数据挖掘#人工智能
到底了