logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习之网格搜索调参sklearn

而是通过选择每一个超参数的一个随机值的特定数量的随机组合,这个方法有两个优点:相比于整体参数空间,可以选择相对较少的参数组合数量。RandomizedSearchCV的使用方法其实是和GridSearchCV一致的,但它以随机在参数空间中采样的方式代替了GridSearchCV对于参数的网格搜索,在对于有连续变量的参数时,RandomizedSearchCV会将其当做一个分布进行采样进行这是网格搜

文章图片
#sklearn#机器学习#python
机器学习之验证方式理解

简单交叉验证方法:将原始数据集随机划分成训练集和验证集两部分。比如,将样本按照70%~30%的比例分成两部分,70%的样本用于训练模型;30%的样本用于模型验证。缺点:(1)数据都只被所用了一次,没有被充分利用(2)在验证集上计算出来的最后的评估指标与原始分组有很大关系。代码k折交叉验证 为了解决简单交叉验证的不足,提出k-fold交叉验证。1、首先,将全部样本训练集划分成k个大小相等的样本子集;

文章图片
#大数据
箱线图,QQ图,核密度图,直方图学习及Python代码

直方图(y轴为频率/组距)就是绘制数据的分布(加窗平滑后曲线为概率密度曲线),以块状图形式给出。绘制单变量的数据分布曲线图(概率密度图),图面积为1。可以看出数据的分布状况,可以理解为对直方图的加窗平滑处理。1:检测异常值:(导入工业蒸汽训练数据第一列)Python实例(sns库boxplot)Python代码原理解析 (注释中含解析)2:比较同类型数据的分布状况定性对比。可以看出在下边缘之下的全

文章图片
#学习
天猫用户复购预测之特征工程构建1

数据内存压缩(对源码这部分有一定的修改,鉴于内存原因)特征构建2词袋模型,词的嵌入以及模型融合的特征构建。

#大数据
双因素方差分析之Python实例

不同教育程度的事后多重比较和性别的单独效应(结论在注释里)3:查看数据分布:通过绘制箱线图,检测是否有异常点。进行方差分析的条件检验:正态性和方差齐性检验。经检测:p值均大于0.05,符合显著性要求。2:转成DataFrame格式并查看。绘图查看两个因素之间是否存在交互作用。结论:存在双因素交互作用。

文章图片
#python#开发语言
决策树之基尼指数理解

基尼指数和信息熵都是用来描述系统混乱度的量数学形式不一样,干的事是一样的不纯度(impurity)--GINI系数:(不纯度就是混乱度)公式 例子(与信息熵干的是一件事) 决策树模型理解二、决策树的学习(训练)过程一棵决策树的生成过程主要分为以下3个部分:特征选择:特征选择是指从训练数据中众多的特征中选择一个特征作为当前节点的分裂标准,如何选择特征有着很多不同量化评估标准标准,从而衍生出不同的决策

文章图片
#决策树#机器学习#人工智能
应用统计学方差分析之单因素方差分析原理解析(含Python代码)

所以,当给定显著性水平为α时,F的拒绝域为F>Fα(c-1,nT-c)。注:现实中当用到方差分析时候,一定是两组数据很相似,所以用到方差分析,若两组数据差异均值方差较大,则仅通过均值定性判断,就可以了。已知因变量是分数,因素是配方,水平为3,具有相同的样本容量8。现在假定一个因素B具有c个水平的因变量进行方差分析检验,例如上面提到的工厂轧制设备是因素,分别试验轧制了10块板材是水平。将组间方差与组

文章图片
#java#开发语言
机器学习之交叉验证汇总及其Python代码

总结思想:进行交叉验证目的是为了充分利用训练数据,最大程度利用训练数据,以获得一个较好的模型,防止模型欠拟合或者过拟合。交叉验证是什么?在模型建立中,通常有两个数据集:训练集(train)和测试集(test)。训练集用来训练模型;测试集是完全不参与训练的数据,仅仅用来观测测试效果的数据。一般情况下,训练的结果对于训练集的拟合程度通常还是挺好的,但是在测试集总的表现却可能不行。比如下面的例子:图一的

文章图片
#python#机器学习#深度学习
机器学习之网格搜索调参sklearn

而是通过选择每一个超参数的一个随机值的特定数量的随机组合,这个方法有两个优点:相比于整体参数空间,可以选择相对较少的参数组合数量。RandomizedSearchCV的使用方法其实是和GridSearchCV一致的,但它以随机在参数空间中采样的方式代替了GridSearchCV对于参数的网格搜索,在对于有连续变量的参数时,RandomizedSearchCV会将其当做一个分布进行采样进行这是网格搜

文章图片
#sklearn#机器学习#python
量化交易策略之股票数据分析(Python)

4:假如从2010 1.1 开始, 每月第一个交易日买入一手股票,每年最后一个交易日卖出所有股票, 到今天为止,我们受益如何?4:假如从2010 1.1 开始, 每月第一个交易日买入一手股票,每年最后一个交易日卖出所有股票, 到今天为止,我们受益如何?其次,读取k线数据,并保存下来,然后重新读取并完成目标2。3:输出该股票所有开盘比前日收盘跌幅超过2%的日期。3:输出该股票所有开盘比前日收盘跌幅超

文章图片
#python#数据分析#机器学习
    共 25 条
  • 1
  • 2
  • 3
  • 请选择