logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

特征选择----皮尔逊(Pearson)相关系数

1、皮尔逊(Pearson)相关系数1、协方差能完美的解释两个变量之间相关的方向,但在解释强度上却不太行,举个例子:每个变量都是有量纲的,这里假设变量x的量纲为距离,可以是米,也可以是千米,甚至可以是光年,针对协方差的量纲问题,统一除以同样的量纲就可以搞定。正态分布标准化需要除以标准偏差,标准偏差的量纲与变量一致,这样就可以消除量纲了。让每一个变量x与变量x的均值的差,都除以x的标准偏差Sx,变量

#python
机器学习---决策树(ID3,C5.0,CART)

决策树学习与总结 (ID3, C4.5, C5.0, CART)1. 什么是决策树2. 决策树介绍3. ID3 算法信息熵信息增益缺点4. C4.5算法5. C5.0算法6. CART算法基尼指数 Gini指标7. 连续属性离散化8. 过拟合的解决方案9. 例子1 - 脊椎动物分类10. 例子21. 准备数据及读取2. 决策树的特征向量化3. 决策树训练4. 决策树可视化5 预测结果...

#决策树#机器学习#算法
1、json文件转csv文件

目录单个json转csv文件并保存多个json文件转CSV文件并保存知识点:json读操作split(".")[0]表示分割".",[0]表示取第一个单个json转csv文件并保存import jsonimport pandas as pdjson1="C:/Users/S/Desktop/不同数据集U_RATIO(BP)/json/1.json"with open(json1, 'r', enc

#python
机器学习python库--seaborn

seaborn简介seaborn是基于matplotlib的数据可视化库。它在matplotlib的基础上,进行了更高级的封装,从而使得绘图更加容易,不需要经过大量的调整,就能使图像变得精致。seaborn的几个鲜明特点如下:>绘图接口更加集成,可以通过少量的参数设置实现大量封装绘图。>多数图表具有统计学含义,例如分布、关系、统计、回归等>对pandas和numpy数据类型支持非

#python#机器学习#人工智能
Hxbase shell 基本操作命令

import happybaseconnection = happybase.Connection('hostname')table = connection.table('table-name')table.put(b'row-key', {b'family:qual1': b'value1',b'family:qual2': b'value2'})row = table.row(b'row-k

#hbase#linux#hadoop
暂无文章信息