logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python数据预处理--异常值处理

异常值处理异常值分析3σ原则创建数据、计算均值和标准差、筛选异常值绘制数据密度曲线利用散点图绘制出数据和异常值箱型图分析, 较准确箱型图看数据分布情况计算基本统计量和分位差计算异常值条数图表表达介绍:异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称离群点,异常值的分析也称为离群点的分析异常值分析 → 3σ原则 / 箱型图分析异常值处理方法 → 删除 / 修正填补异常值分析3σ原则介

回归分析-案例:大型促销活动前的销售预测

# 导入库import pandas as pdimport numpy as npfrom sklearn.linear_model import BayesianRidge, ElasticNet# 批量导入要实现的回归算法from sklearn.svm import SVR# SVM中的回归算法from xgb import XGBRegressorfrom sklea...

案例-基于自动K值的KMeans广告效果聚类分析

# 二、案例-基于自动K值的KMeans广告效果聚类分析# 说明# - Python版本:64位 3.7# - 依赖库:matplotlib、numpy、pandas、sklearn# - 程序输入:ad_performance.txt# - 程序输出:打印输出不同聚类类别的信息# 程序# 导入库import matplotlib.pyplot as plt# 图形库...

Python---数据预处理一

1.缺失值处理import pandas as pd# 导入pandas库import numpy as np# 导入numpy库from sklearn.preprocessing import Imputer# 导入sklearn.preprocessing中的Imputer库# 生成缺失数据df = pd.DataFrame(np.random.randn(6, 4...

Python数据建模--蒙特卡罗模拟

蒙特卡罗模拟π的计算引入库计算积分 y = x**2厕所排队问题介绍实现图形展示蒙特卡罗模拟介绍:蒙特卡罗(Monte Carlo)方法,又称随机抽样或统计试验方法,是以概率和统计理论方法为基础的一种计算方法,使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。① π的计算② 计算积分 y = x**2

Python数据预处理--缺失值处理

介绍:数据缺失主要包括记录缺失和字段信息缺失等情况,其对数据分析会有较大影响,导致结果不确定性更加显著处理方法:删除记录 / 数据插补 / 不处理

Python特征分析- 相关性分析

Python特征分析- 相关性分析相关性分析引入库图示初判变量之间的线性相关性散点图矩阵初判多变量间关系Pearson相关系数创建样本数据正态性检验 → pvalue >0.05制作Pearson相关系数求值表求出rPearson相关系数 - 算法Sperman秩相关系数创建样本数据重新排序、index求出rsPearson相关系数 - 算法相关性分析介绍:分析连续变量之间的线性相关程度的强

到底了