logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

python 共现矩阵

【代码】python 共现矩阵。

#python#矩阵#pandas
python 信息熵、条件熵、信息增益、信息增益率、基尼系数

三、python 实现import mathfrom collections import Counterdef Entropy(DataList):'''计算随机变量的熵'''counts = len(DataList)# 总数量counter = Counter(DataList) # 每个变量出现的次数prob = {i[0]:i[1]/counts for i in counter.ite

#python#概率论#机器学习 +1
python re.sub() 正则替换(多字符串替换)

一、参数解析re.sub(pattern,# 正则中的模式字符串repl,# 替换的字符串,也可为一个函数string,# 要被查找替换的原始字符串count = 0# 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配)二、案例import reimport pypinyinstr_ = "这是我的老婆--云韵"# 案例1: 将云韵改为美杜莎result = re.sub(r'云韵', "美

#python#数据分析
python T检验

本文主要介绍使用python实现T检验的过程

#python#numpy#数据分析
python matplotlib绘图:解决X轴密集问题

【代码】python matplotlib绘图:解决X轴密集问题。

#matplotlib#python#数据分析
python 全国内地高风险地区数量查询与可视化(分省)

python 全国内地高风险地区数量查询与可视化(分省)

#python#数据分析
python dataframe 数据筛选/查询 小案例

文章目录一、导入库二、构建数据集 dataframe三、小案例3.1 filter + isin3.2 map3.3 map + 自定义函数3.4 apply3.5 apply + 自定义函数3.6 query3.7 eval3.8 更简洁一、导入库import randomimport pinyinimport pandas as pd二、构建数据集 dataframenames = ['南宫婉

#python#数据挖掘#数据分析
python 皮尔森相关系数(Pearson)

文章目录一、概述二、定义2.1 总体样本定义2.2 估算样本定义2.3 两种计算方式2.4 皮尔森距离三、python 实现3.1 生成随机数据集3.2 绘制散点图3.3 计算相关系数3.3.1 自定义函数(无显著性检验)3.3.2 python 函数(1)pandas.corr 函数(无显著性检验)(2)scipy.stats.pearsonr 函数 (有显著性检验)(3)pandas.corr

#python#概率论#机器学习 +1
python sklearn preprocessing OneHotEncoder 独热编码 One-Hot

文章目录一、One-Hot 简介二、小案例2.1 加载库2.2 随机生成数据集 --> dataframe2.3 通过 LabelEncoder 将分类变量打上数值标签2.4 进行one-hot编码2.5 转成 dataframe 形式2.6 columns 重命名三、自定义 OneHot 函数一、One-Hot 简介   One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对

#python#sklearn#机器学习
python 时间序列分解案例——加法分解seasonal_decompose

加法分解模型适用于随着时间推移趋势和季节性变化不断累加,并且随机波动比较稳定的时间序列数据。YtStRtYt​St​Rt​其中,YtY_{t}Yt​:实际观测值TtT_{t}Tt​:趋势(通常用指数函数来表示)StS_{t}St​:季节指数(一般通过计算每个季节的平均值得到)RtR_{t}Rt​:残差(无法被趋势和季节性解释的部分)

文章图片
#python#机器学习#数据分析
    共 26 条
  • 1
  • 2
  • 3
  • 请选择