logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

非均衡数据或不均衡数据的处理方法

什么是非均衡数据?举个生活中的例子,我想大致调查一个年级(男生女生人数1:1)的平均体重,之后我随机抽了一个班进行测量,这个班50位同学,40位男生,10位女生,结果可想而知不准确。那这个数据就是非均衡数据了。非均衡数据就是我们的数据集不同类别的样本数之间相差很多。当我们进行机器学习任务时,如果样本有大量的非均衡数据,以总体分类准确率为学习目标的传统分类算法会过多地关注多数类,从而使得少数类样..

Python——matplotlib模块构造箱型图检测异常值

一.箱型图通俗来讲,就是将所有的数据都分布在这张图上,矩形上下限用四分为值,又用四分位值算出一个上界和下界,大于上界或者小于下界的值就是异常值。这里四分位距(IQR)就是上四分位与下四分位的差值。我们通过四分位距的1.5倍为标准,上界:超过上四分位+1.5倍IQR距离,下界:下四分位-1.5倍IQR距离的点为异常值。分位值的定义和计算在这里:(https://blog.csdn.net/cr...

#python
傅里叶级数和傅里叶变换简介和推导

一.傅里叶变换简介在数学上,对任意函数 f(x),可按某一点进行展开,常见的有泰勒展开和傅里叶展开。 泰勒展开为各阶次幂函数的线性组合形式, 本质上自变量未改变,仍为 x。但是傅里叶变换有:傅里叶展开为三角函数的线性组合。将自变量由x变成 ω。由时域分析变换到频域分析。由于这些特点,所以信号处理上经常使用傅里叶变换。信号分析与处理中常见的有:简称全称CFS(C...

python判断行或列是否有缺失值/统计缺失值数量

1.检查是否有缺失值列:data.isnull().any()print(data.isnull().any())false无缺失值/true有缺失值结果例样:age falsename falseschool trueschool的这一列有缺失值,其他列无缺失值。行:data.isnull().any(axis=1)print(data.isnull().any(axi...

#python
理解PyTorch中的dimensions维度,三维张量求和过程

通过可视化一个三维张量上的求和过程,更好地直观地了解PyTorch的维数理解张量(tensor):在TensorFlow和pyTorch中,大量数据不放在数组之类的容器中,而放在一个大张量中。例如,如果有20000张28✕28,24位真彩色的照片,就会放到一个[20000,28,28,3]形状的张量中。当开始用PyTorch张量做一些基本的运算时,比如求和,它看起来很简单,对于一维张量来说很简单:

#pytorch#自然语言处理#python
到底了