logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习——异常检测

异常点检测(Outlier detection),⼜称为离群点检测,是找出与预期对象的⾏为差异较⼤的对象的⼀个检测过程。这些被检测出的对象被称为异常点或者离群点。异常点(outlier)是⼀个数据对象,它明显不同于其他的数据对象。异常点检测的应用也十分广泛,例如:信用卡反欺诈、工业损毁检测、广告点击反作弊、刷单检测和羊毛党检测等等。一般异常检测是无监督学习,因为它不是二分类而是多分类问题。**问题

文章图片
#机器学习#人工智能
统计学——简单理解方差分析

方差分析(analysis of variance),简写为ANOVA,指的是利用对多个样本的方差的分析,得出总体均值是否相等的判定。它是一种分析调查或试验结果是否有差异的统计分析方法,也就是检验各组别间是否有差异。

文章图片
#概率论
秒懂数据降维——主成分分析PCA

主成分分析(Principal Component Analysis,简称 PCA)是一种常用的数据降维方法,旨在通过将高维数据投影到低维空间中的主要方向来捕获数据的本质结构。主成分分析可用于降低数据的维度,压缩图像、音频和视频数据,去除冗余信息等。

文章图片
#python#数据分析#人工智能
彻底解决jupyter无法安装statsmodels库

由于使用Anaconda对环境变量进行分区,所以无法使用命令行进行安装。一、后面想到直接打开Anaconda里面安装,打开Anaconda进去环境页面如下图操作。一开始直接pip安装statsmodels会出问题,显示无法安装。二、打开Anaconda后,进入jupyter,再次进行pip安装。

文章图片
#jupyter#python#ide
秒懂回归模型中均方根误差RMSE和损失函数的区别

1. 定义不同:RMSE是用来度量预测值和真实值之间的差异的,其计算方式是预测值与真实值之差的平方和的平均值再开平方。而损失函数是用来衡量模型预测结果与真实结果之间的误差,通常采用最小化损失函数的方式来求解模型参数。而损失函数则是用来指导模型训练的过程,通过最小化损失函数来调整模型参数,提高模型的预测能力。2. 目的不同:RMSE的目的是评估模型的预测精度,通常用来比较不同模型的预测结果。总的来说

文章图片
#回归#机器学习#人工智能 +2
Hadoop的DataNode无法启动的解决方案

3. 删除HDFS下的DataNode下的Data文件。

文章图片
#hadoop#大数据#分布式
秒懂数据降维——主成分分析PCA

主成分分析(Principal Component Analysis,简称 PCA)是一种常用的数据降维方法,旨在通过将高维数据投影到低维空间中的主要方向来捕获数据的本质结构。主成分分析可用于降低数据的维度,压缩图像、音频和视频数据,去除冗余信息等。

文章图片
#python#数据分析#人工智能
到底了