logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘--数据预处理

数据清理缺失值如果数据集含有分类属性,一种简单的填补缺失值的方法为,将属于同一类的对象的该属性值的均值赋此缺失值;对于离散属性或定性属性,用众数代替均值。更复杂的方法,可以将其转换为分类问题或数值预测问题噪声数据识别出噪音将其去除 -- 比如孤立点的识别利用其它非噪音数据降低噪音的影响,起到平滑(smoothing)的作用 -- 分箱(binning)方法可以用于平滑噪音。例如,将年收入的缺失值填

#数据挖掘
数据挖掘--聚类分析:基本概念和方法

聚类分析是把一个数据对象(或观测)划分成子集的过程。每一个对象都是一个簇。

#数据挖掘#人工智能
到底了