
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
使用KNN对iris数据集进行分类——python
filename='g:\data\iris.csv'lines=fr.readlines()Mat=zeros((len(lines),4))irisLabels=[]index=0for line in lines:line=line.strip()if len(line)>0:listFromline=line.split(',')irisLabels.app...
数据挖掘概念与技术读书笔记(二)认识数据
2.1 数据对象与属性类型2.1.1 什么是属性2.1.2 标称属性:其值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此标称属性又被看作是分类的。 标称属性不是定量的,找出它的均值或中位数没有意义,有意义的是找到众数,是一种中心趋势度量。2.1.3 二元属性:是一种标称属性,只有两个类别或状态:0或1,也称布尔属性。 二元属性可以是对称的:关于哪个结...
数据挖掘概念与技术读书笔记(三)数据预处理
3.1 数据预处理 数据质量的三个要素:准确性、完整性和一致性。3.1.2 数据预处理的主要任务 数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理“数据。 数据集成: 数据归约:3.2 数据清理3.2.1 缺失值 1.忽略元组 2.人工填写缺失值 3.使用一个全局常量填充缺失值 4.使用属性的中...
到底了