logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用KNN对iris数据集进行分类——python

filename='g:\data\iris.csv'lines=fr.readlines()Mat=zeros((len(lines),4))irisLabels=[]index=0for line in lines:line=line.strip()if len(line)>0:listFromline=line.split(',')irisLabels.app...

#人工智能#python#数据结构与算法
数据挖掘概念与技术读书笔记(二)认识数据

2.1 数据对象与属性类型2.1.1 什么是属性2.1.2 标称属性:其值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此标称属性又被看作是分类的。  标称属性不是定量的,找出它的均值或中位数没有意义,有意义的是找到众数,是一种中心趋势度量。2.1.3 二元属性:是一种标称属性,只有两个类别或状态:0或1,也称布尔属性。  二元属性可以是对称的:关于哪个结...

#r语言
数据挖掘概念与技术读书笔记(三)数据预处理

3.1 数据预处理    数据质量的三个要素:准确性、完整性和一致性。3.1.2 数据预处理的主要任务  数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理“数据。  数据集成:  数据归约:3.2 数据清理3.2.1 缺失值  1.忽略元组  2.人工填写缺失值  3.使用一个全局常量填充缺失值  4.使用属性的中...

#人工智能#数据结构与算法
到底了