logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习实战读书笔记(三)决策树

3.1 决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据.缺点:可能会产生过度匹配问题.适用数据类型:数值型和标称型.一般流程:1.收集数据2.准备数据3.分析数据4.训练算法5.测试算法6.使用算法3.1.1 信息增益创建数据集def createDataSet():...

#数据结构与算法#人工智能#python
机器学习实战读书笔记(三)决策树

3.1 决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据.缺点:可能会产生过度匹配问题.适用数据类型:数值型和标称型.一般流程:1.收集数据2.准备数据3.分析数据4.训练算法5.测试算法6.使用算法3.1.1 信息增益创建数据集def createDataSet():...

#数据结构与算法#人工智能#python
数据挖掘概念与技术读书笔记(二)认识数据

2.1 数据对象与属性类型2.1.1 什么是属性2.1.2 标称属性:其值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此标称属性又被看作是分类的。  标称属性不是定量的,找出它的均值或中位数没有意义,有意义的是找到众数,是一种中心趋势度量。2.1.3 二元属性:是一种标称属性,只有两个类别或状态:0或1,也称布尔属性。  二元属性可以是对称的:关于哪个结...

#r语言
数据挖掘概念与技术读书笔记(三)数据预处理

3.1 数据预处理    数据质量的三个要素:准确性、完整性和一致性。3.1.2 数据预处理的主要任务  数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理“数据。  数据集成:  数据归约:3.2 数据清理3.2.1 缺失值  1.忽略元组  2.人工填写缺失值  3.使用一个全局常量填充缺失值  4.使用属性的中...

#人工智能#数据结构与算法
到底了