
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
3.1 决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据.缺点:可能会产生过度匹配问题.适用数据类型:数值型和标称型.一般流程:1.收集数据2.准备数据3.分析数据4.训练算法5.测试算法6.使用算法3.1.1 信息增益创建数据集def createDataSet():...
3.1 决策树的构造优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据.缺点:可能会产生过度匹配问题.适用数据类型:数值型和标称型.一般流程:1.收集数据2.准备数据3.分析数据4.训练算法5.测试算法6.使用算法3.1.1 信息增益创建数据集def createDataSet():...
2.1 数据对象与属性类型2.1.1 什么是属性2.1.2 标称属性:其值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此标称属性又被看作是分类的。 标称属性不是定量的,找出它的均值或中位数没有意义,有意义的是找到众数,是一种中心趋势度量。2.1.3 二元属性:是一种标称属性,只有两个类别或状态:0或1,也称布尔属性。 二元属性可以是对称的:关于哪个结...
3.1 数据预处理 数据质量的三个要素:准确性、完整性和一致性。3.1.2 数据预处理的主要任务 数据清理:填写缺失的值,光滑噪声数据,识别或删除离群点,并解决不一致性来”清理“数据。 数据集成: 数据归约:3.2 数据清理3.2.1 缺失值 1.忽略元组 2.人工填写缺失值 3.使用一个全局常量填充缺失值 4.使用属性的中...







