
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
《数据清洗》学习笔记
一、数据清洗背景当今时代,海量数据的来源是广泛的,数据类型也是多而繁多的,因此数据当中也会夹杂着不完整,重复以及错误的数据,如果直接使用这些原始数据,会严重影响数据决策的准确性和效率。因此,对原始数据进行有效的清洗是大数据分析和应用过程中的关键环节。(1)数据质量的评价指标准确性:对于数据进行降噪处理,通过最常用的异常值检测方法聚类进行处理。完整性:数据信息是否存在缺失的状况。简洁性:精良选择重要
到底了







