
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
数据清洗第一章学习笔记
一.数据清洗的背景当今时代,企业信息化的要求越来越迫切。对于企业的决策者来说,如果作为决策支持的数据仓库存放的数据质量达不到要求将直接导致数据分析和数据挖掘不能产生理想的结果,甚至还会产生错误的分析结果,从而误导决策。因此,我们需要对数据仓库中的数据进行相关清洗操作,得出可靠、可准确反映企业实际情况的数据,用以支持企业战略决策。1.数据质量概述数据质量的特点如下:1.1.“业务需求”会随时间变化,
kettle抽取数据
1.抽取CSV文件csv_extract.csv中的数据保存到数据库extract的数据表csv中。首先我们在数据库extract中新建一个名为csv的表格,如图所示:接下来,我们在kettle中创建一个名为csv_extract的转换,如图所示:然后我们进入“csv文件输入”控件,点击浏览,添加我们要抽取的文件csv_extract.csv,然后点击下方的获取字段,如图所示:然后点击确定,完成“
到底了







