logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

《数据清洗》 第八章 综合案例(8.3.7-8.3.8)

1.加载演员数据至演员维度表1.1打开kettle工具,创建转换创建转换load_dim_actor,并添加“表输入”控件、“插入/更新”控件以及Hop跳连接线1.2配置“表输入”控件点击“表输入”控件,进入“表输入”界面,,单击新建按钮,配置数据库连接,配置完成后单击“确认”按钮在SQL框中编辑SQL语句,而后单击“预览”按钮1.3配置“表输入2”控件点击“表输入2”控件,进入“表输入”界面,,

#etl
《数据清洗》 第八章 综合案例(8.3.5-8.3.6)

目录1.加载用户数据至用户维度表1.1.1打开Kettle工具,创建转换1.1.2配置“表输入”控件1.1.3配置“表输入2”控件1.2.1打开Kettle工具,创建转换1.2.2配置“映射输入规范”控件1.2.3配置“数据库查询”控件1.2.4配置“数据库查询2”控件1.2.5配置“数据库查询3”控件1.2.6配置“过滤记录”控件1.2.7配置“JavaScript代码”控件1.2.8配置“字段

#etl#数据仓库
《数据清洗》 第六章 数据转换

1.对文本文件personnel_data.txt中的数据进行数据粒度的转换,即将文本文件personnel_data.txt中字段为household_register的数据统一成省份,并输出到文本文件personnel_data_new.txt中1.1转换granularity1.1.1打开kettle工具,创建转换创建转换granularity,添加“表输入”、“字段选择”、“排序记录”、“

#etl
《数据清洗》 第四章 数据抽取

目录1.抽取CSV文件2.抽取JSON文件1.抽取CSV文件1.1打开kettle工具,创建转换创建转换csv_extract,并添加“CSV文件输入”、“表输出”及hop跳连接线,用于实现CSV文件数据的抽取功能。1.2配置“CSV文件输入“控件”双击“CSV文件”控件,选择要抽取的文件csv_extract.csv;单击“获取字段”,kettle自动检索CSV文件并对其中字段类型、格式、长度、

#etl
到底了