logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据仓库-4.ETL过程和ETL工具

构建数据仓库的核心是建模,在数据仓库的构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线。从数据源中抽取数据,然后对这些数据进行转化,最终加载到目标数据库或者数据仓库中去,这也就是我们通常所说的 ETL 过程(Extract,Transform,Load)。通常数据抽取工作分抽取、清洗、转换、装载几个步骤

#数据仓库#etl
数据仓库-6.元数据管理

元数据(Meta Data),主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及 ETL 的任务运行状态。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。元数据是数据仓库管理系统的重要组成部分,元数据管理是企业级数据仓库中的关键组件,贯穿了数据仓库的整个生命周期,使用元

#数据仓库#数据挖掘
数据仓库-1.为什么数据分析中要建数据仓库?

我们如果要做好数据分析的时候,要使用ETL工具构建数据仓库提升数据分析效果需要从三个方面。分别是数据理解、数据质量、数据跨系统关联。

#数据仓库#数据分析#数据挖掘
数据仓库-3.数据维度建模-下

学习了解维度建模中的基本要素事实表和维度表的类型以及维度设计方法。首先里了解维度建模中的事实表类型,在依次介绍维度类型,一致性维度和一致性事实,维度设计方法。

#数据仓库#数据分析
远程登入虚拟机如何上传文件

上传文件有很多种方法:1.借助工具:FTP   QQ等2.共享文件夹方式现介绍第二种方法:1.确保主机和虚拟机的通信畅通。可以:ping ip地址。2.在虚拟机系统里新建文件夹,设置为共享并有写入权限。3.在本机上“\\虚拟机IP“ 即可看到虚拟机新建的共享文件夹,然后就可以把文件拷入该共享文件夹里了。

#虚拟机
到底了