
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据治理贯穿数仓中数据的整个生命周期,从数据的产生、加载、清洗、计算,再到数据展示、应用,每个阶段都需要对数据进行治理,像有些比较大的企业都是有自己的数据治理平台或者会开发一些便捷的平台,对于没有平台的公司,这里根据自己的亲身实践简单整理一下。

数据仓库-元数据管理详解

数据仓库-数据质量管理

数据仓库基础知识,包含维度建模中事实表、维度表、模型的详细说明

21世纪,世界已经进入数据大爆炸的时代,大数据时代已经来临。从商业公司内部的各种管理和运营数据,到个人移动终端与消费电子产品的社会化数据,再到互联网产生的海量信息数据等,每天世界上产生的信息量正在飞速增长。2009年数据信息量达到8 000亿GB,而到2011年达到1.8 ZB。图灵奖获得者Jim Gray提出的“新摩尔定律”:“每18个月全球新增信息量是计算机有史以来全部信息量的总和”,已经得到
一张图全方位了解数据仓库的相关知识

数据仓库-数据质量管理

位运算符主要是以二进制规则进行运算1.与(&)运算符使用规则:两个二进制操作数对应位同为1 结果位 才为1,其余情况为0;例如:整数 a = 15 整数 b = 127计算:(a & b)15的二进制位:0000 1111127的二进制为:0111 1111即:(a & b) = 152.或(|)运算符使用规则:两个二进制操作数对应位只要有一个为1 结果位 就为1,其余
往hive分区表中插入数据时,如果需要创建的分区很多,比如以表中某个字段进行分区存储,则需要复制粘贴修改很多sql去执行,效率低。因为hive是批处理系统,所以hive提供了一个动态分区功能,其可以基于查询参数的位置去推断分区的名称,从而建立分区。1、创建一个单一字段分区表hive>create table dpartition(id int ,name string )partitione
数据仓库基础知识,包含维度建模中事实表、维度表、模型的详细说明








