logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数仓模型之维度建模

理解Kimball 最先提出的维度建模

文章图片
#数据仓库#数据挖掘#人工智能
浅谈Hive数据仓库之拉链表

**Hive数据仓库之拉链表**本篇分享总体结构:①.先分享一下拉链表的用途、什么是拉链表。②.通过一些小的使用场景来对拉链表做近一步的阐释,以及拉链表和常用的切片表的区别。③.举一个具体的应用场景,来设计并实现一份拉链表,最后并通过一些例子说明如何使用我们设计的这张表(因为现在Hive的大规模使用,我们会以Hive场景下的设计为例)。④.分析一下拉链表的优缺点,并对前面的提到的一些内容进行补充说

文章图片
#hive#hadoop#数据仓库 +1
详解数据仓库、数据湖、数据中台和湖仓一体

在谈论数据中台之前, 我们也听到过数据平台、数据仓库、数据湖的相关概念,它们都与数据有关系,但他们和数据中台有什么样的区别, 下面我们将围绕数据平台、数据仓库、数据湖和数据中台的区别进行介绍。

#数据仓库#数据库#数据挖掘
数据指标体系建设方法

建立数据指标体系,可以帮助产品经理更好地梳理、理解业务,并发现业务过程中出现的问题,进而推动产品的迭代优化。那么,数据指标体系应该如何建立?本篇文章里,作者就数据指标体系的整理方法进行了总结,一起来看一下。

文章图片
#java#开发语言
浅谈数据治理与成本管理

数据治理与成本管理之间是相辅相成的

文章图片
#大数据
第一部分:Spark基础篇

Spark基础篇包含:job运行流程、任务提交阶段、运行原理、与MR的区别、RDD、DAG、算子类等知识点

文章图片
#spark#大数据#分布式
到底了