logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第一部分:Spark基础篇

Spark基础篇包含:job运行流程、任务提交阶段、运行原理、与MR的区别、RDD、DAG、算子类等知识点

文章图片
#spark#大数据#分布式
数仓分层建设

每个公司的数仓分层各有不同,根据具体业务进行划分,但是万变不离其宗的

文章图片
#数据仓库#大数据
第一部分:Flink基础篇

基础篇:包含了Flink中的原理、特点、发展时间线、集群角色、与Spark Streaming对比、任务提交流程、FlinkCDC、批流一体、CEP机制等知识点

文章图片
#flink#大数据#面试
浅谈数仓建模

大数据的数仓建模是通过建模的方法更好的组织、存储数据,以便在 性能、成本、效率和数据质量之间找到最佳平衡点。

文章图片
暂无文章信息