logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

项目实训4——数据开发部分功能的实现

GitHub Code Analysis 项目最终状态报告## 1. 项目完成度统计指标 数值 完成度 核心ETL流程完成度 16/18 88.9% 已实现表数量 16/18 88.9% 数据流转完整性 核心4层 100%说明 :- 18张表中,16张已有数据- 2张缺失( metric_detail_json 为可选扩展, ads_language_analysis 和 ads_repo_qua

#spark#sql#大数据 +1
Spark3.x指北——1:Spark基础概念

Spark 集群的独立部署环境中,不需要依赖其他的资源调度框架,自身就实现了资源调 度的功能,所以环境中还有其他两个核心组件:Master和Worker,这里的Master是一个进 程,主要负责资源的调度和分配,并进行集群的监控等职责,类似于Yarn环境中的RM, 而 Worker 呢,也是进程,一个Worker运行在集群中的一台服务器上,由Master分配资源对 数据进行并行的处理和计算,类似于

#spark#大数据#scala
大数据学习(Hadoop、Hive)

黑马程序员的大数据学习笔记~

#大数据#hadoop#学习 +1
到底了