logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据处理基本流程

处理流程数据抽取抽取mysql中的数据到hive仓库ods层静态分区动态分区全量数据增量数据数据分区根据数据抽取的日期分区根据业务日期进行分区数据清洗数据分析实时数据处理大数据可视化抽取流程创建hive数据表编写spark程序创

#scala#开发语言#后端
大数据处理流程

大数据处理流程:确定数据来源:采集工程师爬取到对应的数据公开的数据集购买一些商用的数据数据仓库工程师:抽取数据,将数据抽取到数据仓库中数据分析工程师:数据进行汇总分析,挖掘出企业关心的内容将数据的结果同步到mysql中web工程师进行数据的展示和呈现目标:经采集的数据结构化之后导入到数据仓库中,...

#大数据
大数据处理流程

大数据处理流程:确定数据来源:采集工程师爬取到对应的数据公开的数据集购买一些商用的数据数据仓库工程师:抽取数据,将数据抽取到数据仓库中数据分析工程师:数据进行汇总分析,挖掘出企业关心的内容将数据的结果同步到mysql中web工程师进行数据的展示和呈现目标:经采集的数据结构化之后导入到数据仓库中,...

#大数据
分布式计算框架MapReduce

MapReduce是一种编程模型,是面向大数据并行处理的计算模型、框架和平台。MapReduce是一个基于集群的高性能并行计算平台。可以使用普通服务器构成一个包含数十、数百、甚至数千个节点的分布式和并行计算集群。MapReduce是一个并行计算与运行的软件框架。它提供了一个庞大但设计精良的并行计算软件框架,能自动划分计算数据和计算任务,自动完成计算任务的并行化处理,实现在集群节点上自动分配和执行任

#mapreduce
MapReducer

MapReducer是一种编程模型 面向大数据并行处理的一种计算模型,框架和平台基本特点:分布可靠,对数据集的操作分发给多个集群中的多个节点实现可靠性,每个节点周期性返回它完成的任务和最新状态封装实现了细节,基于框架API编程,面向业务 展开分布式编码提供跨语言编程的能力运行流程:map阶段和reducer阶段map:由map task组成输入数据解析格式InputFormat输入数据处理 Map

#mapreduce
IP地址 归属地查询

目标通过开发IP地址归属地查询平台,我们需要对JavaSE综合技术有所提升,增强实战能力。学习完该项目我们应该具备如下能力:1 面向对象程序设计2 工具类封装与使用写法3 文件IO流4 字符串处理5 二分法查找6 IP地址的不同形式的使用思路1 程序中读取内容2 解析IP字符串,进行结构化处理3 封装工具类4 接口API入参 : IP出参 : 归属地代码开发读取文件public static Li

#tcp/ip#网络协议#网络
到底了