logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据运维项目一 大数据分布式集群

最底层:HDFS 存数据,YARN 分资源。中间层:MapReduce/Tez/Spark 做计算。业务层:Hive/Pig 做数据仓库分析,HBase 做实时查询。辅助层:Zookeeper 协调,Flume/Sqoop 负责数据采集,Ambari/Oozie 负责运维调度。plaintextWeb日志 → Flume采集 → HDFS存储 → MapReduce清洗 → Hive分析 → Sq

#大数据#运维#分布式
到底了