
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
大数据运维项目一 大数据分布式集群
最底层:HDFS 存数据,YARN 分资源。中间层:MapReduce/Tez/Spark 做计算。业务层:Hive/Pig 做数据仓库分析,HBase 做实时查询。辅助层:Zookeeper 协调,Flume/Sqoop 负责数据采集,Ambari/Oozie 负责运维调度。plaintextWeb日志 → Flume采集 → HDFS存储 → MapReduce清洗 → Hive分析 → Sq
到底了







