简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
大数据学习_Hadoop
1 Hadoop简介1.1 Hadoop是什么?Hadoop是一个由Apache基金会所开发的分布式系统基础架构,是一个适合大数据的分布式存储和计算平台。主要解决:海量数据的存储和海量数据的分析计算问题。狭义上说Hadoop就是一个框架平台,广义上讲Hadoop代表大数据的一个技术生态圈,包括很多其他软件框架。1.2 Hadoop发行版本Apache Hadoop 原始版本(最原始的版本,适合入门
大数据学习_数据采集工具 Flume
目录1 Flume概述1.1 Flume的定义1.2 Flume体系结构1.3Flume拓扑结构21 Flume概述1.1 Flume的定义Flume由Cloudera公司开发,是一个分布式、高可靠、高可用的海量日志采集、聚合、传输的系统。Flume支持在日志系统中定制各类数据发送方,用于采集数据;Flume提供对数据进行简单处理,并写到各种数据接收方的能力。简单的说,Flume是实时采集日志的数