
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
3 Flume入门3.1 监控端口数据(官方案例)使用Flume监听一个端口,收集该端口数据,并打印到控制台。首先可以确定的是source用netcat;channel用memory;sink用logger步骤1:安装netcat工具sudo yum install -y nc步骤2:判断44444端口是否被占用sudo netstat -lnp | grep 44444步骤3:创建job文件夹,
Python数据可视化1 柱状图普通柱状图基本语法plt.bar(x, data, tick_label= , label= , bottom= , color= , width= )# x:所有柱子的下标列表,可以是list(range(5)),也可以是numpy.arange(5)数组# data:数据列表# tick_label:每个柱子标签列表,['G1', 'G2', 'G3', 'G4
1 Spark内核概述Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制、Spark任务调度机制、Spark内存管理机制、Spark核心功能的运行原理。1.1 Spark核心组件(1)Yarn(RM & NM)(2)Spark(AM & Driver & Executor)①DriverSparK驱动器节点,用于执行Spark任务中的main方法,
1.1 DataX下载地址http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz1.2 安装DataX步骤1:使用wget命令,采用阿里云地址下载[root@hadoop201 software]# wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/data
9 集合Scala的集合有三大类:序列Seq、集Set、映射Map,所有集合都扩展自Iterable特质。对于所有的集合类,Scala都同时提供了可变和不可变的版本。可变集合和不可变集合使用包名区分:scala.collection.immutablescala.collection.mutable可变不可变数组ArrayArrayBuffer序列(List)Seq、ListListBuffer集
Python数据可视化1 柱状图普通柱状图基本语法plt.bar(x, data, tick_label= , label= , bottom= , color= , width= )# x:所有柱子的下标列表,可以是list(range(5)),也可以是numpy.arange(5)数组# data:数据列表# tick_label:每个柱子标签列表,['G1', 'G2', 'G3', 'G4







