logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据5_02_Flume入门案例

3 Flume入门3.1 监控端口数据(官方案例)使用Flume监听一个端口,收集该端口数据,并打印到控制台。首先可以确定的是source用netcat;channel用memory;sink用logger步骤1:安装netcat工具sudo yum install -y nc步骤2:判断44444端口是否被占用sudo netstat -lnp | grep 44444步骤3:创建job文件夹,

#大数据#hadoop#flume
Python数据可视化(学习笔记)

Python数据可视化1 柱状图普通柱状图基本语法plt.bar(x, data, tick_label= , label= , bottom= , color= , width= )# x:所有柱子的下标列表,可以是list(range(5)),也可以是numpy.arange(5)数组# data:数据列表# tick_label:每个柱子标签列表,['G1', 'G2', 'G3', 'G4

#python
大数据9_04_Spark内核源码详细解析

1 Spark内核概述Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制、Spark任务调度机制、Spark内存管理机制、Spark核心功能的运行原理。1.1 Spark核心组件(1)Yarn(RM & NM)(2)Spark(AM & Driver & Executor)①DriverSparK驱动器节点,用于执行Spark任务中的main方法,

#大数据#spark
DataX下载安装及操作

1.1 DataX下载地址http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz1.2 安装DataX步骤1:使用wget命令,采用阿里云地址下载[root@hadoop201 software]# wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/data

#大数据
大数据8_08_Scala集合&常用方法

9 集合Scala的集合有三大类:序列Seq、集Set、映射Map,所有集合都扩展自Iterable特质。对于所有的集合类,Scala都同时提供了可变和不可变的版本。可变集合和不可变集合使用包名区分:scala.collection.immutablescala.collection.mutable可变不可变数组ArrayArrayBuffer序列(List)Seq、ListListBuffer集

#大数据#scala
Python数据可视化(学习笔记)

Python数据可视化1 柱状图普通柱状图基本语法plt.bar(x, data, tick_label= , label= , bottom= , color= , width= )# x:所有柱子的下标列表,可以是list(range(5)),也可以是numpy.arange(5)数组# data:数据列表# tick_label:每个柱子标签列表,['G1', 'G2', 'G3', 'G4

#python
Flink定时器

6.7 定时器6.7.1 定时器API以keyBy()之后的键控流的定时器为例://TODO 定时器 API//1. 注册定时器ctx.timerService().registerProcessingTimeTimer();ctx.timerService().registerEventTimeTimer();//2. 删除定时器ctx.timerService().deleteProcessi

#flink
到底了