flume日志抓取设计

近期实在没有什么可写的了, docker遇到很多的坑, 只能先写一点其他的东西, flume用的公司很多, 不过一般成熟的一二线的公司基本是很少使用, 他的性能和网络传输一直是有提升空间的, 对于我们这些小公司出身的人,曾经还是靠他混饭吃的.设计是两年前的实现, 现在觉得很多不是很合理的地方,特别是在分流的设计上,不过flume的传输占带宽的问题也一直没有解决,曾经对flume做了部分优化,写

然月枕流君

17271人浏览 · 2015-10-21 20:34:24

然月枕流君 · 2015-10-21 20:34:24 发布

近期实在没有什么可写的了, docker遇到很多的坑, 只能先写一点其他的东西, flume用的公司很多, 不过一般成熟的一二线的公司基本是很少使用, 他的性能和网络传输一直是有提升空间的, 对于我们这些小公司出身的人,曾经还是靠他混饭吃的.

设计是将近前的实现, 现在觉得很多不是很合理的地方,特别是在分流的设计上,不过flume的传输占带宽的问题也一直没有解决,曾经对flume做了部分优化,写过一点插件,后续有机会发出来

生产环境中flume安装及配置工作，帮助同事能够快速了解flume的安装环境及配置工作。

Flume依赖关系：

JDK :Flume源码程序是由JAVA平台编制而成，故此对JDK有强制依赖。

HDFS :flume监听日志文件变化，将日志程序写入存储介质HDFS

HBASE：与HDFS同属存储介质，用于实时查询，flume可藉由zookeeper获取HBASE访问实例

本次项目flume的职责要求：

flume是收集日志的开源软件解决方案之一，相对于其他同类软件他具有高可用的，高可靠的，分布式等特性，对于分布式日志采集有得天独厚的优势。

此次项目中flume是承上启下的作用，上游为python程序分割本服务器日志，下游为将日志存储HDFS，期间确保数据安全性及整体应用可用性，故此我们需要在每台日志收集的服务器中安装flume程序和python分割程序，如下图所示：

日志收集工作流程是

1.OTSWEB生成相关日志信息，可按小时、天等（现阶段是按天）

2.PYTHON日志分割程序，依据文件行数对OTSWEB日志实施分割为多个文件，同时写入flume客户端侦测的文件夹中

3.flume客户端侦测文件夹变化，对新增文件读取，并提交至其他服务器的flume日志存储模块

4.flume日志存储模块将收到的日志整合，按5分钟为时限将日志数据写入HDFS

日志模块可参考下图所示：

（蓝色-我方应用，灰色-依赖软件，白色-后续扩展）

Flume程序安装：

依据服务器客观条件，我们应先检测是否有安装JDK以及CDH，如上述软件已安装完毕，则将软件包解压放置相关目录下。

解压后目录：

bin目录：放置flume的启动命令文件。（flume-ng）

conf目录：放置flume核心的配置文件，包括flume工作脚本（flume-conf.properties用于定制个性化日志收集，主要工作内容）、flume运行信息（flume-env.sh用于配置JDK等信息）、flume日志管理（log4j.properties用于配置log4j信息）

Cloudera目录：用于放置CDH管理flume信息，可以暂时忽略不计，独立flume运行，不依赖此包内容

docs目录：是记录flume参考文档

lib目录：是flume运行依赖类库

tools目录：是配置log4j直接输出日志到flume集成配置使用的相关jar包(我们非是使用此种方式，亦可忽略不计)

我们需要配置的内容相对简单，仅需要两步骤操作：

一、配置环境变量

vim /etc/profile

#flume

export FLUME_HOME=/home/grid/flume/apache-flume-xxx-bin

export FLUME_CONF_DIR=$FLUME_HOME/conf

export PATH=$PATH:$FLUME_HOME/bin

source /etc/profile

二、配置conf/flume-conf.properties(核心)

配置conf/flume-conf.properties是我们工作的核心，也是flume需要我们定制个性化服务的支撑点。

配置源一个JOB，通常称之为agent，其主要包括三个部分，分别是数据入口（sources）、管道（channels）、数据出口（sink）

数据入口（sources）:配置数据源信息，我们主要使用SpoolingDirectory Source和Avro Source，其他支持包括Exce Source、NetCat Source、SyslogSource、Syslog TCP Source、Syslog UDP Source、HTTP Source、HDFS Source，etc。

管道（channels）：保障数据的传输高可用及高可靠，有两种分别是基于内存及硬盘，我们为了保证其安全、稳定则使用基于硬盘传输，支持断点续传等功能

数据出口（sink）：配置数据最终的存储位置，我们主要使用HDFSSink和Avro Sink，其他支持包括Logger Sink、Thrift Sink、IRC Sink、File Roll Sink、NullSink、HBaseSinks、HBaseSink、AsyncHBaseSink、MorphlineSolrSink、ElasticSearchSink、CustomSink

flume-conf配置：

我们使用flume主要包括两个部分agent完成数据的对接工作，分别是flume客户端及flume日志存储。

flume客户端负责收集otsweb应用端的日志，与otsweb应用为一对一的关系，强依赖于otsweb应用。（flume客户端与python程序安装于otsweb应用服务器）

flume日志存储是将flume客户端的日志存储到HDFS中，同时依据相关配置信息完成文件传输及存储，flume客户端与flume日志存储是一对多的关系，此方式可以保证并行存储至HDFS，不会受到HDFS管道流写入的限制。

flume客户端配置文件（flume-conf.properties）：

# TODO 定义数据入口（sources）、管道（channels）、数据出口（sink）

# 定义数据入口（sources）

a1.sources= r1

# 定义两个数据出口（sink），此处sink数量是与flume日志存储数据相呼应，暂定为两个SINK

a1.sinks= k1 k2

# 定义管道（channels）

a1.channels= c1

# TODO 配置数据入口（sources）

# 定义数据源类型为监听文件夹

a1.sources.r1.type= spooldir

# 配置对接管道

a1.sources.r1.channels= c1

# 监听目录

a1.sources.r1.spoolDir= /home/grid/jboss/source

# 定义读取至管道后，删除源文件

a1.sources.r1.deletePolicy= immediate

# 定义两个拦截器，分别是添加时间戳和主机名

a1.sources.r1.interceptors=i1 i2

# 定义拦截器为HostInterceptor

a1.sources.r1.interceptors.i1.type= host

# 主机名赋值，此处也可以写其他的

a1.sources.r1.interceptors.i1.hostHeader= host

# 定义拦截器为TimestampInterceptor，默认会向head添加时间戳，后续flume日志上传的conf文件的HDFS时间则来源于此

a1.sources.r1.interceptors.i2.type= timestamp

# TODO 数据出口（sink）

# 定义类型为AVRO方式，使用RPC方式调用，故此需要端口号

a1.sinks.k1.type= avro

# 配置对接管道

a1.sinks.k1.channel= c1

# flume日志上传的flume组件的host

a1.sinks.k1.hostname= my1

# flume日志上传的flume组件的端口（与其flume日志上传的sources相呼应）

a1.sinks.k1.port= 4141

# 定义类型为AVRO方式，使用RPC方式调用，故此需要端口号

a1.sinks.k2.type= avro

# 配置对接管道

a1.sinks.k2.channel= c1

# flume日志上传的flume组件的host

a1.sinks.k2.hostname= my2

# flume日志存储的flume组件的端口（与其flume日志存储的sources相呼应）

a1.sinks.k2.port= 4141

# TODO 配置SINK组，能够完成数据一个组内数据均衡发送效果

# 定义组名

a1.sinkgroups= g1

# 定义分组的SINK

a1.sinkgroups.g1.sinks= k1 k2

# 负载均衡

a1.sinkgroups.g1.processor.type= load_balance

# 发生冲突时的强制性重传

a1.sinkgroups.g1.processor.backoff= true

# 传输数据选择机制,默认是轮调,生产机设置为随机,后期优化可测试调整

a1.sinkgroups.g1.processor.selector= random

# TODO 管道（channels）

# 临时存储方式为硬盘

a1.channels.c1.type= file

# 检查传输及断点续传等验证文件，可原理可参考MR合并小文件的方式

a1.channels.c1.checkpointDir= /home/grid/flume/tmp/checkpoint

# 传输数据

a1.channels.c1.dataDirs= /home/grid/flume/tmp/data

flume日志存储配置文件（flume-conf.properties）：

# TODO 定义数据入口（sources）、管道（channels）、数据出口（sink）

# 定义数据入口（sources）

agent.sources= r1

# 定义数据出口（sink）

agent.sinks= k1

# 管道（channels）

agent.channels= c1

# TODO 配置数据入口（sources）

# 定义数据源AVRO方式，使用RPC方式接收，故此需要端口号

agent.sources.r1.type= avro

# 配置对接管道

agent.sources.r1.channels= c1

# 限制接收数据的发送方ID, 0.0.0.0是接收任何IP，不做限制

agent.sources.r1.bind= 0.0.0.0

# 接收端口（与其flume客户端的sink相呼应）

agent.sources.r1.port= 4141

# TODO 数据出口（sink）

# 定义类型为HDFS方式存储

agent.sinks.k1.type= hdfs

# 配置对接管道

agent.sinks.k1.channel= c1

# 配置HDFS存储目录，此处也可使用%{host}主机名

agent.sinks.k1.hdfs.path= hdfs://my1:9000/log/%Y%m%d/%H/

# 设置压缩与非压缩，此处非压缩

agent.sinks.k1.hdfs.fileType=DataStream

# 格式化文件,可选“Text” or “Writable”，此处选择文本方式

agent.sinks.k1.hdfs.writeFormat= Text

# 文件头前缀名，亦可增加/%Y%m%d/%H/等属性

agent.sinks.k1.hdfs.filePrefix= processlog

# 读取到指定记录数,将一次写入数据存入HDFS中，0则表示不启用

agent.sinks.k1.hdfs.rollCount= 0

# 读取到指定KB的文件大小，将一次写入数据存入HDFS中，0则表示参数不启用

agent.sinks.k1.hdfs.rollSize= 0

# 读取到指定秒数的日志读取，将一次写入数据存入HDFS中，300则60×5（5分钟）

agent.sinks.k1.hdfs.rollInterval= 300

# 一次事件写入hdfs的个数

agent.sinks.k1.hdfs.batchSize = 10000

# TODO 管道（channels）

# 临时存储方式为硬盘

agent.channels.c1.type= file

# 检查传输及断点续传等验证文件，可原理可参考MR合并小文件的方式

agent.channels.c1.checkpointDir= /home/grid/flume/tmp/checkpoint

# 传输数据

agent.channels.c1.dataDirs= /home/grid/flume/tmp/data

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...