Kafka3.x入门

Kafka是一个开源的分布式事件流平台（Event streaming Platform），被数千家公司用于高性能数据管道、流分析、数据集成和关键任务应用。

my_study_notes

543人浏览 · 2022-09-30 14:01:50

my_study_notes · 2022-09-30 14:01:50 发布

内容目录

1、Kafka概述

2、Kafka快速入门

3、Kafka生产者

4、Kafka Broker

5、Kafka消费者

6、Kafka-Eagle监控

7、Kafka-Draft模式

----------------------------------------------------------------------------------------

1、Kafka概述

先说一个应用场景，每年的双11、618购物节，都会产生超大量的用户购物行为数据。这些数据会通过前端写入到日志服务器，然后通过Flume将数据导入到Hadoop大数据集群，进行分析处理。在这种特殊时期（购物节），由于hadoop写入速度问题，Flume导入数据时可能会成为瓶颈。这时就可以引入Kafka集群，先把日志文件注入Kafka集群，然后再由Hadoop集群慢慢读取。

1.1、Kafka的定义

Kafka传统定义：Kafka是一个分布式的基于发布/订阅模式的消息队列（Message Queue），主要应用于大数据实时处理领域。

发布/订阅：消息的发布者不会将消息直接发送给特定的订阅者，而是将发布的消息分为不同的类别，订阅者只接收感兴趣的消息。

Kafka最新定义：Kafka是一个开源的分布式事件流平台（Event streaming Platform），被数千家公司用于高性能数据管道、流分析、数据集成和关键任务应用。

1.2、消息队列

目前企业中较常见的消息队列产品主要有Kafka、ActiveMQ、RabbitMQ、RocketMQ等。

在大数据场景主要采用Kafka作为消息队列。在JavaEE开发中主要采用ActiveMQ、RabbitMQ、RocketMQ。

1.2.1、消息队列的应用场景

传统消息队列的应用场景：缓存/消峰、解耦和异步通信。

缓存/消峰：有助于控制和优化数据流经过系统的速度，解决产生消息和消费消息的处理速度不一致的情况。

解耦：允许你独立的扩展或修改两边的处理过程，只要确保它们遵守同样的接口约束。

以往想要把数据源的数据导入到大数据处理平台，开发成本较高，因为数据源和数据导入的目的地多种多样。加入消息队列，由于接口是现成的，所以会极大降低开发成本。

异步通信：允许用户把一个消息放入队列，但并不立即处理它，然后在需要的时候再去处理他们。

这里发送短信不是很重要，但较耗时间，所以可以放入到消息队列，让发送消息的模块慢慢发送，同时也减少了用户等待的时间。

1.2.2、消息队列的两种模式

1）点对点模式

消费者主动拉取数据，消息收到后清除消息。

2）发布/订阅模式

可以有多个topic主题（浏览、点赞、收藏、评论等）

消费者消费数据后，不删除数据

每个消费者相互独立，都可以消费到数据

1.3 Kafka基础架构

AtomGit 开源协作平台测评赛

瓜分20万奖金获得内推名额丰厚实物奖励易参与易上手

更多推荐

ADS1292R 使用过程心电图高精度ADC模块

文章目录1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础1 Fundamentals ofPrecision ADC Noise Analysis 精密模数转换器噪声分析基础https://www.ti.com.cn/cn/lit/wp/slyy192/slyy192.pdf?ts=1600659610730&ref_u

开放原子开发者工作坊

实现一个家庭安防与环境监测系统（一）

开放原子开发者工作坊

【cf】Codeforces Round #774 (Div. 2) 前4题

题目A. Square Counting 简单数学题目大意题解代码B. Quality vs Quantity 排序题目大意题解代码C. Factorials and Powers of Two 状态压缩dp+位运算题目大意题解代码D. Weight the Tree 树形dp+dfs题目大意题解代码E. Power Board 看起来像是数论？许多年没打cf了，偶尔打了一盘，恢复紫名了。A. S