logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

kafka系列(六)—— Consumer API

Consumer 消费数据时的可靠性是很容易保证的,因为数据在 Kafka 中是持久化的,故不用担心数据丢失问题。由于 consumer 在消费过程中可能会出现断电宕机等故障, consumer 恢复后,需要从故障前的位置的继续消费,所以 consumer 需要实时记录自己消费到了哪个 offset,以便故障恢复后继续消费。所以 offset 的维护是 Consumer 消费数据是必须考虑的问题。

在hue创建hive UDAF函数报错,Error while processing statement: FAILED: Execution Error, return code 1 from

纯粹是为了记笔记,以防后面遇到类似问题,又要找一遍问题1、问题:在hue创建hive UDAF函数报错,Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.FunctionTask。创建语句:CREATE FUNCTION call_

#hive
kafka的分区策略

一、生产端的消费策略二、消费端的生成策略1、range (默认分配策略)对应的实现类是 org.apache.kafka.clients.consumer.RangeAssignor将分区按数字顺序排行序,消费者按名称的字典序排序用分区总数除以消费者总数。如果能够除尽,平均分配;若除不尽,则位于排序前面的消费者将多负责一个分区2、RoundRobin基于轮询算法对应的实现类是 org.apache

#kafka
structstreaming消费kafka,报找不到kafka  source

执行脚本:spark-submit --class com.bigdata.SparkDemo --master yarn --deploy-mode client --driver-memory 1g /tmp/StructStreamingdemo-1.0-SNAPSHOT.jar报错信息如下Exception in thread "main" org.apache.spark.sql.Ana

kafka系列(六)—— Consumer API

Consumer 消费数据时的可靠性是很容易保证的,因为数据在 Kafka 中是持久化的,故不用担心数据丢失问题。由于 consumer 在消费过程中可能会出现断电宕机等故障, consumer 恢复后,需要从故障前的位置的继续消费,所以 consumer 需要实时记录自己消费到了哪个 offset,以便故障恢复后继续消费。所以 offset 的维护是 Consumer 消费数据是必须考虑的问题。

kafka的架构

一、架构图Broker:一台 kafka 服务器就是一个 broker。一个kakfa集群由多个 broker 组成。一个 broker 可以容纳多个 topic。Producer:消息生产者,就是向 kafka broker 发消息的客户端Consumer:消息消费者,向 kafka broker 取消息的客户端。Topic:可以理解为一个队列,一个 Topic 又分为一个或多个分区。

文章图片
#kafka#架构#分布式
到底了