logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在hue创建hive UDAF函数报错,Error while processing statement: FAILED: Execution Error, return code 1 from

纯粹是为了记笔记,以防后面遇到类似问题,又要找一遍问题1、问题:在hue创建hive UDAF函数报错,Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.FunctionTask。创建语句:CREATE FUNCTION call_

#hive
kafka的分区策略

一、生产端的消费策略二、消费端的生成策略1、range (默认分配策略)对应的实现类是 org.apache.kafka.clients.consumer.RangeAssignor将分区按数字顺序排行序,消费者按名称的字典序排序用分区总数除以消费者总数。如果能够除尽,平均分配;若除不尽,则位于排序前面的消费者将多负责一个分区2、RoundRobin基于轮询算法对应的实现类是 org.apache

#kafka
structstreaming消费kafka,报找不到kafka  source

执行脚本:spark-submit --class com.bigdata.SparkDemo --master yarn --deploy-mode client --driver-memory 1g /tmp/StructStreamingdemo-1.0-SNAPSHOT.jar报错信息如下Exception in thread "main" org.apache.spark.sql.Ana

kafka系列(六)—— Consumer API

Consumer 消费数据时的可靠性是很容易保证的,因为数据在 Kafka 中是持久化的,故不用担心数据丢失问题。由于 consumer 在消费过程中可能会出现断电宕机等故障, consumer 恢复后,需要从故障前的位置的继续消费,所以 consumer 需要实时记录自己消费到了哪个 offset,以便故障恢复后继续消费。所以 offset 的维护是 Consumer 消费数据是必须考虑的问题。

kafka的架构

一、架构图Broker:一台 kafka 服务器就是一个 broker。一个kakfa集群由多个 broker 组成。一个 broker 可以容纳多个 topic。Producer:消息生产者,就是向 kafka broker 发消息的客户端Consumer:消息消费者,向 kafka broker 取消息的客户端。Topic:可以理解为一个队列,一个 Topic 又分为一个或多个分区。

文章图片
#kafka#架构#分布式
到底了