Springboot使用kafka(配置篇yml)

springboot 配置kafak的生产者，消费者，监听器

jason.zeng@1502207

15028人浏览 · 2023-01-04 10:32:21

jason.zeng@1502207 · 2023-01-04 10:32:21 发布

（一）springboot kafka配置

1：spring.kafka.bootstrap-servers 配置kafak的broker地址，格式为 host:port，可以配置多个，用“，”隔开；

2：spring.kafka.client-id 发出请求时传递给服务器的ID，用于服务器端日志记录；

（二）消费者配置

3：spring.kafka.consumer.bootstrap-servers 配置kafak customer 的broker地址，格式为 host:port，可以配置多个，用“，”隔开；优先级比spring.kafka.bootstrap-servers高，当不设置时，使用spring.kafka.bootstrap-servers的值；

4：spring.kafka.consumer.client-id 发出请求时传递给服务器的ID，用于服务器端日志记录，不设置时，系统会自动生成；

5：spring.kafka.consumer.group-id 设置当前消费者所在组的名称；

6：spring.kafka.consumer.enable-auto-commit 消费者的消费记录offset是否后台自动提交；

7：spring.kafka.consumer.auto-commit-interval 当消费者的消费记录offset是否后台自动提交时，多长时间自动提交一次；

8：spring.kafka.consumer.auto-offset-reset 当Kafka中没有初始偏移量或服务器上不再存在当前偏移量时该怎么办，

　　earliest：自动将偏移量重置为最早的偏移量；

　　latest：自动将偏移量重置为最迟的偏移量；

　　none：如果未找到消费者组的先前偏移量，则将异常抛出给消费者；

　　exception：向消费者抛出异常；

9：spring.kafka.consumer.max-poll-records 一次调用poll（）返回的最大记录数，默认是500；

10：spring.kafka.consumer.fetch-max-wait 当没有足够的数据（数据的大小不小于 fetch.min.bytes）返回给客户端时，服务器最大阻塞时间；

11：spring.kafka.consumer.fetch-min-size 服务器应为获取请求返回的最小数据量（以字节为单位）

12：spring.kafka.consumer.heartbeat-interval 消费者协调员之间心跳的预期时间（单位是毫秒）

13：spring.kafka.consumer.key-deserializer 消费者所有keys的序列化类，默认是 org.apache.kafka.common.serialization.StringDeserializer

14：spring.kafka.consumer.value-deserializer 消费者所有values的序列化类，默认是 org.apache.kafka.common.serialization.StringDeserializer

15：spring.kafka.consumer.properties 消费者其他属性配置，类型 java.util.Map<java.lang.String,java.lang.String>；

（三）生产者配置

1：spring.kafka.producer.bootstrap-servers 配置kafak produce的broker地址，格式为 host:port，可以配置多个，用“，”隔开；优先级比spring.kafka.bootstrap-servers高，当不设置时，使用spring.kafka.bootstrap-servers的值；

2：spring.kafka.producer.client-id 发出请求时传递给服务器的ID，用于服务器端日志记录，不设置时，系统会自动生成；

3：spring.kafka.producer.acks 生产者要求数据有多少个副本接收到数据才算发送成功，类型是java.lang.String，

　　“0” ：表示生产者数据发送到leader就算写入成功，但是如果leader在把数据写到本地磁盘时报错，就会数据丢失，akcs设置为0时，kafka可以达到最大的吞吐量；

　　“1"：表示生产者数据发送到leader并写入到磁盘才算写入成功，但是如果数据在同步到其他副本时，leader挂了，其他副本被选举为新leader，那么就会有数据丢失；

　　“-1”， “all“：表示生产者把数据发送到leader，并同步到其他副本，才算数据写入成功，这种模式一般不会产生数据丢失，但是kafka的吞吐量会很低；

4：spring.kafka.producer.batch-size 默认批处理大小（以字节为单位）。小批量将使分批变得不那么普遍，并且可能会降低吞吐量（零批量将完全禁用批处理）。

5：spring.kafka.producer.buffer-memory 生产者可以用来缓冲等待发送到服务器的记录的内存总字节数。

6：spring.kafka.producer.compression-type 生产者生成的所有数据的压缩类型，默认值为"none"，可以配置为"gzip"，“snappy”和“lz4”。

千万不要忽略这个参数，可以大幅度提高推送效率，之前我有个车联网项目，推送协议采用json的格式。采用none的方式是每秒250条左右，后采用gzip后，每秒2000条。因为大部分json的报文在20kb左右，通过gzip后只有2kb，一下数据少了10倍。

7：spring.kafka.producer.key-deserializer 生产者所有keys的序列化类，默认是 org.apache.kafka.common.serialization.StringDeserializer

8：spring.kafka.producer.value-deserializer 生产者所有values的序列化类，默认是 org.apache.kafka.common.serialization.StringDeserializer

9：spring.kafka.producer.retries 当数据发送失败时，可以重试发送的次数

10：spring.kafka.producer.transaction-id-prefix 不为空时，为生产者启用事务支持

11：spring.kafka.producer.properties 生产者其他属性配置，类型 java.util.Map<java.lang.String,java.lang.String>；

这里两个其他属性配置，常用的

消息体大小max.request.size
发送频率，和batch.size参数满足任一条件发送linger.ms

spring:
  kafka:
    producer:
      bootstrap-servers: 172.16.3.130:9092
      key-serializer: org.apache.kafka.common.serialization.StringSerializer
      value-serializer: org.apache.kafka.common.serialization.StringSerializer
      batch-size: 131072  #128kb
      buffer-memory: 67108864 #64M
      #max-request-size: 5242880
      #linger-ms: 5
      retries: 1
      acks: 0
      compression-type: gzip  #提升性能很重要
      properties:
        max.request.size: 5242880 #5M
        linger.ms: 5

（四）消费者监听器

1：spring.kafka.listener.type 监听类型，类型 Listener.Type，

　　Type.SINGLE：一次调用一个ConsumerRecord的端点，默认

　　Type.BATCH：用一批ConsumerRecords调用端点。

2：spring.kafka.listener.ack-mode 当 auto.commit.enable 设置为false时，表示kafak的offset由customer手动维护，spring-kafka提供了通过ackMode的值表示不同的手动提交方式；

　　AckMode.RECORD 当每一条记录被消费者监听器（ListenerConsumer）处理之后提交

　　AckMode.BATCH 当每一批poll()的数据被消费者监听器（ListenerConsumer）处理之后提交

　　AckMode.TIME 当每一批poll()的数据被消费者监听器（ListenerConsumer）处理之后，距离上次提交时间大于TIME时提交

　　AckMode.COUNT 当每一批poll()的数据被消费者监听器（ListenerConsumer）处理之后，被处理record数量大于等于COUNT时提交

　　AckMode.COUNT_TIME 上述 TIM 或 COUNT 有一个条件满足时提交

　　AckMode.MANUAL 当每一批poll()的数据被消费者监听器（ListenerConsumer）处理之后, 手动调用Acknowledgment.acknowledge()后提交

　　AckMode.MANUAL_IMMEDIATE 手动调用Acknowledgment.acknowledge()后立即提交

3：spring.kafka.listener.client-id 监听器的使用者的client.id属性的前缀

4：spring.kafka.listener.concurrency 在监听器容器中运行的线程数，表示启动多少个并发的消费者，这个值不能大于实际消费的主题的分区数

5：spring.kafka.listener.poll-timeout 消费者一次poll方法的超时时间，当在一次poll方法中，如果一次请求不到数据或者请求的数据小于设定的值，那么poll方法会继续执行请求，直到超时或者满足设置的条件

6：spring.kafka.listener.no-poll-threshold

7：spring.kafka.listener.ack-count 当 spring.kafka.listener.ack-mode 设置为 AckMode.COUNT 或者 AckMode.COUNT_TIME 时生效，表示当一个poll数据消费后，处理的记录数大于多少时，触发提交

8：spring.kafka.listener.ack-time 当 spring.kafka.listener.ack-mode 设置为 AckMode.TIME 或者 AckMode.COUNT_TIME 时生效，表示当一个poll数据消费后，距离上次提交时间大于 ack-time 时提交

9：spring.kafka.listener.idle-event-interval 发布空闲的消费者事件之间的时间（未接收到数据）

10：spring.kafka.listener.monitor-interval 无反应的消费者检查之间的时间。如果未指定持续时间后缀，则将使用秒

参考：

kafka原理五之springboot 集成批量消费_kafka批量消费-CSDN博客