问题信息

问题现象描述

01-15,收到测试同学反馈,操作库存后,库存扩展数据没有变化。库存扩展数据是通过kafka消息异步更新的

查看消息处理
通过kafka做消息分发,producer和consumer均是同一个应用,消息发送正常,但consumer一直未获取到消息。
应用所有topic的消息均没有被消费。
重启应用后,消息消费正常。运行一段时间,又重现该问题场景

排查过程

找运维同事了解了下,1-14号下午kafka挂过一次,服务器硬盘满了。
自己从kafka自带的consumer,找了一个topic订阅,可以正常消费。
看了下consumer对应的线程,线程没有挂。
topic本身的状态查了下,ok (之前碰到过topic leader挂掉了)
topic本身状态查询 https://blog.csdn.net/LG772EF/article/details/65633359

查看这个group的consumer,发现没有消费者

[yanfa3@hositvm01 bin]$ ./kafka-consumer-groups.sh --new-consumer --bootstrap-server 192.168.6.65:9092 --group resourcecenteGroup --describe | grep "BUSINESS_LOG"
Note: This will only show information about consumers that use the Java consumer API (non-ZooKeeper-based consumers).

Consumer group 'resourcecenteGroup' has no active members.
BUSINESS_LOG 0 62798 62894 96 - - -
BUSINESS_LOG 1 63100 63189 89 - - -
BUSINESS_LOG 2 62583 62685 102 - - -

重启下应用,查看启动日志,consumer, 应用一直在更新kafka的元信息(等待coordinator准备)
一直在重复做这几个动作 (请求coordinate). 接收到的group coordinator response, error_code=15 (一直是这个反馈)
GROUP_COORDINATOR_NOT_AVAILABLE(15, new GroupCoordinatorNotAvailableException(“The group coordinator is not available.”))
查询到的ELK日志,一直在重复输出下面内容
在这里插入图片描述
应该是对应以下代码块
在这里插入图片描述

问题原因

猜测是kafka挂掉导致异常 ?? 这个没有找到,有清楚的同学麻烦告知,多谢

解决方案

最终把应用所使用的group修改掉了

下面列出的idea是找到的一些其他思路
清理所有的offset_topics or 重建所有资源的topic or 修改资源所使用的group
在这里插入图片描述



https://stackoverflow.com/questions/40316862/the-group-coordinator-is-not-available-kafka

在这里插入图片描述


参考资料

https://www.cnblogs.com/benfly/p/9605976.html
https://stackoverflow.com/questions/51952398/kafka-connect-distributed-mode-the-group-coordinator-is-not-available

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐