Docker部署的java项目,如何排查线程数量持续增多的原因

现象

项目是用docker部署的,起初,发现线程数量每天持续增多,直到有一天线程数量增加到一定程度以后,服务器卡死。

分析、解决问题

  1. 分析是哪个进程的线程持续在增加
    输入命令 htop ,确认是不是线程在持续增加(如果没有该命令,yum安装一个),发现红色框标识的地方的线程数持续在增加。
    红色框为线程数 ,看是否在持续增加

    输入命令 atop ,观看是那一个进程在持续增加线程(如果没有该命令,yum安装一个),查出异常进程的pid为 11122
    红色框内为该异常进程的pid以及线程数

  2. 确认是哪个docker服务
    输入命令 pwdx 11122 (格式为pwdx pid),可以看出该服务在/imcp/venus 目录下。

    输入命令 docker ps ,查看该docker服务为imcp-venus。
    红框内为该docker服务

    或者在atop面板中可以看出 ,异常进程的cid,对应docker服务的container id,可以找出是imcp-venus 服务。

  3. 进入docker服务,利用arthas工具查看线程栈
    首先 docker exec -it imcp-venus /bin/sh 命令,进入容器。
    其次 cd /opt/arthas 命令,进入到 arthas-boot.jar 包所在文件夹。
    最后 java -jar arthas-boot.jar 90 (最后一个参数为docker服务内部,imcp-venus 服务的进程号pid ,ps命令 可查看)命令,启动arthas。
    启动arthas
    再之后,输入命令 thread 再次确认是否是该服务,发现waiting状态的线程数量超级多。
    thread命令

    再输入 thread --all 查看 是哪个线程在持续增加,发现为pool-n-thread-1 的线程在一直增加 。
    thread --all 命令 查看全部线程信息

    再最后 thread -n 100 查看 持续增加的这个线程的栈信息,如果没找到可以最后面100参数的基础上持续增加,直到找到该线程的栈信息。根据栈信息查看是代码中哪个位置出问题了。
    thread -n 100 命令为 查看最忙碌的前一百个线程栈信息

扩展

可以利用 jprofiler 工具可视化的查看本地线程栈信息。
cat /proc/pid/status 格式命令可以 查看pid进程的信息。
ps -eLF|wc -l 命令 可以直接输出当前linux服务下所有的线程数。

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐