k8s 重启pod_K8S环境的Jenkin性能问题处理

环境信息在K8S环境通过helm部署了Jenkins(namespace为helm-jenkins)，用于日常Java项目构建：kubernetes：1.15jenkins：2.190.2helm版本：2.16.1如果您想了解helm部署Jenkins的详情，请参考《Helm部署和体验jenkins》问题描述当Jenkins任务密集时，Jenkins页面响应缓慢，偶尔有白屏情况发生(稍后自动恢复)

weixin_39607090

384人浏览 · 2020-12-03 16:37:05

weixin_39607090 · 2020-12-03 16:37:05 发布

环境信息

在K8S环境通过helm部署了Jenkins(namespace为helm-jenkins)，用于日常Java项目构建：

kubernetes：1.15
jenkins：2.190.2
helm版本：2.16.1

如果您想了解helm部署Jenkins的详情，请参考《Helm部署和体验jenkins》

问题描述

当Jenkins任务密集时，Jenkins页面响应缓慢，偶尔有白屏情况发生(稍后自动恢复)，且构建速度明显变缓，此时去后台看一下环境信息：

K8S环境已装了metrics-server，用命令kubectl top pod --all-namespaces可以看到Jenkins所占内存仅有410兆，如下图：

Jenkins是Java应用，在处理大量任务的时候，410兆的内存应该是不够的，JVM内存不足会导致频繁的垃圾回收，接下来顺着这个思路去看JVM内存情况；

由上图可知pod名为my-jenkins-74bcdfc566-lmhnw，通过由上图可知pod名为my-jenkins-74bcdfc566-lmhnw，通过kubectl describe pod my-jenkins-74bcdfc566-lmhnw -n helm-jenkins查看此pod详情：查看此pod详情：

由上图红框1可知此pod运行在node3节点，红框2显示对应的docker容器ID为f9ae211abe99(前12位)；

去node3机器上执行docker ps，果然发现了ID为f9ae211abe99的容器，如下图：

执行命令docker exec f9ae211abe99 jps查看容器内所有java进程的PID，如下图，可见Jenkins服务在容器内的PID等于6：

知道了容器ID和java进程的PID，就可以查看JVM信息了，执行命令docker exec f9ae211abe99 jstat -gcutil 6 3s 99查看GC情况，如下图，除了YGC频繁，还出现了FGC：

再用命令docker exec f9ae211abe99 jmap -heap 6查看JVM内存情况，如下图，年轻代太小了，只有100兆：

最后用命令docker exec f9ae211abe99 ps -ef | grep java查看该进程的启动命令，如下图，可见启动该java进程时没有指定内存参数：

在观察的过程中，ID为f9ae211abe99的容器突然不见了，取而代之的是一个ID为7f1f94d79e46新容器，如下图所示：

执行命令kubectl get event -n helm-jenkins查看该命名空间的所有事件，如下图红框所示，发现原来是探针不响应迫使K8S重启该pod：

诊断已经完成，根据前面的信息可以推测：JVM内存太小，YGC频繁，甚至会有FGC出现，系统响应过慢还可能导致K8S探针判断容器不健康，引发docker容器被删除后重新创建，接下来就调整JVM参数，验证推测是否正确；

调整参数

宿主机节点有16G物理内存，没有其他业务，因此打算划分8G内存给Jenkins；

执行命令kubectl edit deployment my-jenkins -n helm-jenkins，编辑jenkins的deployment，找到JAVA_OPTS参数的位置，在下面增加value，如下图红框所示：

就像vi工具编辑文本文件那样操作，保存退出后，pod被重建

找到docker容器ID后，执行命令docker exec 591dc47d4d57 jmap -heap 6查看JVM内存，如下图所示，堆上限已经达到8G，年轻代是3686兆(调整前只有106兆)：

并发执行任务一段时间后，观察GC情况发现并不频繁：

再来看看该进程的启动命令，执行命令docker exec 591dc47d4d57 ps -ef|grep java，如下图红框所示，刚才设置的内存参数已经被用在启动命令中了：

运行一段时间，确认任务可正常执行，页面操作也比较流畅，查看K8S事件，再也没有出现pod重启的事件；

关于修改参数的方法

除了kubectl edit命令，还可以将helm的Jenkins配置信息全部下载到本地，修改后再部署Jenkins服务，如果您想了解更多，请参考《Helm部署的服务如何修改配置》

至此，K8S环境下Jenkins性能问题处理已经完成，希望能给您带来一些参考；

欢迎关注公众号：程序员欣宸

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub