logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

记一次pod频繁重启事故分析

某一天下午阿里云频繁打电话给到我的手机,报警内容是waf防火墙的某个域名出现大量5xx报警,我立即去阿里云ack集群查看对应域名的pod状态,发现对应的pod处于重启状态,查看日志与详细信息,发现是存活探针造成的重启。这个正是HttpClient中的连接池满了的迹象,线程在等待可用连接,最终导致jetty的线程被打满,造成服务假死,自然是不能及时响应健康检查,最终触发k8s的重启策略(开发人员分析

文章图片
#java
k8s基础

Task: 在 cgroup 中,task 可以理解为一个进程,但这里的进程和一般意义上的操作系统进程不太一样,实际上是进程 ID 和线程 ID 列表。CGroup: 即控制组,一个控制组就是一组按照某种标准划分的 Tasks,可以理解为资源限制是以进程组为单位实现的,一个进程加入到某个控制组后,就会受到相应配置的资源限制。

文章图片
#kubernetes
记一次harbor2.4.3证书更换问题处理过程与分析

4.在harbor安装目录下面执行docker-composedown 停止所有容器,再执行docker-composeup-d来重启所有容器,再查看所有容器状态。8.最后我使用./install--with-chartmuseum--with-notary--with-trivy来重启所有容器,ok,问题解决。7.这与我们前面的13个容器不一样,登录ui页面也登录不了,而且docker-comp

文章图片
#服务器#运维
到底了