李不懂927 个人主页

@qq1314233

李不懂927

2023-05-16 11:29:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

记一次pod频繁重启事故分析

某一天下午阿里云频繁打电话给到我的手机，报警内容是waf防火墙的某个域名出现大量5xx报警，我立即去阿里云ack集群查看对应域名的pod状态，发现对应的pod处于重启状态，查看日志与详细信息，发现是存活探针造成的重启。这个正是HttpClient中的连接池满了的迹象，线程在等待可用连接，最终导致jetty的线程被打满，造成服务假死，自然是不能及时响应健康检查，最终触发k8s的重启策略（开发人员分析

#java

k8s基础

Task: 在 cgroup 中，task 可以理解为一个进程，但这里的进程和一般意义上的操作系统进程不太一样，实际上是进程 ID 和线程 ID 列表。CGroup: 即控制组，一个控制组就是一组按照某种标准划分的 Tasks，可以理解为资源限制是以进程组为单位实现的，一个进程加入到某个控制组后，就会受到相应配置的资源限制。

#kubernetes

记一次harbor2.4.3证书更换问题处理过程与分析

4.在harbor安装目录下面执行docker-composedown 停止所有容器，再执行docker-composeup-d来重启所有容器，再查看所有容器状态。8.最后我使用./install--with-chartmuseum--with-notary--with-trivy来重启所有容器，ok，问题解决。7.这与我们前面的13个容器不一样，登录ui页面也登录不了，而且docker-comp

#服务器 #运维

到底了