K8s中内置的Prometheus 异常，不断重启的解决方案

如果Prometheus-k8s-0一直重启，则不光需要操作Prometheus-k8s-0，也需要对它的另一个实例Prometheus-k8s-1进行处理。执行命令： kubectl get pv pvc-cb0b2232-0ddb-4828-ac5b-706916d8de63 -o yaml。注意命令最后的k8s-system ，是根据需要(不断重启的pod)选择k8s 或 k8s-syste

爱刘温柔的小猪

2279人浏览 · 2023-04-23 08:57:25

爱刘温柔的小猪 · 2023-04-23 08:57:25 发布

要说明的一点是：此处理方式会进行数据的删除，并且多实例情况下最好都做下操作。多实例都操作一遍的意思就是比如我普罗米修斯有如下四个：
在这里插入图片描述
如果Prometheus-k8s-0一直重启，则不光需要操作Prometheus-k8s-0，也需要对它的另一个实例Prometheus-k8s-1进行处理。如果是Prometheus-k8s-system0出问题也是同理，需要把system1也一并处理下，因为他们有同步机制。

正文开始！！！

1、找到Prometheus 的数据卷，清空里面的内容（Prometheus不断重启，往往是储存的数据过多引起的，程序被拖死或者无法同步）

执行命令： kubectl get pv | grep “prometheus”

在这里插入图片描述

2、根据名字，找到不断重启的Prometheus项目，打开配置文件,找到节点和路径。

执行命令： kubectl get pv pvc-cb0b2232-0ddb-4828-ac5b-706916d8de63 -o yaml

在这里插入图片描述
3、先关掉prometheus。

命令：kubectl edit prometheus -n kubesphere-monitoring-system k8s-system

注意命令最后的k8s-system ，是根据需要(不断重启的pod)选择k8s 或 k8s-system。
然后将其实例数从2设置为0（记得记录下原值）
在这里插入图片描述

4、到pv所在节点的机器（例子里是Node4节点机器）上，打开所在目录。

执行命令：cd /var/openebs/local/pvc-cb0b2232-0ddb-4828-ac5b-706916d8de63
再执行命令：ls

在这里插入图片描述

删除：promethes-db

命令：rm -rf promethes-db

5、回到主节点，恢复promethes的实例数。

命令：kubectl edit prometheus -n kubesphere-monitoring-system k8s-system

注意命令最后的k8s-system ，是根据需要(不断重启的pod)选择k8s 或 k8s-system。
然后将其实例数从0设置为2（恢复原值）

在这里插入图片描述

至此，就已经解决了不断重启的问题。记得多实例一定要都操作一次，把多个实例的pvc中的db都删除了，在启动。

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub