K8s常见故障排查思路

step_1: kubectl get node

1. 查看集群节点是否处于 Ready 状态
        a. 如果是Ready状态,再使用kubectl describe node <nodeName>, 资源使用率
        b. 如果是NotReady,则使用kubectl  get node -owide 查看对应的节点,然后登陆到对应节点上, 查看kubelet 和docker 服务是否正常;

step_2: kubectl get cs

1. 查看集群关键组件的状态是否是 Healthy
        a. 如果是,不予理睬
        b. 如果是Unhealthy 状态,使用则使用kubectl  get node -owide 查看对应的节点,然后登陆到对应节点上查看kubelet 和docker 服务是否正常;

step_3: kubectl -n <namespace> get pod -owide <-w>

查看pod 是否处于running 状态

step_4: kubectl -n <namespace> describe pod <podName>

查看非running 状态到具体可能原因

step_5: kubectl -n <namespace> logs -f <podName> [-c <containerName>]

Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐