K8S故障排除方法

1.查看pods哪些是有问题的，Running正常，其他异常:/opt/kubernetes/bin/kubectl get pods --all-namespaces -owideNAMESPACE NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODEdefault nginx-dbddb74b8-d78cd 1/1 Running 0 17

zhangge3663

1146人浏览 · 2020-10-09 09:33:03

zhangge3663 · 2020-10-09 09:33:03 发布

1.查看pods哪些是有问题的，Running正常，其他异常:

/opt/kubernetes/bin/kubectl get pods --all-namespaces -owide
NAMESPACE NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE
default nginx-dbddb74b8-d78cd 1/1 Running 0 17m 172.17.90.3 192.168.18.148 <none>

2.查看异常pod的详情

/opt/kubernetes/bin/kubectl describe pods nginx-dbddb74b8-2hthr

我这边异常信息如下:

Warning FailedScheduling 32m (x2 over 32m) default-scheduler 0/2 nodes are available: 2 node(s) had taints that the pod didn't tolerate.

解决办法:参考: https://github.com/kubernetes-sigs/kubespray/issues/2798

3.查看异常服务的详情

/opt/kubernetes/bin/kubectl describe services nginx

4.查看集群node的状态

/opt/kubernetes/bin/kubectl get nodes -o wide
NAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME
192.168.18.147 NotReady <none> 62m v1.12.1 192.168.18.147 <none> CentOS Linux 7 (Core) 3.10.0-862.el7.x86_64 docker://18.9.5

我这边是NotReady状态，经排查发现，node18.147上面的kubelet kube-proxy挂掉了，服务起来后就可以了

5.查看node详情

/opt/kubernetes/bin/kubectl describe node 192.168.18.147

Warning FailedScheduling 32m (x2 over 32m) default-scheduler 0/2 nodes are available: 2 node(s) had taints that the pod didn't tolerate.

这个的具体解决方法:

我这边查看pod详情，Taints显示如下:

Taints: node.kubernetes.io/unreachable:NoSchedule

执行如下命令后即可

[root@master tmp]# /opt/kubernetes/bin/kubectl taint nodes --all
node.kubernetes.io/unreachable-
node/192.168.18.147 untainted
node/192.168.18.148 untainted

6.查看集群组件状态

/opt/kubernetes/bin/kubectl get cs
NAME STATUS MESSAGE ERROR
scheduler Healthy ok
controller-manager Healthy ok
etcd-1 Healthy {"health": "true"}
etcd-2 Healthy {"health": "true"}
etcd-0 Healthy {"health": "true"}

7.查看服务集群IP、端口、运行时长

/opt/kubernetes/bin/kubectl get svc
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S)AGE
kubernetes ClusterIP 10.0.0.1 <none> 443/TCP 4h51m
nginx NodePort 10.0.0.215 <none> 88:40675/TCP 92m

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub