k8s node节点断电重启出问题；flannel重启失败 CrashLoopBackOff；flannel pod报错"Back-off restarting failed container" ；

问题如100字的题产生原因kubeadm装了k8s（各项指标正常）结果电脑蓝屏重启；kubectl get nodes查看发现node节点都处于not ready状态。解决过程进入节点，查看systemctl status docker; systemctl status kubelet;发现docker好的，kubelet挂了。（如果docker挂了且一直卡st...

吐司吐丝

5784人浏览 · 2020-02-17 12:04:26

吐司吐丝 · 2020-02-17 12:04:26 发布

问题

如100字的题

产生原因

kubeadm 装了k8s（各项指标正常）结果电脑蓝屏重启；kubectl get nodes 查看发现node节点都处于not ready 状态。

解决过程

进入节点，查看systemctl status docker; systemctl status kubelet; 发现docker好的，kubelet挂了。

（如果docker挂了且一直卡starting状态，用journalctl -uf docker发现问题，如果问题都好的，再ps -ef docker 查看是否有父进程为1 的docker进程，有的话kill -9 docker进程id，有多少kill多少，再systemctl start docker看下)

journalctl -uf kubelet发现swap没关；swapoff -a 关闭，再systemctl start kubelet；启动，再到master节点查看nodes ，全ready的。

然而问题并没有解决完，通过 kubectl get pods -n kube-system 查看发现node节点上的flannel pod状态是 Init:CrashLoopBackOff

通过 kubectl describe pod [ flannel pod名 ] 查看信息，发现 Back-off restarting failed container

通过 kubectl logs [flannel pod 名] 查看信息，发现 [Bad request] container "kube-flannel" in pod "kube-flannel-ds-amd64-xbhvp" is waiting to start 啥的。

把以上所有获取到的信息在网上搜了个遍没找着结果，有说节点加个subnet.env不行，有说yaml文件或是安装时就没有配置正确的。最后，我试了下，kubectl delete -f 【之前安装flannel的yml】删除pod,再 kubectl apply -f 重装，再在master节点上kubeadm token create --print-join-command （在node节点运行Kubectl会失败因为是用Kubeadm装的，kubectl在node没权限会被refused）

在子节点kubeadm reset; kubeadm join... (之前获取的join-command) ，发现原来ready的节点经过我这一折腾直接not ready，傻掉了

解决方案

最后，求助大佬，大佬说你把selinux和firewall 关闭试试，然后就解决了。。之前not ready也好了，所有pod 也running了。。

systemctl stop firewalld; systemctl disable firewalld; //关闭防火墙及设置开机关闭

vi /etc/selinux/config 将selinux改为disabeld; setenforce 0; //关闭selinux及设置开机关闭

swapoff -a; vi /etc/fstab 注释最后一行swap命令; //关闭swap及设置开机关闭

===========================================================================================

总结：

使用ansible装的时候没有设置SELINX开机关闭产生的，结果重启后又开回起来了，以及SELINUX产生的问题从日志中不好看出来。

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub