k8s集群节点维护

一、node节点维护流程对k8s集群资源进行梳理，先确认集群资源是否允许进行该操作若集群资源不足，可加入新的node节点之后再进行维护操作确认无资源问题后进行pod驱逐：kubelet drain<node_name>（检查对应节点状态是否处于SchedulingDisabled检查node上是否无pod运行，切被驱逐的pod已经在其他节点运行正常确认状态为SchedulingDisa

熬夜使我眼圈黑了

1609人浏览 · 2022-05-20 16:20:33

熬夜使我眼圈黑了 · 2022-05-20 16:20:33 发布

一、node节点维护流程

对k8s集群资源进行梳理，先确认集群资源是否允许进行该操作
若集群资源不足，可加入新的node节点之后再进行维护操作
确认无资源问题后进行pod驱逐：kubelet drain <node_name>（
检查对应节点状态是否处于SchedulingDisabled
检查node上是否无pod运行，切被驱逐的pod已经在其他节点运行正常
确认状态为SchedulingDisabled，且pod已经在其他节点运行正常后执行后续操作
关闭集群相关服务及docker服务
关机维护
开机启动相关服务（注意启动顺序）
解除node节点不可调度：kubectl uncordon node
创建测试pod，并使用节点标签测试节点可以被正常调度
二、kubernetes处理node的命令详解（cordon、drain、delete node区别）

主要目的：导致node处于不可调度状态，新创建的pod容器不会调度在node上。
cordon：将node置为SchedulingDisabled不可调度状态，后续的新创建pod容器时scheduler调度不会考虑该node旧的pod容器不会正常受影响，仍可以对外提供正常服务。(特殊情况：pod容器如果跟node绑定的话，容器下次更新就不会回到原宿主机，该情况如何处理呢？可能设置成不可调度状态就不太合适。调度器预调度策略）
恢复调度 kubectl uncordon node
drain 驱逐节点：设置该node为不可调度状态 cordon，驱逐node节点上pod，使其在其他节点上创建。gracefully terminate all pods
恢复调度 kubectl uncordon node
delete 节点：delete node后 kubernetes集群管控端获取不到node信息。master节点删除该node，失去对其控制，master不可对其恢复驱逐node上的pod容器。(如何驱赶呢？参考 https://blog.csdn.net/li_101357/article/details/89606269 ，主要是podGCcontroller来做这件事情) 疑问是：master删除node了，GC怎么删除呢？强制删除
恢复调度，需要进入node节点，重新加入集群

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub