在默认配置下,k8s节点故障时,工作负载的调度周期约为6分钟,这是为何?

首先请了解下属参数概念:

  • node-monitor-period
    • 节点控制器(node controller) 检查每个节点的间隔,默认5秒。
  • node-monitor-grace-period
    • 节点控制器判断节点故障的时间窗口, 默认40秒。即40 秒没有收到节点消息则判断节点为故障。
  • pod-eviction-timeout
    • 当节点故障时,kubelet允许pod在此故障节点的保留时间,默认300秒。即当节点故障5分钟后,kubelet开始在其他可用节点重建pod。

其次看图说话:
5+40+300 ≈ 6分钟
在这里插入图片描述

参考文献:

  • https://kubernetes.io/zh/docs/concepts/architecture/nodes/
  • https://medium.com/tailwinds-navigator/kubernetes-tip-how-to-make-kubernetes-react-faster-when-nodes-fail-1e248e184890
Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐