k8s节点故障时,工作负载的调度周期
在默认配置下,k8s节点故障时,工作负载的调度周期约为6分钟,这是为何?首先请了解下属参数概念:node-monitor-period节点控制器(node controller) 检查每个节点的间隔,默认5秒。node-monitor-grace-period节点控制器判断节点故障的时间窗口, 默认40秒。即40 秒没有收到节点消息则判断节点为故障。pod-eviction-timeout当节点故
·
在默认配置下,k8s节点故障时,工作负载的调度周期约为6分钟,这是为何?
首先请了解下属参数概念:
- node-monitor-period
- 节点控制器(node controller) 检查每个节点的间隔,默认5秒。
- node-monitor-grace-period
- 节点控制器判断节点故障的时间窗口, 默认40秒。即40 秒没有收到节点消息则判断节点为故障。
- pod-eviction-timeout
- 当节点故障时,kubelet允许pod在此故障节点的保留时间,默认300秒。即当节点故障5分钟后,kubelet开始在其他可用节点重建pod。
其次看图说话:
5+40+300 ≈ 6分钟
参考文献:
- https://kubernetes.io/zh/docs/concepts/architecture/nodes/
- https://medium.com/tailwinds-navigator/kubernetes-tip-how-to-make-kubernetes-react-faster-when-nodes-fail-1e248e184890
更多推荐
已为社区贡献4条内容
所有评论(0)