目录

一、pod生命周期

二、Pod 状态

三、Pod 重启策略 

四、Pod 容器探针

五、pod的三种控制器

六、pod的创建流程

理解版:

背诵版:

七、pod删除流程


一、pod生命周期

Pod 的 status 定义在 PodStatus 对象中,其中有一个 phase 字段。它简单描述了 Pod 在其生命周期的阶段。熟悉Pod的各种状态对我们理解如何设置Pod的调度策略、重启策略是很有必要的。

下面是 phase 可能的值:

Pending      
Pod 已被 Kubernetes 系统接受,但有一个或者多个容器镜像尚未创建。等待时间包括调度 Pod 的时间和通过网络下载镜像的时间,这可能需要花点时间。

Running      
该 Pod 已经绑定到了一个节点上,Pod 中所有的容器都已被创建。至少有一个容器正在运行,或者正处于启动或重启状态。

Succeeded    
Pod 中的所有容器都被成功终止,并且不会再重启。

Failed        
Pod 中的所有容器都已终止了,并且至少有一个容器是因为失败终止。也就是说,容器以非0状态退出或者被系统终止。

Unknown      
因为某些原因无法取得 Pod 的状态,通常是因为与 Pod 所在主机通信失败。

二、Pod 状态

Pod 有一个 PodStatus 对象,其中包含一个 PodCondition 数组,代表 Condition 是否通过。

PodCondition 属性描述:

字段                                          描述
lastProbeTime         最后一次探测 Pod Condition 的时间戳。
lastTransitionTime   上次 Condition 从一种状态转换到另一种状态的时间。
message                  上次 Condition 状态转换的详细描述。
reason                      Condition 最后一次转换的原因。
status                       Condition 状态类型,可以为 True、False、Unknown、
type                          Condition 类型

 Condition Type 的描述:

Type                                              描述
PodScheduled              Pod 已被调度到一个节点
Ready                           Pod 能够提供请求,应该被添加到负载均衡池中以提供服务
Initialized                      所有 init containers 成功启动
Unschedulable             调度器不能正常调度容器,例如缺乏资源或其他限制
ContainersReady         Pod 中所有容器全部就绪

三、Pod 重启策略 

Pod的重启策略(RestartPolicy)应用于Pod内的所有容器,并且仅在Pod所处的Node上由kubelet进行判断和重启操作。当某个容器异常退出或者健康检查失败时,kubelet将根据 RestartPolicy 的设置来进行相应的操作。

Pod的重启策略包括 AlwaysOnFailureNever,默认值为Always

  • Always:当容器失败时,由kubelet自动重启该容器。
  • OnFailure:当容器终止运行且退出码不为0时,有kubelet自动重启该容器。
  • Never:不论容器运行状态如何,kubelet都不会重启该容器。

失败的容器由 kubelet 以五分钟为上限的指数退避延迟(10秒,20秒,40秒…)重新启动,并在成功执行十分钟后重置。

四、Pod 容器探针

探针 是由 kubelet 对容器执行的定期诊断。要执行诊断,kubelet 调用由容器实现的 Handler。有三种类型的处理程序:

  • ExecAction:在容器内执行指定命令。如果命令退出时返回码为 0 则认为诊断成功。
  • TCPSocketAction:对指定端口上的容器的 IP 地址进行 TCP 检查。如果端口打开,则诊断被认为是成功的。
  • HTTPGetAction:对指定的端口和路径上的容器的 IP 地址执行 HTTP Get 请求。如果响应的状态码大于等于200 且小于 400,则诊断被认为是成功的。

每次探测都将获得以下三种结果之一:

  • Success:容器诊断通过
  • Failure:容器诊断失败
  • Unknown:诊断失败,因此不应采取任何措施

Kubelet 可以选择是否执行在容器上运行的两种探针执行和做出反应:

  • livenessProbe:指示容器是否正在运行。如果存活探测失败,则 kubelet 会杀死容器,并且容器将受到其 重启策略 的影响。如果容器不提供存活探针,则默认状态为 Success
  • readinessProbe:指示容器是否准备好服务请求。如果就绪探测失败,端点控制器将从与 Pod 匹配的所有 Service 的端点中删除该 Pod 的 IP 地址。初始延迟之前的就绪状态默认为 Failure。如果容器不提供就绪探针,则默认状态为 Success

五、pod的三种控制器

三种可用的控制器类型:

  • Job:例如批量计算,仅适用于 restartPolicy 为 OnFailure 或 Never 的 Pod
  • ReplicationControllerReplicaSet, 或 Deployment:例如 Web 服务,ReplicationControllers 仅适用于 restartPolicy 为 Always 的 Pod。
  • DaemonSet:需要在每个节点运行一个的 Pod,以便用于系统服务。

所有这三种类型的控制器都包含一个 PodTemplate。建议创建适当的控制器,让它们来创建 Pod,而不是直接自己创建 Pod。这是因为单独的 Pod 在机器故障的情况下没有办法自动复原,而控制器却可以。

如果节点死亡或与集群的其余部分断开连接,则 Kubernetes 将应用一个策略将丢失节点上的所有 Pod 的 phase 设置为 Failed。

六、pod的创建流程

理解版:

第一步:

kubectl 向api server 发起一个create pod 请求 

第二步:

api server接收到pod创建请求后,不会去直接创建pod,而是生成一个包含创建信息的yaml。

第三步:

apiserver 将刚才的yaml信息写入etcd数据库。到此为止仅仅是在etcd中添加了一条记录, 还没有任何的实质性进展。

第四步:

scheduler 查看 k8s api ,类似于通知机制。
首先判断:pod.spec.Node == null?
若为null,表示这个Pod请求是新来的,需要创建;因此先进行调度计算,找到最“闲”的node。
然后将信息在etcd数据库中更新分配结果:pod.spec.Node = nodeA (设置一个具体的节点)
ps:同样上述操作的各种信息也要写到etcd数据库中。

第五步:

kubelet 通过监测etcd数据库(即不停地看etcd中的记录),发现api server 中有了个新的Node;
如果这条记录中的Node与自己的编号相同(即这个Pod由scheduler分配给自己了);
则调用node中的docker api,创建container,然后将容器状态响应给apiserver

背诵版:

从上图中可以看出,Pod的创建过程主要有以下步骤:
1、用户通过kubele或者其他API客户端提交Pod创建指令。
2、API将Pod对象的相关信息存入ETCD,完成后API Server会给客户端反馈信息。
3、API Server开始反映ETCD中的变化
4、Kubernetes集群调度器使用“watch”监控机制来跟踪检查API Server上的相关变动并该Pod对象目前并未调度至任何结点。
5、Kubernetes集群调度器将该Pod对象调度到一个Node节点上运行。
6、调度信息由API Server更新到ETCD储存系统,并且API Server也开始反映Pod对象的调度结果。
7、运行该Pod对象的Node节点开始尝试启动Pod中的容器,并将容器的启动结果反馈给API Server。
8、API Server将Pod信息更新存储到ETCD。
9、在ETCD写入完成后,API Server将确认信息发送至Kubelet。
 

七、pod删除流程

用 kubectl 删除 pod
API server 更改 pod 状态为 Terminating
kubelet 监听到这个状态更改,开始停止这个 pod 的过程
如果有 preStop hook 的话,先运行这个 hook,如果 hook 在 terminationGracePeriodSeconds 之后还没运行完,kubelet 会给 pod 额外 2 秒的时间。
kubelet 让容器运行时发送 TERM 信号到每个容器中的进程 1。
当 pod 状态变为 Terminating 之后,pod 会从 Endpoints 下掉,
terminationGracePeriodSeconds 过了之后,pod 里面的进程会收到 SIGKILL,kubelet 也会清理 pause 容器,如果有的话
kubelet 把 terminationGracePeriodSeconds 改成了 0,强制从 API server 删除 pod
API server 删除 pod

Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐