k8s之Pod

k8s之Pod一、概述在Kubrenetes集群中Pod有如下两种使用方式pause容器使得Pod中的所有容器可以共享两种资源:网络和存储。二、Pod分类1.自主式Pod2.控制器管理的Podkubernetes中的pause容器主要为每个业务容器提供以下功能:·Kubernetes设计这样的Pod概念和特殊组成结构有什么用意三、Pod容器的分类1.基础容器（infrastructure cont

Zmac111

675人浏览 · 2021-08-21 22:42:55

Zmac111 · 2021-08-21 22:42:55 发布

k8s之Pod

一、概述
二、Pod分类
三、Pod容器的分类
四、镜像拉取策略(image PullPolicy )
五、资源限制
六、重启策略（restartPolicy）
七、健康检查：又称为探针（Probe）

一、概述

Pod是kubernetes中最小的资源管理组件，Pod也是最小化运行容器化应用的资源对象。
一个Pod代表着集群中运行的一个进程。kubernetes中其他大多数组件都是围绕着Pod来进行支撑和扩展Pod功能的。
例如，用于管理Pod运行的StatefulSet和Deployment等控制器对象，用于暴露Pod应用的Service和Ingress对象，为Pod提供存储的PersistentVolume存储资源对象等。

在Kubrenetes集群中Pod有如下两种使用方式

（1）一个Pod中运行一个容器。"每个Pod中一个容器"的模式是最常见的用法﹔在这种使用方式中，你可以把Pod想象成是单个容器的封装，kuberentes管理的是Pod而不是直接管理容器。

（2）在一个Pod中同时运行多个容器。一个Pod中也可以同时封装几个需要紧密耦合互相协作的容器，它们之间共享资源。这些在同一个Pod中的容器可以互相协作成为一个service单位，比如一个容器共享文件，另一个"sidecar"容器来更新这些文件。Pod将这些容器的存储资源作为一个实体来管理。

一个Pod 下的容器必须运行于同一节点上。现代容器技术建议一个容器只运行一个进程，该进程在容器中PID命令空间中的进程号为1，可直接接收并处理信号，进程终止时容器生命周期也就结束了。若想在容器内运行多个进程，需要有一个类似Linux操作系统init进程的管控类进程，以树状结构完成多进程的生命周期管理。运行于各自容器内的进程无法直接完成网络通信，这是由于容器间的隔离机制导致，k8s中的Pod资源抽象正是解决此类问题，Pod对象是一组容器的集合，这些容器共享Network、Uurs及IPc命令空间，因此具有相同的域名、主机名和网络接口，并可通过IPC直接通信。

Pod资源中针对各容器提供网络命令空间等共享机制的是底层基础容器pause，基础容器（也可称为父容器) pause就是为了管理Pod容器间的共享操作，这个父容器需要能够准确地知道如何去创建共享运行环境的容器，还能管理这些容器的生命周期。为了实现这个父容器的构想，kubernetes中，用pause容器来作为一个Pod中所有容器的父容器。
这个pause容器有两个核心的功能，一是它提供整个Pod的Linux命名空间的基础。二来启用PID命名空间，它在每个Pod中都作为PID为1进程（init进程)，并回收僵尸进程。
举例

pause容器使得Pod中的所有容器可以共享两种资源:网络和存储。

网络:
每个Pod都会被分配一个唯一的IP地址。Pod中的所有容器共享网络空间，包括TP地址和端口。Pod内部的容器可以使用localhost互相通信。Pod中的容器与外界通信时，必须分配共享网络资源（例如使用宿主机的端口映射）。

存储:
可以Pod指定多个共享的Volume。 Pod中的所有容器都可以访问共享的volume。Volume也可以用来持久化Pod中的存储资源，以防容器重启后文件丢失。

二、Pod分类

1.自主式Pod

这种Pod本身是不能自我修复的，当Pod被创建后〈不论是由你直接创建还是被其他Controller)，都会被Kuberentes调度到集群的Node E.。直到Pod的进程终止、被删掉、因为缺少资源而被驱逐、或者Node故障之前这个Pod都会一直保持在那个Node上。 Pod不会自愈。如果Pod运行的Node故障，或者是调度器本身故障，这个Pod就会被删除。同样的，如果Pod所在Node缺少资源或者Pod处于维护状态，Pod也会被驱逐。

2.控制器管理的Pod

Kubernetes使用更高级的称为Controller的抽象层，来管理Pod实例。Controller可以创建和管理多个Pod，提供副本管理、滚动升级和集群级别的自愈能力。例如，如果一个Node故障，Controller就能自动将该节点上的Pod调度到其他健康的Node上。虽然可以直接使用Pod,但是Kubernetes中通常是使用controller来管理Pod的。

kubernetes中的pause容器主要为每个业务容器提供以下功能:·

（1）在Pod中担任Linux命名空间（如网络命令空间）共享的基础;
（2）启用PID命名空间，开启init进程。

Kubernetes设计这样的Pod概念和特殊组成结构有什么用意

（1）在一组容器作为一个单元的情况下，难以对整体的容器简单地进行判断及有效地进行行动。比如，一个容器死亡了，此时是算体挂了么?那么引入与业务无关的Pause容器作为Pod的根容器，以它的状态代表着整个容器组的状态，这样就可以解决该问题。

（2）Pod里的多个业务容器共享Pause容器的IP，共享Pause容器挂载的volume，这样简化了业务容器之间的通信问题，也解决了容器之间的文件共享问题。

三、Pod容器的分类

1.基础容器（infrastructure container)

维护整个Pod 网络和存储空间
#node节点中操作
#启动一个容器时，k8s会自动启动一个基础容器

cat /opt/kubernetes/cfg/kubelet
... . ..
--pod-infra-container-image=registry.cn-hangzhou.aliyuncs.com/google-containers/pause-amd64:3.0"
#每次创建 Pod时候就会创建，运行的每一个容器都有一个 pause-amd64的基础容器自动会运行，对于用户是透明的
docker ps -a
registry.cn-hangzhou.aliyuncs.com/google-containers/pause-amd64:3.0  "/pause"

2.初始化容器（initcontainers)

#Init容器必须在应用程序容器启动之前运行完成，而应用程序容器是并行运行的，所以Init容器能够提供了一种简单的阻塞或延迟应用容器的启动的方法。

Init容器与普通的容器非常像,除了以下两点
（1）Init容器总是运行到成功完成为止

（2）每个Init容器都必须在下一个Init容器启动之前成功完成
如果 Pod 的Init容器失败，k8s会不断地重启该Pod，直到 Init容器成功为止。然而，如果Pod对应的重启策略（restartPolicy）为Never，它不会重新启动。

Init的容器作用
因为init容器具有与应用容器分离的单独镜像，其启动相关代码具有如下优势:

●Init容器可以包含一些安装过程中应用容器中不存在的实用工具或个性化代码。例如，没有必要仅为了在安装过程中使用类似 sedawk、python或dig这样的工具而去FROM一个镜像来生成一个新的镜像。

●Init容器可以安全地运行这些工具，避免这些工具导致应用镜像的安全性降低。

●应用镜像的创建者和部署者可以各自独立工作，而没有必要联合构建一个单独的应用镜像。

●init容器能以不同于Pod内应用容器的文件系统视图运行。因此，Init容器可具有访问Secrets的权限，而应用容器不能够访问。

●由于Init容器必须在应用容器启动之前运行完成，因此Init容器提供了一种机制来阻塞或延迟应用容器的启动，直到满足了一组先决条件。一旦前置条件满足，Pod内的所有的应用容器会并行启动。

3.应用容器（Maincontainer）

提供应用程序业务，并行启动

官网示例：https://kubernetes.io/docs/concepts/workloads/pods/init-containers/

特别说明:
（1）在Pod启动过程中，Init容器会按顺序在网络和数据卷初始化之后启动。每个容器必须在下一个容器启动之前成功退出。
（2）如果由于运行时或失败退出，将导致容器启动失败，它会根据Pod的restartPolicy指定的策略进行重试。然而，如果Pod的restartPolicy设置为Always，Init容器失败时会使用RestartPolicy策略。
（3）在所有的Init容器没有成功之前，Pod将不会变成Ready状态。Init容器的端口将不会在Service中进行聚集。正在初始化中的Pod处于Pending状态,I但应该会将Initializing状态设置为true.
（4）如果Pod重启，所有Init容器必须重新执行。
（5）对Init容器spec的修改被限制在容器image字段，修改其他字段都不会生效。更改Init容器的image字段，等价于重启该Pod。
（6）Init容器具有应用容器的所有字段。除了readinessProbe，因为Init容器无法定义不同于完成（completion)的就绪(readiness)之外的其他状态。这会在验证过程中强制执行。
（7）在Pod中的每个app和Init容器的名称必须唯一;与任何其它容器共享同一个名称，会在验证时抛出错误。

四、镜像拉取策略(image PullPolicy )

Pod 的核心是运行容器，必须指定容器引擎，比如 Docker，启动容器时，需要拉取镜像，k8s 的镜像拉取策略可以由用户指定:

（1）IfNotPresent:在镜像已经存在的情况下，kubelet 将不再去拉取镜像，仅当本地缺失时才从仓库中拉取，默认的镜像拉取策略
（2）Always:每次创建Pod都会重新拉取一次镜像;
（3）Never: Pod 不会主动拉取这个镜像，仅使用本地镜像。

注意:对于标签为":latest"的镜像文件，其默认的镜像获取策略即为"Always";而对于其他标签的镜像，其默认策略则为"IfNotPresent"

五、资源限制

当定义 Pod 时可以选择性地为每个容器设定所需要的资源数量。最常见的可设定资源是 CPU 和内存大小，以及其他类型的资源。

当为 Pod 中的容器指定了 request 资源时，调度器就使用该信息来决定将 Pod 调度到哪个节点上。当还为容器指定了 limit 资源时，kubelet 就会确保运行的容器不会使用超出所设的 limit 资源量。kubelet 还会为容器预留所设的 request 资源量，供该容器使用。

如果 Pod 运行所在的节点具有足够的可用资源，容器可以使用超出所设置的 request 资源量。不过，容器不可以使用超出所设置的 limit 资源量。

如果给容器设置了内存的 limit 值，但未设置内存的 request 值，Kubernetes 会自动为其设置与内存 limit 相匹配的 request 值。类似的，如果给容器设置了 CPU 的 limit 值但未设置 CPU 的 request 值，则 Kubernetes 自动为其设置 CPU 的 request 值并使之与 CPU 的 limit 值匹配。

官网示例：
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

Pod 和容器的资源请求和限制：

spec.containers[].resources.requests.cpu //定义创建容器时预分配的CPU资源
spec.containers[].resources.requests.memory //定义创建容器时预分配的内存资源
spec.containers[].resources.limits.cpu //定义 cpu 的资源上限
spec.containers[].resources.limits.memory //定义内存的资源上限

CPU 资源单位

CPU 资源的 request 和 limit 以 cpu 为单位。Kubernetes 中的一个 cpu 相当于1个 vCPU（1个超线程）。
Kubernetes 也支持带小数 CPU 的请求。spec.containers[].resources.requests.cpu 为 0.5 的容器能够获得一个 cpu 的一半 CPU 资源（类似于Cgroup对CPU资源的时间分片）。表达式 0.1 等价于表达式 100m（毫核），表示每 1000 毫秒内容器可以使用的 CPU 时间总量为 0.1*1000 毫秒。

内存资源单位

内存的 request 和 limit 以字节为单位。可以以整数表示，或者以10为底数的指数的单位（E、P、T、G、M、K）来表示，或者以2为底数的指数的单位（Ei、Pi、Ti、Gi、Mi、Ki）来表示。
如：1KB=10^{3=1000，1MB=10}6=1000000=1000KB，1GB=10^9=1000000000=1000MB
1KiB=2^{10=1024，1MiB=2}20=1048576=1024KiB

注：
在买硬盘的时候，操作系统报的数量要比产品标出或商家号称的小一些，主要原因是标出的是以 MB、GB为单位的，1GB 就是1,000,000,000Byte，而操作系统是以2进制为处理单位的，因此检查硬盘容量时是以MiB、GiB为单位，1GB=2^30=1,073,741,824，相比较而言，1GiB要比1GB多出1,073,741,824-1,000,000,000=73,741,824Byte，所以检测实际结果要比标出的少一些。
举例

vim demo1.yaml
apiVersion: v1
kind: Pod
metadata:
  name: frontend
spec:
  containers:
  - name: web
    image: nginx
    env:
    - name: WEB_ROOT_PASSWORD
      value: "password"
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"
  - name: wp
    image: wordpress
    resources:
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"


kubectl apply -f demo1.yaml
kubectl describe pod frontend

kubectl get pods -o wide

kubectl describe nodes node01				#由于当前虚拟机有2个CPU，所以Pod的CPU Limits一共占用了50%

六、重启策略（restartPolicy）

Pod在遇到故障之后重启的动作

1、Always：当容器终止退出后，总是重启容器，默认策略

2、OnFailure：当容器异常退出（退出状态码非0）时，重启容器；正常退出则不重启容器

3、Never：当容器终止退出，从不重启容器。

注意：K8S 中不支持重启 Pod 资源，只有删除重建

kubectl edit deployment nginx-deployment
......
 restartPolicy: Always

举例

vim demo2.yaml
apiVersion: v1
kind: Pod
metadata:
  name: foo
spec:
  containers:
  - name: busybox
    image: busybox
    args:
    - /bin/sh
    - -c
    - sleep 30; exit 3


kubectl apply -f demo2.yaml

#查看Pod状态，等容器启动后30秒后执行exit退出进程进入error状态，就会重启次数加1
kubectl get pods


kubectl delete -f demo2.yaml

vim demo2.yaml
apiVersion: v1
kind: Pod
metadata:
  name: foo
spec:
  containers:
  - name: busybox
    image: busybox
    args:
    - /bin/sh
    - -c
    - sleep 30; exit 3
  restartPolicy: Never
#注意：跟container同一个级别

kubectl apply -f demo2.yaml

#容器进入error状态不会进行重启
kubectl get pods -w

七、健康检查：又称为探针（Probe）

探针是由kubelet对容器执行的定期诊断。

探针的三种规则：

（1）livenessProbe ：判断容器是否正在运行。如果探测失败，则kubelet会杀死容器，并且容器将根据 restartPolicy 来设置 Pod 状态。如果容器不提供存活探针，则默认状态为Success。

（2）readinessProbe ：判断容器是否准备好接受请求。如果探测失败，端点控制器将从与 Pod 匹配的所有 service endpoints 中剔除删除该Pod的IP地址。初始延迟之前的就绪状态默认为Failure。如果容器不提供就绪探针，则默认状态为Success。

（3）startupProbe（这个1.17版本增加的）：判断容器内的应用程序是否已启动，主要针对于不能确定具体启动时间的应用。如果配置了 startupProbe 探测，在则在 startupProbe 状态为 Success 之前，其他所有探针都处于无效状态，直到它成功后其他探针才起作用。如果 startupProbe 失败，kubelet 将杀死容器，容器将根据 restartPolicy 来重启。如果容器没有配置 startupProbe，则默认状态为 Success。
#注：以上规则可以同时定义。在readinessProbe检测成功之前，Pod的running状态是不会变成ready状态的。