K8S最小调度单位Pod详解

k8s里面非常重要的一个概念pod，首先简单的介绍是pod是k8s最小的调度单位，一个pod里面可以包含一个或者多个container，一个pod共享一个namespace，它们之前可以通过localhost来进行通信。docker：Namespace 做隔离，Cgroups 做限制，rootfs做文件系统。容器本质是进程，而k8s是操作系统。pod就是类似于进程组。部署的一些应...

Jeremy_Lee123

6058人浏览 · 2020-01-15 17:03:37

Jeremy_Lee123 · 2020-01-15 17:03:37 发布

k8s里面非常重要的一个概念pod，首先简单的介绍是pod是k8s最小的调度单位，一个pod里面可以包含一个或者多个container，一个pod共享一个namespace，它们之前可以通过localhost来进行通信。

docker：Namespace 做隔离，Cgroups 做限制，rootfs做文件系统。

容器本质是进程，而k8s是操作系统。

pod就是类似于进程组。

部署的一些应用有着类似“进程”和“进程组”的关系，必须部署在一台机器上，受限于容器的单进程。

为什么需要Pod？

Pod，是Kubernetes项目中的原子调度单位。容器就是未来云计算系统中的进程；容器镜像就是系统里的.exe安装包，Kubernetes就是操作系统。在一个真正的操作系统里，进程并不是“孤苦伶仃”地独自运行，而是以进程组的方式，“有原则”的组织在一起。在kubernetes中，“进程组”所映射的概念就是Pod。Google的工程师发现，他们部署的应用，往往都存在着类似于“进程和进程组”的关系，也就是说这些应用之间有着亲密的协作关系，使得他们必须部署在同一台机器上。

Pod的实现原理

Pod只是一个逻辑概念。

Pod其实是一组共享了某些资源的容器，具体来说，Pod里的所有容器，共享的是同一个Network Namespace，并且可以声明共享同一个Volume。在Kubernetes中，Pod的实现需要使用一个中间容器，这个容器叫做Infra容器。在Pod中，Infra容器永远是第一个被创建的容器，而其他用户定义的容器，则通过Join Network Namespace的方式与Infra容器关联在一起。

Infra容器使用的是一个非常特殊的镜像，叫做：k8s.gcr.io/pause。这个镜像是一个用汇编语言编写的、永远处于暂停状态的容器。在Infra容器“Hold住”NetworkNamespace之后，用户容器就可以加入到Infra容器的NetworkNamespace中了。这也就意味着，对于Pod中的容器A和容器B：

它们可以直接使用localhost进行通信
它们看到的网络设备和Infra容器看到的完全一样
一个Pod只有一个IP地址，也就是这个Pod的Network Namespace对应的IP地址
所有的网络资源，都是一个Pod一份，并且被该Pod内的所有容器共享
Pod的生命周期只和Infra容器一致，与容器A和容器B无关

对于Pod共享Volume来说，Kubernetes只要把所有Volume定义设计在Pod层即可。例如：

apiVersion: v1
kind: Pod
metadata:
 name: two-containers
spec:
 restartPolicy: Never #Pod的重启策略。1.Always:容器失效时，kubelet自动重启该容器。2.OnFailure：容器终止运行且退出码不为0时重启。3.Never：无论状态如何，kubelet都不重启该容器。
 volumes:
 - name: shared-data
   hostPath:
    path : /data
 containers:
 - name: nginx-container
   image: nginx
   volumeMounts:
   - name: shared-data
     mountPath: /usr/share/nginx/html
 - name: debian-container
   image: debian
   volumeMounts:
   - name: shared-data
     mountPath: /pod-data
   command: ["/bin/sh"]
   args: ["-c","echo Hello from the debian container > /pod/data/index.html"]

Pod对象的生命周期

Pod生命周期变化主要体现在Pod API对象的Status部分。

Pending，这个状态意味着Pod的YAML文件已经提交给了Kubernetes，API对象已经被创建并被保存在etcd中。但是，这个Pod里有些容器因为某种原因不能被成功创建，比如，调度不成功
Running，这个状态下，Pod已经调度成功，和一个具体的节点绑定。它包含的容器都已经创建成功，并且至少有一个正在运行中。
Succeed，这个状态意味着，Pod中所有容器都正常运行完毕，并且已经退出了。
Failed，这个状态下，Pod里至少有一个容器以不正常的状态（非0状态码）退出。这个状态的出现意味着你要想办法Debug这个容器的应用，比如查看Pod的Events和日志
Unknown，这是一个异常状态，意味着Pod的状态不能持续被kubelet汇报给kube-apiserver，这很可能是Master和kubelet间的通信出了问题。

演示pod

pod_nginx.yml 文件

apiVersion: v1
kind: Pod
metadata:
name: nginx
spec:
containers:
- name: nginx
image: hub.c.163.com/library/nginx:latest
ports:
- containerPort: 80

开始运行pod节点

kubectl version
#创建pod
kubectl create -f pod_nginx.yml
#查看pod状态
kubectl get pods
#查看pod状态ip状态
kubectl get pods -o wide

进入192.168.18.152查看docker ps，内部其实就是docker

minikube start
docker ps
docker exec -it 2ff4d852ed8e bash
exit

查看pod nginx的网络

docker network ls
#查看到nginx的ip是172.17.0.4
docker network inspect bridge
exit
kubectl get pods -o wide

上边这种是不是感觉很麻烦，如果想进入容器，还需要想进入虚拟机然后docker ps 找到id，最后docker exec的方式。其实不用那么复杂。

#进入nginx的容器
kubectl exec -it nginx sh
#了解下进入容器的所有的命令
kubectl exec -it -h

# nginx这个pods的所有详细信息
kubectl describe pods nginx

通过ip的方式，看看nginx启动起来没？

minikube ssh
ping 172.17.0.4
curl 172.17.0.4

老铁现在你最想的是什么？我最想的是：在本机可以访问到nginx的服务，而不是在内部。在原来学docker的时候可以进行-p 端口映射的方式。在k8s的kubectl 同样可以看命令。

kubectl port-forward nginx 8080:80

PS：最后把容器内的nginx暴露出来了可以在外部访问了，是不是觉得美滋滋，这次主要讲了如果pod的方式创建容器，由k8s进行管理，获取到nginx的ip地址，映射容器内的端口，其实我感觉有点类似docker-swarm,但是这个好像比docker-swarm灵活点。也留个小问题，现在是用的port-forward它得一直开着，如果关闭了，直接就访问不了了，这种该如何解决。下次我来说！

附件：掌握Pod YAML文件定义详解

apiVersion:v1
kind: Pod
metadata:
name: string
namespace: string
lables:
- name:string
annotations:
- nameL string
spec:
containers:
- name: string
image: string
   imagePullPolicy: [Always| Never| IFNotPresent]
   commadn: [string]
   args: [String]
   workingDir: string
   volumeMounts:
   - name: string
   mountPath: string
   readOnly: boolean
   ports:
   - name: string
   containerPort: int
   hostPort: int
   protocol: string
   env:
   - name:string
   value: string
   resources:
   limits:
   cpu: string
       memory: string
   requests:
   cpu: string
       memory: string
   livenessFrobe:
   exec:
   commadn: [string]
   httpGet:
   path: string
       port: number
       host: string
       scheme: string
       httpHeaders:
       - name: string
       value: string
       tcpSocket:
       port: number
       initialDelaySeconds: 0
       timeoutSeconds: 0
       periodSeconds: 0
       successThreshold: 0
       failureThreshold: 0
   securityContext:
   privileged: false
   restartFolicy: [Always| Never|| OnFaliure]
   nodeSelector: object
   imagePullSecrets:
   - name: string
   hostNetwork: false
   volumes:
   - name: string
   enptyDir: {}
   hostPath:
   path: string
   secret:
   secretName: string
       items:
       - key: string
       path: string
       configMap:
       name: string
       items:
       - key: string
       path: string

配置文件详细清单：

属性名称	取值范围	是否必选 (1必选)	取值说明
apiVersion	string	1	版本号例如：v1
kind	String	1	Pod
metadata	Object	1	元数据
metadata.name	String	1	Pod的名称，命令规范需要符合RFC 1035规范
metadata.namespace	String	1	Pod的命名空间，默认值为default
metadata.labels[]	List		自定义标签列表
metadata.annotation[]	List		自定义注释列表
Spec	Object	1	Pod中容器的详细定义
spec.containers[]	List	1	Pod中的容器列表
spec.containers[].name	String	1	容器的名称，需要符合RFC 1035规范
spec.containers[].image	String	1	容器的镜像名称
spec.containers[].imagePullPolicy	String		镜像拉取策略，可选值包括：Always、Nerver、IfNotPresent,默认值为Always。 (1) Always.表示每次都尝试重新拉取镜像。 (2)IfNotPresent:表示如果本地有该镜像，则使用本地的镜像，本地不存在时拉取镜像。 (3)Nerver:表示仅使用本地镜像。包含如下设置，系统默认设置为Always，如下所述 (1)不设置imagePullPolicy,也未指定镜像的tag; (2)不设置imagePullPolicy,镜像tag为latest (3)启用名为AlwaysPullImages的准入控制器（Admission Controller）
spec.containers[].command[]	List		容器的启动命令列表，如果不指定，则使用镜像打包时使用的启动命令
spec.containers[].args[]	List		容器的启动命令参数列表
spec.containers[].workingDir	String		容器的工作目录
spec.containers[].volumeMounts[]	List		挂载到容器内部的存储卷配置
spec.containers[].volumeMounts[].name	String		引用Pod定义的共享存储卷的名称，需要使用volumes[]部分定义的共享存储卷名称
spec.containers[].volumeMounts[].mountPath	String		存储卷在容器内Mount的绝对路径，应少于512个字符
spec.containers[].volumeMounts[].readOnly	Boolean		是否为只读模式，默认为读写模式
spec.containers[].ports[]	List		容器需要暴露的端口号列表
spec.containers[].ports[].name	String		端口的名称
spec.containers[].ports[].containerPort	Int		容器需要监听的端口号
spec.containers[].ports[].hostPort	Int		容器所在主机需要监听的端口号，默认与containerPort相同，设置hostPort时，同一台宿主机将无法启动该容器的第2份副本
spec.containers[].ports[].protocol	String		端口协议，支持TCP和UDP，默认值为TCP
spec.containers[].env[]	List		容器运行前需要设置的环境变量列表
spec.containers[].env[].name	String		环境变量的名称
spec.containers[].env[].value	String		环境变量的值
spec.containers[].resources	Object		资源限制和资源请求的设置
spec.containers[].resources.limits	Object		资源限制的设置
spec.containers[].resources.limits.cpu	String		CPU限制，单位为core数，将用于docker run --cpu-shares参数
spec.containers[].resources.limits.memory	String		内存限制，单位可以为MIB、GIB等。将用于docker run --memory
spec.containers[].resources.requests	Object		资源限制设置
spec.containers[].resources.requecsts.cpu	String		CPU请求，单位为core数，容器启动的初始可用数量
spec.containers[].resources.requests.memory	String		内存请求，单位可以为MIB、GIB等，容器启动的初始可用数量
spec.volumes[]	List		在该Pod上定义的共享存储卷列表
spec.volumes[].name	String		共享存储卷名称，在一个Pod中每个存储卷定义一个名称，容器定义部分的containers[].volumeMounts[].name将应用改共享存储卷的名称。 volume的类型包括：emptyDir、hostPath、gcePersistentDisk、awsElasticBlockStore、gitRepo、sercret、nfs、iscsi、glusterfs、persistentVolumeClaim、rbd、flexVolume、cinder、cephfs、flocker、downwardAPI、fc、azureFile、configMap、vsphereVolume，可以定义多个Volume，每个Volume的name保持唯一。
spec.volumes[].emptyDir	Object		类型为emptyDir的存储卷，表示与Pod同生命周期的一个临时目录，其值为一个空对象：emptyDir{}
spec.volumes[].hostPath	Object		类型为hostPath的存储卷，表示挂载Pod所在宿主机的目录，通过volumes[].hostPath.path指定
spec.volumes[].hostPath.path	String		Pod所在主机的目录，将被用于容器中的mount的目录
spec.volumes[].secret	Object		类型为secret存储卷，表示挂载集群预定义的secret对象到容器内部
spec.volumes[].configMap	Object		类型为configMap的存储卷，表示挂载激情预定义的configMap对象到容器内部
spec.volumes[].livenessProbc	Object		对Pod內各容器健康检查的设置，当探测无响应几次之后，系统将自动重启该容器，可以设置的方法包括：exec、httpGet、和tcpSocket。对一个容器仅需设置一种健康检查方法。
spec.volumes[].livenessProbe.exec	Object		对Pod内各容器健康检查的设置，exec方式
spec.volumes[].livenessProbe.exec.command[]	String		exec方式需要制定的命令或者脚本
spec.volumes[].livenessProbe.httpGet	Object		对Pod内各种容器健康检查设置，HTTPGet方式，需要指定path、port
spec.voulumes[].livenessProbe.tcpSocket	Object		对Pod内各容器健康检查的设置，tcpSocket方式
spec.volumes[].livenessProbe.initiaDelaySeconds	Number		容器启动完成后首次探测的时间，单位为s
spec.volumes[].livenessProbe.timeoutSeconds	Number		对容器健康检查的探测等待响应的超时时间设置。单位为s，默认值为1s。如超过该超时时间设置，则将认为该容器不健康，会重启该容器。
spec.volumes[].livenessProbe.PeriodSeconds	Number		对容器健康检查的定期探测时间设置，单位为s，默认10s探测一次
spec.restartPolicy	String		Pod的重启策略。可选值为Always，OnFailure，Never 默认值为Always。（1）Always：Pod一旦终止运行，则无论容器是如何终止的，kubectl都将重启它（2）OnFailure:只有Pod以非零退出码终止时，kubectl才会重启该容器。如果容器正常结束，则kubectl将不会重启它（3）Never:Pod终止后，kubectl将退出码报告给Master，不会再重启该Pod
spec.nodeSelector	Object		设置Node的Label，以key-value格式指定，Pod将被调度到具有这些Label的Node上
spec.imagePullSecrets	Object		pull镜像时使用的Secret名称，以name：secretkey格式指定
spec.hostNetwork	Boolean		是否使用主机网络模式，默认值为false，设置为true表示容器使用宿主机网络，不再使用Docker网桥，该Pod将无法在同一台宿主机上启动第2个副本。