K8S最小调度单位Pod详解
k8s里面非常重要的一个概念pod,首先简单的介绍是pod是k8s最小的调度单位,一个pod里面可以包含一个或者多个container,一个pod共享一个namespace,它们之前可以通过localhost来进行通信。docker:Namespace 做隔离,Cgroups 做限制,rootfs做文件系统。容器本质是进程,而k8s是操作系统。pod就是类似于进程组。部署的一些应...
k8s里面非常重要的一个概念pod,首先简单的介绍是pod是k8s最小的调度单位,一个pod里面可以包含一个或者多个container,一个pod共享一个namespace,它们之前可以通过localhost来进行通信。
- docker:Namespace 做隔离,Cgroups 做限制,rootfs做文件系统。
- 容器本质是进程,而k8s是操作系统。
- pod就是类似于进程组。
- 部署的一些应用有着类似“进程”和“进程组”的关系,必须部署在一台机器上,受限于容器的单进程。
为什么需要Pod?
Pod,是Kubernetes项目中的原子调度单位。容器就是未来云计算系统中的进程;容器镜像就是系统里的.exe安装包,Kubernetes就是操作系统。在一个真正的操作系统里,进程并不是“孤苦伶仃”地独自运行,而是以进程组的方式,“有原则”的组织在一起。在kubernetes中,“进程组”所映射的概念就是Pod。Google的工程师发现,他们部署的应用,往往都存在着类似于“进程和进程组”的关系,也就是说这些应用之间有着亲密的协作关系,使得他们必须部署在同一台机器上。
Pod的实现原理
Pod只是一个逻辑概念。
Pod其实是一组共享了某些资源的容器,具体来说,Pod里的所有容器,共享的是同一个Network Namespace,并且可以声明共享同一个Volume。在Kubernetes中,Pod的实现需要使用一个中间容器,这个容器叫做Infra容器。在Pod中,Infra容器永远是第一个被创建的容器,而其他用户定义的容器,则通过Join Network Namespace的方式与Infra容器关联在一起。
Infra容器使用的是一个非常特殊的镜像,叫做:k8s.gcr.io/pause。这个镜像是一个用汇编语言编写的、永远处于暂停状态的容器。在Infra容器“Hold住”NetworkNamespace之后,用户容器就可以加入到Infra容器的NetworkNamespace中了。这也就意味着,对于Pod中的容器A和容器B:
- 它们可以直接使用localhost进行通信
- 它们看到的网络设备和Infra容器看到的完全一样
- 一个Pod只有一个IP地址,也就是这个Pod的Network Namespace对应的IP地址
- 所有的网络资源,都是一个Pod一份,并且被该Pod内的所有容器共享
- Pod的生命周期只和Infra容器一致,与容器A和容器B无关
对于Pod共享Volume来说,Kubernetes只要把所有Volume定义设计在Pod层即可。例如:
apiVersion: v1
kind: Pod
metadata:
name: two-containers
spec:
restartPolicy: Never #Pod的重启策略。1.Always:容器失效时,kubelet自动重启该容器。2.OnFailure:容器终止运行且退出码不为0时重启。3.Never:无论状态如何,kubelet都不重启该容器。
volumes:
- name: shared-data
hostPath:
path : /data
containers:
- name: nginx-container
image: nginx
volumeMounts:
- name: shared-data
mountPath: /usr/share/nginx/html
- name: debian-container
image: debian
volumeMounts:
- name: shared-data
mountPath: /pod-data
command: ["/bin/sh"]
args: ["-c","echo Hello from the debian container > /pod/data/index.html"]
Pod对象的生命周期
Pod生命周期变化主要体现在Pod API对象的Status部分。
- Pending,这个状态意味着Pod的YAML文件已经提交给了Kubernetes,API对象已经被创建并被保存在etcd中。但是,这个Pod里有些容器因为某种原因不能被成功创建,比如,调度不成功
- Running,这个状态下,Pod已经调度成功,和一个具体的节点绑定。它包含的容器都已经创建成功,并且至少有一个正在运行中。
- Succeed,这个状态意味着,Pod中所有容器都正常运行完毕,并且已经退出了。
- Failed,这个状态下,Pod里至少有一个容器以不正常的状态(非0状态码)退出。这个状态的出现意味着你要想办法Debug这个容器的应用,比如查看Pod的Events和日志
- Unknown,这是一个异常状态,意味着Pod的状态不能持续被kubelet汇报给kube-apiserver,这很可能是Master和kubelet间的通信出了问题。
演示pod
- pod_nginx.yml 文件
apiVersion: v1
kind: Pod
metadata:
name: nginx
spec:
containers:
- name: nginx
image: hub.c.163.com/library/nginx:latest
ports:
- containerPort: 80
- 开始运行pod节点
kubectl version
#创建pod
kubectl create -f pod_nginx.yml
#查看pod状态
kubectl get pods
#查看pod状态ip状态
kubectl get pods -o wide
- 进入192.168.18.152查看docker ps,内部其实就是docker
minikube start
docker ps
docker exec -it 2ff4d852ed8e bash
exit
- 查看pod nginx的网络
docker network ls
#查看到nginx的ip是172.17.0.4
docker network inspect bridge
exit
kubectl get pods -o wide
上边这种是不是感觉很麻烦,如果想进入容器,还需要想进入虚拟机然后docker ps 找到id,最后docker exec的方式。其实不用那么复杂。
#进入nginx的容器
kubectl exec -it nginx sh
#了解下进入容器的所有的命令
kubectl exec -it -h
# nginx这个pods的所有详细信息
kubectl describe pods nginx
通过ip的方式,看看nginx启动起来没?
minikube ssh
ping 172.17.0.4
curl 172.17.0.4
老铁 现在你最想的是什么?我最想的是:在本机可以访问到nginx的服务,而不是在内部。在原来学docker的时候可以进行-p 端口映射的方式。在k8s的kubectl 同样可以看命令。
kubectl port-forward nginx 8080:80
PS:最后把容器内的nginx暴露出来了可以在外部访问了,是不是觉得美滋滋,这次主要讲了如果pod的方式创建容器,由k8s进行管理,获取到nginx的ip地址,映射容器内的端口,其实我感觉有点类似docker-swarm,但是这个好像比docker-swarm灵活点。也留个小问题,现在是用的port-forward它得一直开着,如果关闭了,直接就访问不了了,这种该如何解决。下次我来说!
附件:掌握Pod YAML文件定义详解
apiVersion:v1
kind: Pod
metadata:
name: string
namespace: string
lables:
- name:string
annotations:
- nameL string
spec:
containers:
- name: string
image: string
imagePullPolicy: [Always| Never| IFNotPresent]
commadn: [string]
args: [String]
workingDir: string
volumeMounts:
- name: string
mountPath: string
readOnly: boolean
ports:
- name: string
containerPort: int
hostPort: int
protocol: string
env:
- name:string
value: string
resources:
limits:
cpu: string
memory: string
requests:
cpu: string
memory: string
livenessFrobe:
exec:
commadn: [string]
httpGet:
path: string
port: number
host: string
scheme: string
httpHeaders:
- name: string
value: string
tcpSocket:
port: number
initialDelaySeconds: 0
timeoutSeconds: 0
periodSeconds: 0
successThreshold: 0
failureThreshold: 0
securityContext:
privileged: false
restartFolicy: [Always| Never|| OnFaliure]
nodeSelector: object
imagePullSecrets:
- name: string
hostNetwork: false
volumes:
- name: string
enptyDir: {}
hostPath:
path: string
secret:
secretName: string
items:
- key: string
path: string
configMap:
name: string
items:
- key: string
path: string
配置文件详细清单:
属性名称 | 取值范围 | 是否必选 (1必选) | 取值说明 |
---|---|---|---|
apiVersion | string | 1 | 版本号 例如:v1 |
kind | String | 1 | Pod |
metadata | Object | 1 | 元数据 |
metadata.name | String | 1 | Pod的名称,命令规范需要符合RFC 1035规范 |
metadata.namespace | String | 1 | Pod的命名空间,默认值为default |
metadata.labels[] | List | 自定义标签列表 | |
metadata.annotation[] | List | 自定义注释列表 | |
Spec | Object | 1 | Pod中容器的详细定义 |
spec.containers[] | List | 1 | Pod中的容器列表 |
spec.containers[].name | String | 1 | 容器的名称,需要符合RFC 1035规范 |
spec.containers[].image | String | 1 | 容器的镜像名称 |
spec.containers[].imagePullPolicy | String | 镜像拉取策略,可选值包括:Always、Nerver、IfNotPresent,默认值为Always。 (1) Always.表示每次都尝试重新拉取镜像。 (2)IfNotPresent:表示如果本地有该镜像,则使用本地的镜像,本地不存在时拉取镜像。 (3)Nerver:表示仅使用本地镜像。 包含如下设置,系统默认设置为Always,如下所述 (1)不设置imagePullPolicy,也未指定镜像的tag; (2)不设置imagePullPolicy,镜像tag为latest (3)启用名为AlwaysPullImages的准入控制器(Admission Controller) | |
spec.containers[].command[] | List | 容器的启动命令列表,如果不指定,则使用镜像打包时使用的启动命令 | |
spec.containers[].args[] | List | 容器的启动命令参数列表 | |
spec.containers[].workingDir | String | 容器的工作目录 | |
spec.containers[].volumeMounts[] | List | 挂载到容器内部的存储卷配置 | |
spec.containers[].volumeMounts[].name | String | 引用Pod定义的共享存储卷的名称,需要使用volumes[]部分定义的共享存储卷名称 | |
spec.containers[].volumeMounts[].mountPath | String | 存储卷在容器内Mount的绝对路径,应少于512个字符 | |
spec.containers[].volumeMounts[].readOnly | Boolean | 是否为只读模式,默认为读写模式 | |
spec.containers[].ports[] | List | 容器需要暴露的端口号列表 | |
spec.containers[].ports[].name | String | 端口的名称 | |
spec.containers[].ports[].containerPort | Int | 容器需要监听的端口号 | |
spec.containers[].ports[].hostPort | Int | 容器所在主机需要监听的端口号,默认与containerPort相同,设置hostPort时,同一台宿主机将无法启动该容器的第2份副本 | |
spec.containers[].ports[].protocol | String | 端口协议,支持TCP和UDP,默认值为TCP | |
spec.containers[].env[] | List | 容器运行前需要设置的环境变量列表 | |
spec.containers[].env[].name | String | 环境变量的名称 | |
spec.containers[].env[].value | String | 环境变量的值 | |
spec.containers[].resources | Object | 资源限制和资源请求的设置 | |
spec.containers[].resources.limits | Object | 资源限制的设置 | |
spec.containers[].resources.limits.cpu | String | CPU限制,单位为core数,将用于docker run --cpu-shares参数 | |
spec.containers[].resources.limits.memory | String | 内存限制,单位可以为MIB、GIB等。将用于docker run --memory | |
spec.containers[].resources.requests | Object | 资源限制设置 | |
spec.containers[].resources.requecsts.cpu | String | CPU请求,单位为core数,容器启动的初始可用数量 | |
spec.containers[].resources.requests.memory | String | 内存请求,单位可以为MIB、GIB等,容器启动的初始可用数量 | |
spec.volumes[] | List | 在该Pod上定义的共享存储卷列表 | |
spec.volumes[].name | String | 共享存储卷名称,在一个Pod中每个存储卷定义一个名称,容器定义部分的containers[].volumeMounts[].name将应用改共享存储卷的名称。 volume的类型包括:emptyDir、hostPath、gcePersistentDisk、awsElasticBlockStore、gitRepo、sercret、nfs、iscsi、glusterfs、persistentVolumeClaim、rbd、flexVolume、cinder、cephfs、flocker、downwardAPI、fc、azureFile、configMap、vsphereVolume,可以定义多个Volume,每个Volume的name保持唯一。 | |
spec.volumes[].emptyDir | Object | 类型为emptyDir的存储卷,表示与Pod同生命周期的一个临时目录,其值为一个空对象:emptyDir{} | |
spec.volumes[].hostPath | Object | 类型为hostPath的存储卷,表示挂载Pod所在宿主机的目录,通过volumes[].hostPath.path指定 | |
spec.volumes[].hostPath.path | String | Pod所在主机的目录,将被用于容器中的mount的目录 | |
spec.volumes[].secret | Object | 类型为secret存储卷,表示挂载集群预定义的secret对象到容器内部 | |
spec.volumes[].configMap | Object | 类型为configMap的存储卷,表示挂载激情预定义的configMap对象到容器内部 | |
spec.volumes[].livenessProbc | Object | 对Pod內各容器健康检查的设置,当探测无响应几次之后,系统将自动重启该容器,可以设置的方法包括:exec、httpGet、和tcpSocket。对一个容器仅需设置一种健康检查方法。 | |
spec.volumes[].livenessProbe.exec | Object | 对Pod内各容器健康检查的设置,exec方式 | |
spec.volumes[].livenessProbe.exec.command[] | String | exec方式需要制定的命令或者脚本 | |
spec.volumes[].livenessProbe.httpGet | Object | 对Pod内各种容器健康检查设置,HTTPGet方式,需要指定path、port | |
spec.voulumes[].livenessProbe.tcpSocket | Object | 对Pod内各容器健康检查的设置,tcpSocket方式 | |
spec.volumes[].livenessProbe.initiaDelaySeconds | Number | 容器启动完成后首次探测的时间,单位为s | |
spec.volumes[].livenessProbe.timeoutSeconds | Number | 对容器健康检查的探测等待响应的超时时间设置。单位为s,默认值为1s。如超过该超时时间设置,则将认为该容器不健康,会重启该容器。 | |
spec.volumes[].livenessProbe.PeriodSeconds | Number | 对容器健康检查的定期探测时间设置,单位为s,默认10s探测一次 | |
spec.restartPolicy | String | Pod的重启策略。可选值为Always,OnFailure,Never 默认值为Always。 (1)Always:Pod一旦终止运行,则无论容器是如何终止的,kubectl都将重启它 (2)OnFailure:只有Pod以非零退出码终止时,kubectl才会重启该容器。如果容器正常结束,则kubectl将不会重启它 (3)Never:Pod终止后,kubectl将退出码报告给Master,不会再重启该Pod | |
spec.nodeSelector | Object | 设置Node的Label,以key-value格式指定,Pod将被调度到具有这些Label的Node上 | |
spec.imagePullSecrets | Object | pull镜像时使用的Secret名称,以name:secretkey格式指定 | |
spec.hostNetwork | Boolean | 是否使用主机网络模式,默认值为false,设置为true表示容器使用宿主机网络,不再使用Docker网桥,该Pod将无法在同一台宿主机上启动第2个副本。 |
更多推荐
所有评论(0)