k8s工作负载控制器--Deployment

misakivv

970人浏览 · 2024-07-29 23:44:22

misakivv · 2024-07-29 23:44:22 发布

文章目录

一、引入背景
二、主要功能
三、资源清单
四、实例
- 1、流程
- 2、创建Deployment资源清单
- 3、创建Deployment
- 4、检查Deployment是否创建成功（正在创建）
- 5、查看Deployment的上线状态
- 6、再次查看Deployment状态（创建完成）
- 7、查看Deployment 创建的ReplicaSet(rs)
- 8、查看被创建的Pod的标签
- 9、Pod-template-hash 标签
五、滚动更新Deployment
- 1、更新容器所使用的镜像
- - 1.1、kubectl set 手动设置
  - 1.2、edit在线更新
- 2、查看上线状态
- 3、上线后查看Deployment
- 4、查看ReplicaSet(rs)
- 5、查看新创建的Pod
- 6、查看Deployment详细信息
六、多 Deployment 动态更新
七、回滚Deployment
- 1、回滚场景
- 2、检查上线状态来验证
- 3、查看创建的Pod
- 4、获取Deployment详细信息
- 5、检查Deployment历史上线
- - 5.1、检查 Deployment 修订历史
  - 5.2、查看修订历史的详细信息
- 6、回滚到之前的版本
八、缩放Deployment
- 1、scale命令缩放
- 2、自动缩放
- 3、比例缩放
九、暂停、恢复 Deployment 的上线过程
- 1、对于刚创建的Deployment
- - 1.1、获取Deployment 信息
  - 1.2、获取上线状态
- 2、暂停上线
- 3、更新镜像
- 4、查看没有触发上线状态
- 5、获取上线状态验证现有的 ReplicaSet 没有被更改
- 6、可以根据需要执行很多更新操作
- 7、恢复 Deployment 上线
- 8、观察上线状态
- 9、获取最新上线状态
十、Deployment状态
- 1、进行中的Deployment
- 2、完成的Deployment
- - 2.1、示例
- 3、失败的 Deployment
十一、清理策略
十二、金丝雀发布
十三、编写Deployment规约
- 1、Pod模版
- - 1.1、.spec.template
  - 1.2、.spec.selector
- 2、副本
- 3、指定算符
- 4、策略
- 5、进度期限秒数
- 6、最短就绪时间
- 7、修订历史限制
- 8、paused（暂停的）

一、引入背景

在早期版本的K8s中，Pod的副本数量由Replication Controller（简称RC）进行管理。然而，随着K8s的不断发展，RC的功能逐渐显得捉襟见肘，无法满足复杂的应用部署需求。为了解决这个问题，K8s从V1.2版本开始引入了Deployment控制器。

Deployment控制器并不直接管理Pod，而是通过管理ReplicaSet来间接管理Pod。简单来说，Deployment管理ReplicaSet，而ReplicaSet管理Pod。这样的设计使得Deployment比ReplicaSet功能更加强大，能够满足更多样化的应用部署需求。

二、主要功能

支持ReplicaSet的所有功能
支持发布的停止、继续
支持滚动升级和回滚版本

三、资源清单

apiVersion: apps/v1 # 版本号
kind: Deployment # 类型       
metadata: # 元数据
  name: # Deploy名称 
  namespace: # 所属命名空间 
  labels: #标签
    controller: deploy
spec: # 详情描述
  replicas: 3 # 副本数量
  revisionHistoryLimit: 3 # 保留历史版本（rs，用于版本回退）
  paused: false # 暂停部署，默认是false
  progressDeadlineSeconds: 600 # 部署超时时间（s），默认是600
  strategy: # 策略
    type: RollingUpdate # 滚动更新策略
    rollingUpdate: # 滚动更新
      maxSurge: 30% # 最大额外可以存在的副本数，可以为百分比，也可以为整数
      maxUnavailable: 30% # 最大不可用状态的 Pod 的最大值，可以为百分比，也可以为整数
  selector: # 选择器，通过它指定该控制器管理哪些pod
    matchLabels: # Labels匹配规则
      app: nginx-pod
    matchExpressions: # Expressions匹配规则
      - { key: app, operator: In, values: [ nginx-pod ] }
  template: # 模板，当副本数量不足时，会根据下面的模板创建pod副本
    metadata:
      labels:
        app: nginx-pod
    spec:
      containers:
        - name: nginx
          image: nginx
          ports:
            - containerPort: 80

四、实例

1、流程

创建 Deployment 以将 ReplicaSet 上线。ReplicaSet 在后台创建 Pod。检查 ReplicaSet 的上线状态，查看其是否成功。
通过更新 Deployment 的 PodTemplateSpec，声明 Pod 的新状态。新的 ReplicaSet 会被创建，Deployment 以受控速率将 Pod 从旧 ReplicaSet 迁移到新 ReplicaSet。每个新的 ReplicaSet 都会更新 Deployment 的修订版本。
如果 Deployment 的当前状态不稳定，回滚到较早的 Deployment 版本。每次回滚都会更新 Deployment 的修订版本。
扩大 Deployment 规模以承担更多负载。
暂停 Deployment 的上线以应用对 PodTemplateSpec 所作的多项修改，然后恢复其执行以启动新的上线版本。
使用 Deployment 状态来判定上线过程是否出现停滞。
清理较旧的不再需要的 ReplicaSet 。

2、创建Deployment资源清单

nginx-deployment.yaml

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:latest
        ports:
        - containerPort: 80

创建名为 deploy-controller（由 .metadata.name 字段标明）的 Deployment。该名称将成为后续创建 ReplicaSet 和 Pod 的命名基础。参阅编写 Deployment 规约获取更多详细信息。
该 Deployment 创建一个 ReplicaSet，它创建三个（由 .spec.replicas 字段标明）Pod 副本。
.spec.selector 字段定义所创建的 ReplicaSet 如何查找要管理的 Pod。在这里，你选择在 Pod 模板中定义的标签（app: nginx）。不过，更复杂的选择规则是也可能的，只要 Pod 模板本身满足所给规则即可。
template 字段包含以下子字段：
- Pod 被使用 .metadata.labels 字段打上 app: nginx 标签。
- Pod 模板规约（即 .template.spec 字段）指示 Pod 运行一个 nginx 容器，镜像为nginx的最新版本。
- 创建一个容器并使用 .spec.template.spec.containers[0].name 字段将其命名为 nginx。

3、创建Deployment

kubectl apply -f nginx-deployment.yaml

4、检查Deployment是否创建成功（正在创建）

kubectl get deployments -n default

在检查集群中的 Deployment 时，所显示的字段有：

NAME 列出了名字空间中 Deployment 的名称。
READY 显示应用程序的可用的“副本”数。显示的模式是“就绪个数/期望个数”。
UP-TO-DATE 显示为了达到期望状态已经更新的副本数。
AVAILABLE 显示应用可供用户使用的副本数。
AGE 显示应用程序运行的时间。

请注意期望副本数是根据 .spec.replicas 字段设置 3。

5、查看Deployment的上线状态

kubectl rollout status deployment/nginx-deployment

6、再次查看Deployment状态（创建完成）

kubectl get deployments -n default

注意 Deployment 已创建全部三个副本，并且所有副本都是最新的（它们包含最新的 Pod 模板）并且可用

7、查看Deployment 创建的ReplicaSet(rs)

kubectl get rs

ReplicaSet 输出中包含以下字段：

NAME 列出名字空间中 ReplicaSet 的名称；
DESIRED 显示应用的期望副本个数，即在创建 Deployment 时所定义的值。此为期望状态；
CURRENT 显示当前运行状态中的副本个数；
READY 显示应用中有多少副本可以为用户提供服务；
AGE 显示应用已经运行的时间长度。

注意 ReplicaSet 的名称格式始终为 [Deployment 名称]-[哈希]。该名称将成为所创建的 Pod 的命名基础。其中的哈希字符串与 ReplicaSet 上的 pod-template-hash 标签一致。

8、查看被创建的Pod的标签

kubectl get pods --show-labels

所创建的 ReplicaSet 确保总是存在三个 nginx Pod。
必须在 Deployment 中指定适当的Pod 模板标签（在本例中为 app: nginx）。
标签最好不要与其他控制器（包括其他 Deployment 和 StatefulSet）重叠。

9、Pod-template-hash 标签

不要更改此标签

Deployment 控制器将 pod-template-hash 标签添加到 Deployment 所创建或收留的每个 ReplicaSet 。

此标签可确保 Deployment 的子 ReplicaSet 不重叠。标签是通过对 ReplicaSet 的 PodTemplate 进行哈希处理。所生成的哈希值被添加到 ReplicaSet 选择算符、Pod 模板标签，并存在于在 ReplicaSet 可能拥有的任何现有 Pod 中。

五、滚动更新Deployment

仅当 Deployment Pod 模板（即 .spec.template）发生改变时，例如模板的标签或容器镜像被更新，才会触发 Deployment 上线。其他更新（如对 Deployment 执行扩缩容的操作）不会触发上线动作。

1、更新容器所使用的镜像

1.1、kubectl set 手动设置

kubectl set image deployment/nginx-deployment nginx=nginx:1.16.1

deployment/nginx-deployment 表明 Deployment 的名称

nginx 表明需要进行更新的容器，而 nginx:1.16.1 则表示镜像的新版本以及它的标签。

1.2、edit在线更新

kubectl edit deployment nginx-deployment

2、查看上线状态

kubectl rollout status deployment/nginx-deployment

3、上线后查看Deployment

kubectl get deploy -o wide

4、查看ReplicaSet(rs)

kubectl get rs

查看Deployment 通过创建新的 ReplicaSet 并将其扩容到 3 个副本并将旧 ReplicaSet 缩容到 0 个副本完成了 Pod 的更新操作

5、查看新创建的Pod

kubectl get pods

应该仅显示新的Pod信息

下次要更新这些 Pod 时，只需再次更新 Deployment Pod 模板即可。

Deployment 可确保在更新时仅关闭一定数量的 Pod。默认情况下，它确保至少所需 Pod 的 75% 处于运行状态（最大不可用比例为 25%）。

Deployment 还确保仅所创建 Pod 数量只可能比期望 Pod 数高一点点。默认情况下，它可确保启动的 Pod 个数比期望个数最多多出 125%（最大峰值 25%）。

例如，如果仔细查看上述 Deployment ，将看到它首先创建了一个新的 Pod，然后删除旧的 Pod，并创建了新的 Pod。它不会杀死旧 Pod，直到有足够数量的新 Pod 已经出现。在足够数量的旧 Pod 被杀死前并没有创建新 Pod。它确保至少 3 个 Pod 可用，同时最多总共 4 个 Pod 可用。当 Deployment 设置为 4 个副本时，Pod 的个数会介于 3 和 5 之间。

6、查看Deployment详细信息

kubectl describe deployments

可以看到，当第一次创建 Deployment 时，它创建了一个 ReplicaSet（nginx-deployment-585449566）并将其直接扩容至 3 个副本。更新 Deployment 时，它创建了一个新的 ReplicaSet （nginx-deployment-76f59d996），并将其扩容为 1，等待其就绪；然后将旧 ReplicaSet 缩容到 2，将新的 ReplicaSet 扩容到 2 以便至少有 3 个 Pod 可用且最多创建 4 个 Pod。然后，它使用相同的滚动更新策略继续对新的 ReplicaSet 扩容并对旧的 ReplicaSet 缩容。最后，你将有 3 个可用的副本在新的 ReplicaSet 中，旧 ReplicaSet 将缩容到 0。

Kubernetes 在计算 availableReplicas 数值时不考虑终止过程中的 Pod， availableReplicas 的值一定介于 replicas - maxUnavailable 和 replicas + maxSurge 之间。因此，你可能在上线期间看到 Pod 个数比预期的多，Deployment 所消耗的总的资源也大于 replicas + maxSurge 个 Pod 所用的资源，直到被终止的 Pod 所设置的 terminationGracePeriodSeconds 到期为止。

六、多 Deployment 动态更新

Deployment 控制器每次注意到新的 Deployment 时，都会创建一个 ReplicaSet 以启动所需的 Pod。如果更新了 Deployment，则控制标签匹配 .spec.selector 但模板不匹配 .spec.template 的 Pod 的现有 ReplicaSet 被缩容。最终，新的 ReplicaSet 缩放为 .spec.replicas 个副本，所有旧 ReplicaSet 缩放为 0 个副本。

当 Deployment 正在上线时被更新，Deployment 会针对更新创建一个新的 ReplicaSet 并开始对其扩容，之前正在被扩容的 ReplicaSet 会被翻转，添加到旧 ReplicaSet 列表并开始缩容。

例如，假定你在创建一个 Deployment 以生成 nginx:1.14.2 的 5 个副本，但接下来更新 Deployment 以创建 5 个 nginx:1.16.1 的副本，而此时只有 3 个 nginx:1.14.2 副本已创建。在这种情况下，Deployment 会立即开始杀死 3 个 nginx:1.14.2 Pod，并开始创建 nginx:1.16.1 Pod。它不会等待 nginx:1.14.2 的 5 个副本都创建完成后才开始执行变更动作。

七、回滚Deployment

Deployment 被触发上线时，系统就会创建 Deployment 的新的修订版本。这意味着仅当 Deployment 的 Pod 模板（.spec.template）发生更改时，才会创建新修订版本

例如，模板的标签或容器镜像发生变化。其他更新，如 Deployment 的扩缩容操作不会创建 Deployment 修订版本。这是为了方便同时执行手动缩放或自动缩放。换言之，当你回滚到较早的修订版本时，只有 Deployment 的 Pod 模板部分会被回滚。

1、回滚场景

假设你在更新 Deployment 时犯了一个拼写错误，将镜像名称命名设置为 nginx:1.161 而不是 nginx:1.16.1

kubectl set image deployment/nginx-deployment nginx=nginx:1.161

2、检查上线状态来验证

kubectl rollout status deployment/nginx-deployment

按 Ctrl-C 停止上述上线状态观测。有关上线停滞的详细信息，参考这里。
你可以看到旧的副本（算上来自 nginx-deployment-585449566 和 nginx-deployment-76f59d996 的副本）有 3 个，新的副本（来自 nginx-deployment-66d646f584）有 1 个：

kubectl get rs

3、查看创建的Pod

新 ReplicaSet 所创建的 1 个 Pod 卡顿在镜像拉取循环中。

kubectl get pods

Deployment 控制器自动停止有问题的上线过程，并停止对新的 ReplicaSet 扩容。这行为取决于所指定的 rollingUpdate 参数（具体为 maxUnavailable）。默认情况下，Kubernetes 将此值设置为 25%。

4、获取Deployment详细信息

kubectl describe deployments

要解决此问题，需要回滚到以前稳定的 Deployment 版本。

5、检查Deployment历史上线

5.1、检查 Deployment 修订历史

kubectl rollout history deployment/nginx-deployment

5.2、查看修订历史的详细信息

kubectl rollout history deployment/nginx-deployment --revision=2

在这里插入图片描述

6、回滚到之前的版本

6.1、撤消当前上线并回滚到以前的版本

kubectl rollout undo deployment/nginx-deployment --to-revision=2

与回滚相关的指令的更详细信息，请参考 kubectl rollout。

现在，Deployment 正在回滚到以前的稳定版本。Deployment 控制器生成了回滚到修订版本 2 的 DeploymentRollback 事件。

6.2、检查回滚是否成功以及 Deployment 是否正在运行

kubectl get deployment nginx-deployment

6.3、获取Deployment详细信息

kubectl describe deploy nginx-deployment

八、缩放Deployment

1、scale命令缩放

kubectl scale deployment/nginx-deployment --replicas=5

2、自动缩放

假设集群启用了Pod 的水平自动缩放，你可以为 Deployment 设置自动缩放器，并基于现有 Pod 的 CPU 利用率选择要运行的 Pod 个数下限和上限。

kubectl autoscale deployment/nginx-deployment --min=6 --max=10 --cpu-percent=60

3、比例缩放

RollingUpdate 的 Deployment 支持同时运行应用程序的多个版本。当自动缩放器缩放处于上线进程（仍在进行中或暂停）中的 RollingUpdate Deployment 时， Deployment 控制器会平衡现有的活跃状态的 ReplicaSet（含 Pod 的 ReplicaSet）中的额外副本，以降低风险。这称为 比例缩放（Proportional Scaling）。

例如，你正在运行一个 10 个副本的 Deployment，其 maxSurge=3，maxUnavailable=2。

3.1、修改资源清单

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 10
  selector:
    matchLabels:
      app: nginx
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxSurge: 3
      maxUnavailable: 2
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:latest
        ports:
        - containerPort: 80

maxSurge 指定了在滚动更新期间可以比期望的副本数量多创建的最大 Pod 数量。它可以是一个绝对数字或者是相对于期望副本数量的百分比。这个字段确保在创建新的 Pod 时不会超出资源限制，并且可以控制更新的速度。
- 例如，在你的配置中，maxSurge: 3 意味着在滚动更新期间，最多可以比期望的副本数（在这个例子中是 10）多创建 3 个 Pod。
maxUnavailable 指定了在滚动更新期间可以比期望的副本数量少的 Pod 的最大数量。同样，它可以是一个绝对数字或者是相对于期望副本数量的百分比。这个字段确保在删除旧的 Pod 时至少有一定数量的 Pod 可用，以保证服务的连续性。
- 例如，在你的配置中，maxUnavailable: 2 意味着在滚动更新期间，最多可以比期望的副本数少 2 个 Pod 可用。

3.2、应用资源清单

kubectl apply -f nginx-deployment.yaml

3.3、确保 Deployment 的这 10 个副本都在运行

kubectl get deploy

3.4、更新 Deployment 使用新镜像

kubectl set image deployment/nginx-deployment nginx=nginx:1.14.1

3.5、检查上线状态

镜像更新使用 ReplicaSet nginx-deployment-56677b7d5d 启动新的上线过程，但由于上面提到的 maxUnavailable 要求，该进程被阻塞了。

kubectl get rs

然后，出现了新的 Deployment 扩缩请求。自动缩放器将 Deployment 副本增加到 15。 Deployment 控制器需要决定在何处添加 5 个新副本。如果未使用比例缩放，所有 5 个副本都将添加到新的 ReplicaSet 中。使用比例缩放时，可以将额外的副本分布到所有 ReplicaSet。较大比例的副本会被添加到拥有最多副本的 ReplicaSet，而较低比例的副本会进入到副本较少的 ReplicaSet。所有剩下的副本都会添加到副本最多的 ReplicaSet。具有零副本的 ReplicaSet 不会被扩容。

3.6、查看Deployment状态

3.7、获取上线状态

kubectl get rs

九、暂停、恢复 Deployment 的上线过程

在你更新一个 Deployment 的时候，或者计划更新它的时候，你可以在触发一个或多个更新之前暂停 Deployment 的上线过程。当你准备应用这些变更时，你可以重新恢复 Deployment 上线过程。这样做使得你能够在暂停和恢复执行之间应用多个修补程序，而不会触发不必要的上线操作。

1、对于刚创建的Deployment

1.1、获取Deployment 信息

kubectl get deploy

1.2、获取上线状态

kubectl get rs -o wide

2、暂停上线

kubectl rollout pause deployment/nginx-deployment

3、更新镜像

kubectl set image deployment/nginx-deployment nginx=nginx:1.16.1

4、查看没有触发上线状态

kubectl rollout history deployment nginx-deployment

5、获取上线状态验证现有的 ReplicaSet 没有被更改

kubectl get rs -o wide

6、可以根据需要执行很多更新操作

kubectl set resources deployment/nginx-deployment -c=nginx --limits=cpu=200m,memory=512Mi

暂停 Deployment 上线之前的初始状态将继续发挥作用，但新的更新在 Deployment 上线被暂停期间不会产生任何效果。

7、恢复 Deployment 上线

观察新的 ReplicaSet 的创建过程，其中包含了所应用的所有更新

kubectl rollout resume deployment/nginx-deployment

8、观察上线状态

 kubectl get rs -w

9、获取最新上线状态

kubectl get rs -o wide

不可以回滚处于暂停状态的 Deployment，除非先恢复其执行状态。

十、Deployment状态

Deployment 的生命周期中会有许多状态。上线新的 ReplicaSet 期间可能处于 Progressing（进行中），可能是 Complete（已完成），也可能是 Failed（失败）以至于无法继续进行。

1、进行中的Deployment

执行下面的任务期间，Kubernetes 标记 Deployment 为进行中（Progressing）：

Deployment 创建新的 ReplicaSet
Deployment 正在为其最新的 ReplicaSet 扩容
Deployment 正在为其旧有的 ReplicaSet(s) 缩容
新的 Pod 已经就绪或者可用（就绪至少持续了 MinReadySeconds 秒）。

当上线过程进入“Progressing”状态时，Deployment 控制器会向 Deployment 的 .status.conditions 中添加包含下面属性的状况条目：

type: Progressing
status: "True"
reason: NewReplicaSetCreated | reason: FoundNewReplicaSet | reason: ReplicaSetUpdated

监视 Deployment 的进度：

kubectl rollout status deploy <deployment-name>

2、完成的Deployment

当 Deployment 具有以下特征时，Kubernetes 将其标记为完成（Complete）:

与 Deployment 关联的所有副本都已更新到指定的最新版本，这意味着之前请求的所有更新都已完成。
与 Deployment 关联的所有副本都可用。
未运行 Deployment 的旧副本。

当上线过程进入“Complete”状态时，Deployment 控制器会向 Deployment 的 .status.conditions 中添加包含下面属性的状况条目：

type: Progressing
status: "True"
reason: NewReplicaSetAvailable

这一 Progressing 状况的状态值会持续为 “True”，直至新的上线动作被触发。即使副本的可用状态发生变化（进而影响 Available 状况），Progressing 状况的值也不会变化。

2.1、示例

你可以使用 kubectl rollout status 检查 Deployment 是否已完成。如果上线成功完成，kubectl rollout status 返回退出代码 0。

kubectl rollout status deploy nginx-deployment

echo $?

3、失败的 Deployment

Deployment 可能会在尝试部署其最新的 ReplicaSet ，一直处于未完成状态。造成此情况一些可能因素如下：

配额（Quota）不足
就绪探测（Readiness Probe）失败
镜像拉取错误
权限不足
限制范围（Limit Ranges）问题
应用程序运行时的配置错误

检测此状况的一种方法是在 Deployment 规约中指定截止时间参数：（.spec.progressDeadlineSeconds）。 .spec.progressDeadlineSeconds 给出的是一个秒数值，Deployment 控制器在（通过 Deployment 状态）标示 Deployment 进展停滞之前，需要等待所给的时长。

3.1、示例

3.1.1、设置progressDeadlineSeconds

以下 kubectl 命令设置规约中的 progressDeadlineSeconds，从而告知控制器在 10 分钟后报告 Deployment 的上线没有进展：

kubectl patch deployment/nginx-deployment -p '{"spec":{"progressDeadlineSeconds":600}}'

超过截止时间后，Deployment 控制器将添加具有以下属性的 Deployment 状况到 Deployment 的 .status.conditions 中：

type: Progressing
status: "False"
reason: ProgressDeadlineExceeded

这一状况也可能会比较早地失败，因而其状态值被设置为 “False”，其原因为 ReplicaSetCreateError。一旦 Deployment 上线完成，就不再考虑其期限。

参考 Kubernetes API Conventions 获取更多状态状况相关的信息。

Deployment 可能会出现瞬时性的错误，可能因为设置的超时时间过短，也可能因为其他可认为是临时性的问题。

3.1.2、设置配额

为了模拟配额不足的情况，我们需要为当前命名空间设置一个配额限制。假设我们希望限制 Pod 的数量为 1 个，我们可以创建一个配额 YAML 文件

quota.yaml

apiVersion: v1
kind: ResourceQuota
metadata:
  name: pod-quota
spec:
  hard:
    pods: 1

3.1.3、应用配额

kubectl apply -f quota.yaml

如果 Deployment 的创建时间早于 ResourceQuota 的应用时间，则 Deployment 不会受到配额限制的影响。

3.1.4、观察Deployment状态

kubectl describe deploy nginx-deployment

3.1.5、查看报错message

kubectl get deploy nginx-deployment -o yaml

3.1.6、检查Deployment进度

kubectl rollout status deploy nginx-deployment

如果 Deployment 超过了进度期限

命令将返回错误error: deployment "nginx-deployment" exceeded its progress deadline

3.1.7、超过 Deployment 进度限期，Kubernetes 将更新状态和进度状况的原因

3.1.8、解决配额问题

增加配额限制，以便 Deployment 可以完成。我们可以通过修改 ResourceQuota 的硬限制来实现这一点：

kubectl patch resourcequota pod-quota -p '{"spec":{"hard":{"pods":"3"}}}'

3.1.9、观察Deployment恢复情况

kubectl describe deploy nginx-deployment

在这里插入图片描述

type: Available 加上 status: True 意味着 Deployment 具有最低可用性。最低可用性由 Deployment 策略中的参数指定。

type: Progressing 加上 status: True 表示 Deployment 处于上线过程中，并且正在运行，或者已成功完成进度，最小所需新副本处于可用。在这个案例中 reason: NewReplicaSetAvailable 表示 Deployment 已完成。

3.1.10、检查 Deployment 是否未能取得进展

kubectl rollout status deploy nginx-deployment

echo $?

3.2、对失败的Deployment的操作

可应用于已完成的 Deployment 的所有操作也适用于失败的 Deployment。你可以对其执行扩缩容、回滚到以前的修订版本等操作，或者在需要对 Deployment 的 Pod 模板应用多项调整时，将 Deployment 暂停。

十一、清理策略

可以在 Deployment 中设置 .spec.revisionHistoryLimit 字段以指定保留此 Deployment 的多少个旧有 ReplicaSet。其余的 ReplicaSet 将在后台被垃圾回收。默认情况下，此值为 10。

显式将此字段设置为 0 将导致 Deployment 的所有历史记录被清空，因此 Deployment 将无法回滚。

kubeectl get deploy nginx-deployment -o yaml

十二、金丝雀发布

如果要使用 Deployment 向用户子集或服务器子集上线版本，则可以遵循资源管理所描述的金丝雀模式，创建多个 Deployment，每个版本一个。

十三、编写Deployment规约

同其他 Kubernetes 配置一样， Deployment 需要 .apiVersion，.kind 和 .metadata 字段。有关配置文件的其他信息，请参考部署 Deployment、配置容器和使用 kubectl 管理资源等相关文档。

当控制面为 Deployment 创建新的 Pod 时，Deployment 的 .metadata.name 是命名这些 Pod 的部分基础。 Deployment 的名称必须是一个合法的 DNS 子域值，但这会对 Pod 的主机名产生意外的结果。为获得最佳兼容性，名称应遵循更严格的 DNS 标签规则。

Deployment 还需要 .spec 部分。

1、Pod模版

.spec 中只有 .spec.template 和 .spec.selector 是必需的字段。

1.1、.spec.template

这个字段定义了 Deployment 创建的 Pod 的模板，它告诉 Kubernetes 每个 Pod 应该是什么样子的。
包含 .spec.template.metadata.labels，这些标签用于标识由 Deployment 控制的 Pod。
包含 .spec.template.spec，这描述了 Pod 的具体配置，比如容器、镜像、端口等。

1.2、.spec.selector

这个字段指定了 Deployment 用来选择 Pod 的标签选择器。
它必须与 .spec.template.metadata.labels 中定义的标签相匹配，这样才能让 Deployment 知道哪些 Pod 是它应该管理的。

.spec.template 是一个 Pod 模板。它和 Pod 的语法规则完全相同。只是这里它是嵌套的，因此不需要 apiVersion 或 kind。

除了 Pod 的必填字段外，Deployment 中的 Pod 模板必须指定适当的标签和适当的重新启动策略。对于标签，请确保不要与其他控制器重叠。请参考选择算符。

只有 .spec.template.spec.restartPolicy 等于 Always 才是被允许的，这也是在没有指定时的默认设置。

2、副本

.spec.replicas 是指定所需 Pod 的可选字段。它的默认值是1。

如果你对某个 Deployment 执行了手动扩缩操作（例如，通过 kubectl scale deployment deployment --replicas=X），之后基于清单对 Deployment 执行了更新操作（例如通过运行 kubectl apply -f deployment.yaml），那么通过应用清单而完成的更新会覆盖之前手动扩缩所作的变更。

如果一个 HorizontalPodAutoscaler （或者其他执行水平扩缩操作的类似 API）在管理 Deployment 的扩缩，则不要设置 .spec.replicas。恰恰相反，应该允许 Kubernetes 控制面来自动管理 .spec.replicas 字段。

3、指定算符

.spec.selector 是指定本 Deployment 的 Pod 标签选择算符的必需字段。

.spec.selector 必须匹配 .spec.template.metadata.labels，否则请求会被 API 拒绝。

在 API apps/v1版本中，.spec.selector 和 .metadata.labels 如果没有设置的话，不会被默认设置为 .spec.template.metadata.labels，所以需要明确进行设置。同时在 apps/v1版本中，Deployment 创建后 .spec.selector 是不可变的。

当 Pod 的标签和选择算符匹配，但其模板和 .spec.template 不同时，或者此类 Pod 的总数超过 .spec.replicas 的设置时，Deployment 会终结之。如果 Pod 总数未达到期望值，Deployment 会基于 .spec.template 创建新的 Pod。

如果有多个控制器的选择算符发生重叠，则控制器之间会因冲突而无法正常工作。

4、策略

.spec.strategy 策略指定用于用新 Pod 替换旧 Pod 的策略。 .spec.strategy.type 可以是 “Recreate” 或 “RollingUpdate”。“RollingUpdate” 是默认值。

4.1、重新创建Deployment

如果 .spec.strategy.type==Recreate，在创建新 Pod 之前，所有现有的 Pod 会被杀死。

这只会确保为了升级而创建新 Pod 之前其他 Pod 都已终止。如果你升级一个 Deployment，所有旧版本的 Pod 都会立即被终止。控制器等待这些 Pod 被成功移除之后，才会创建新版本的 Pod。如果你手动删除一个 Pod，其生命周期是由 ReplicaSet 来控制的，后者会立即创建一个替换 Pod（即使旧的 Pod 仍然处于 Terminating 状态）。如果你需要一种“最多 n 个”的 Pod 个数保证，你需要考虑使用 StatefulSet。

4.2、滚动更新Deployment

Deployment 会在 .spec.strategy.type==RollingUpdate时，采取滚动更新的方式更新 Pod。你可以指定 maxUnavailable 和 maxSurge 来控制滚动更新过程。

4.2.1、最大不可用

.spec.strategy.rollingUpdate.maxUnavailable 是一个可选字段，用来指定更新过程中不可用的 Pod 的个数上限。该值可以是绝对数字（例如，5），也可以是所需 Pod 的百分比（例如，10%）。百分比值会转换成绝对数并去除小数部分。如果 .spec.strategy.rollingUpdate.maxSurge 为 0，则此值不能为 0。默认值为 25%。

例如：当此值设置为 30% 时，滚动更新开始时会立即将旧 ReplicaSet 缩容到期望 Pod 个数的70%。新 Pod 准备就绪后，可以继续缩容旧有的 ReplicaSet，然后对新的 ReplicaSet 扩容，确保在更新期间可用的 Pod 总数在任何时候都至少为所需的 Pod 个数的 70%。

4.2.2、最大峰值

.spec.strategy.rollingUpdate.maxSurge 是一个可选字段，用来指定可以创建的超出期望 Pod 个数的 Pod 数量。此值可以是绝对数（例如，5）或所需 Pod 的百分比（例如，10%）。如果 MaxUnavailable 为 0，则此值不能为 0。百分比值会通过向上取整转换为绝对数。此字段的默认值为 25%。

例如，当此值为 30% 时，启动滚动更新后，会立即对新的 ReplicaSet 扩容，同时保证新旧 Pod 的总数不超过所需 Pod 总数的 130%。一旦旧 Pod 被杀死，新的 ReplicaSet 可以进一步扩容，同时确保更新期间的任何时候运行中的 Pod 总数最多为所需 Pod 总数的 130%。

4.2.3、滚动更新示例

最大不可用

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.14.2
        ports:
        - containerPort: 80
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxUnavailable: 1

最大峰值

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.14.2
        ports:
        - containerPort: 80
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxSurge: 1

两项混合

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.14.2
        ports:
        - containerPort: 80
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 1

5、进度期限秒数

.spec.progressDeadlineSeconds 是一个可选字段，用于指定系统在报告 Deployment 进展失败之前等待 Deployment 取得进展的秒数。这类报告会在资源状态中体现为 type: Progressing、status: False、 reason: ProgressDeadlineExceeded。Deployment 控制器将在默认 600 毫秒内持续重试 Deployment。将来，一旦实现了自动回滚，Deployment 控制器将在探测到这样的条件时立即回滚 Deployment。

如果指定，则此字段值需要大于 .spec.minReadySeconds 取值。

6、最短就绪时间

.spec.minReadySeconds 是一个可选字段，用于指定新创建的 Pod 在没有任意容器崩溃情况下的最小就绪时间，只有超出这个时间 Pod 才被视为可用。默认值为 0（Pod 在准备就绪后立即将被视为可用）。要了解何时 Pod 被视为就绪，可参考容器探针。

7、修订历史限制

Deployment 的修订历史记录存储在它所控制的 ReplicaSet 中。

.spec.revisionHistoryLimit 是一个可选字段，用来设定出于回滚目的所要保留的旧 ReplicaSet 数量。这些旧 ReplicaSet 会消耗 etcd 中的资源，并占用 kubectl get rs 的输出。每个 Deployment 修订版本的配置都存储在其 ReplicaSet 中；因此，一旦删除了旧的 ReplicaSet，将失去回滚到 Deployment 的对应修订版本的能力。默认情况下，系统保留 10 个旧 ReplicaSet，但其理想值取决于新 Deployment 的频率和稳定性。

更具体地说，将此字段设置为 0 意味着将清理所有具有 0 个副本的旧 ReplicaSet。在这种情况下，无法撤消新的 Deployment 上线，因为它的修订历史被清除了。

8、paused（暂停的）

.spec.paused 是用于暂停和恢复 Deployment 的可选布尔字段。暂停的 Deployment 和未暂停的 Deployment 的唯一区别是，Deployment 处于暂停状态时， PodTemplateSpec 的任何修改都不会触发新的上线。 Deployment 在创建时是默认不会处于暂停状态。

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub