k8s容器灰度发布最佳实践（基于spinnaker）

k8s中的容器一般是通过deployment管理的，那么一次滚动升级理论上会更新所有pod，这由deployment资源特性保证的，但在实际的工作场景下，需要灰度发布进行服务验证，即只发布部分节点，这似乎与k8s的deployment原理相违背，但是灰度发布的必要性，运维同学都非常清楚，如何解决这一问题？最佳实践：定义两个不同的deployment，例如：fop-gate和fop-gate-ca.

weixin_33701564

1230人浏览 · 2019-03-09 16:36:05

weixin_33701564 · 2019-03-09 16:36:05 发布

最佳实践：
定义两个不同的deployment，例如：fop-gate和fop-gate-canary，但是管理的pod所使用的镜像、配置文件全部相同，不同的是什么呢？
答案是：replicas （灰度的fop-gate-canary的replicas是1，fop-gate的副本数是9）

cat deployment.yaml
apiVersion: apps/v1beta1
kind: Deployment
metadata:
  {{if eq .system.SERVICE  "fop-gate-canary"}}
  name: fop-gate-canary
  {{else if eq .system.SERVICE "fop-gate"}}
  name: fop-gate
  {{end}}
  namespace: dora-apps
  labels:
    app: fop-gate
    team: dora
    type: basic
  annotations:
    log.qiniu.com/global.agent: "logexporter"
    log.qiniu.com/global.version: "v2"
spec:
  {{if eq .system.SERVICE  "fop-gate-canary"}}
  replicas: 1
  {{else if eq .system.SERVICE "fop-gate"}}
  replicas: 9
  {{end}}
  minReadySeconds: 30
  strategy:
    type: RollingUpdate
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 0
  template:
    metadata:
      labels:
        app: fop-gate
        team: dora
        type: basic
    spec:
      terminationGracePeriodSeconds: 90
      containers:
      - name: fop-gate
        image: reg.qiniu.com/dora-apps/fop-gate:20190218210538-6-master
...........

我们都知道， deployment 会为自己创建的 pod 自动加一个 “pod-template-hash” label 来区分，也就是说，每个deployment只管理自己的pod，不会混乱，那么此时endpoint列表中就会有fop-gate和fop-gate-canary的pod，其他服务调用fop-gate的时候就会同时把请求发到这10个pod上。

灰度发布该怎么做呢？
最佳实践：创建两个不同pipeline，先灰度发布fop-gate-canary的pipeline，再全局发布fop-gate的pipeline（这里给出的是渲染前的配置文件，注意pipeline不同）：

  "fop-gate":
    "templates":
    - "dora/jjh/fop-gate/configmap.yaml"
    - "dora/jjh/fop-gate/service.yaml"
    - "dora/jjh/fop-gate/deployment.yaml"
    - "dora/jjh/fop-gate/ingress.yaml"
    - "dora/jjh/fop-gate/ingress_debug.yaml"
    - "dora/jjh/fop-gate/log-applog-configmap.yaml"
    - "dora/jjh/fop-gate/log-auditlog-configmap.yaml"
    "pipeline": "569325e6-6d6e-45ca-b21e-24016a9ef326"

  "fop-gate-canary":
    "templates":
    - "dora/jjh/fop-gate/configmap.yaml"
    - "dora/jjh/fop-gate/service.yaml"
    - "dora/jjh/fop-gate/deployment.yaml"
    - "dora/jjh/fop-gate/ingress.yaml"
    - "dora/jjh/fop-gate/log-applog-configmap.yaml"
    - "dora/jjh/fop-gate/log-auditlog-configmap.yaml"
    "pipeline": "15f7dd6a-bd01-41bc-bac5-8266d63fc3a5"

注意发布的先后顺序：
k8s容器灰度发布最佳实践（基于spinnaker）

灰度发布完成后，可以登陆pod查看日志，并观察相关的grafana监控，查看TPS2XX和TPS5XX的变化情况，再决定是否继续发布fop-gate，实现灰度发布的目的

➜  dora git:(daixuan) ✗ kubectl get pod -o wide | grep fop-gate
fop-gate-685d66768b-5v6q4          2/2     Running   0          15d     172.20.122.161   jjh304    <none>
fop-gate-685d66768b-69c6q          2/2     Running   0          4d21h   172.20.129.52    jjh1565   <none>
fop-gate-685d66768b-79fhd          2/2     Running   0          15d     172.20.210.227   jjh219    <none>
fop-gate-685d66768b-f68zq          2/2     Running   0          15d     172.20.177.98    jjh322    <none>
fop-gate-685d66768b-k5l9s          2/2     Running   0          15d     172.20.189.147   jjh1681   <none>
fop-gate-685d66768b-m5n55          2/2     Running   0          15d     172.20.73.78     jjh586    <none>
fop-gate-685d66768b-rr7t6          2/2     Running   0          15d     172.20.218.225   jjh302    <none>
fop-gate-685d66768b-tqvp7          2/2     Running   0          15d     172.20.221.15    jjh592    <none>
fop-gate-685d66768b-xnqn7          2/2     Running   0          15d     172.20.133.80    jjh589    <none>
fop-gate-canary-7cb6dc676f-62n24   2/2     Running   0          15d     172.20.208.28    jjh574    <none>

➜  dora git:(daixuan) ✗ kubectl exec -it fop-gate-canary-7cb6dc676f-62n24 -c fop-gate bash
root@fop-gate-canary-7cb6dc676f-62n24:/# cd app/auditlog/
root@fop-gate-canary-7cb6dc676f-62n24:/app/auditlog# tail -n5 144 | awk -F'\t' '{print $8}'
200
200
200
200
200

k8s容器灰度发布最佳实践（基于spinnaker）

此外，spinnaker具有发布具有pause、resume、undo功能，实际测试可行
pause 暂停功能（类似于kubectl rollout pause XXX的功能）
resume恢复功能（类似于kubectl rollout resume XXX的功能）
undo取消功能（类似于kubectl rollout undo XXX功能）
k8s容器灰度发布最佳实践（基于spinnaker）

spinnaker的这几种功能可以在正常发布服务的过程中发现问题，及时暂停和恢复，注意，spinnaker取消发布一定是针对正在发布的操作，pause状态中的发布无法取消，这与kubectl操作一致

我们尝试执行一次，发布，暂停，恢复，取消操作，整个过程会产生4个version，每次变动会对应一个新version，因为不管是暂停还是恢复，在spinnaker中都将认为是一次新的发布，会更新version版本
k8s容器灰度发布最佳实践（基于spinnaker）

总结：k8s中灰度发布最好方法就是定义两个不同的deployment管理相同类型的服务，创建不同的pipeline进行发布管理，避免干扰，同时在正常发布过程中，也可以利用spinnaker的pause，resume，undo等功能进行发布控制。

转载于:https://blog.51cto.com/daixuan/2360529

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub