k8s+nacos无缝发布方案

目前k8s 对微服务发版是可能出现问题的，即便是也会出现发布期间的请求错误。原因是：k8s新的实例启动起来，旧的就会立即被杀掉，而nacos和其他服务没法很快感知到该服务已经下线（心跳机制），期间就会出现流量还会转到旧的节点上（实际上已经被杀掉了就会报错）所以方案的原理也是：在k8s杀掉旧的实例之前，让实例主动在nacos下线，且给予一定的缓冲时间（其他服务的列表刷新），然后额外再调用一下优雅

Jafir

765人浏览 · 2024-02-27 14:10:39

Jafir · 2024-02-27 14:10:39 发布

前言

目前k8s 对微服务发版是可能出现问题的，即便是滚动发布模式+健康检查 也会出现发布期间的请求错误。

原因是：k8s新的实例启动起来，旧的就会立即被杀掉，而nacos和其他服务没法很快感知到该服务已经下线（心跳机制），期间就会出现流量还会转到旧的节点上（实际上已经被杀掉了就会报错）

所以方案的原理也是：在k8s杀掉旧的实例之前，让实例主动在nacos下线，且给予一定的缓冲时间（其他服务的列表刷新），然后额外再调用一下优雅下线接口（友好地让原来的任务执行完毕）

服务侧：

yml配置：

server:
# tomcat开启优雅下线
  shutdown: graceful
 
management:
  metrics:
    export:
      prometheus:
        enabled: true
    tags:
      application: ${spring.application.name}
  endpoints:
    web:
      exposure:
        include: "*"
  endpoint:
# spring容器优雅下线 暴露 shutdown 接口
    shutdown:
      enabled: true
    prometheus:
      enabled: true
    metrics:
      enabled: true
 
 
spring:
  lifecycle:
    # 优雅下线超时时间
    timeout-per-shutdown-phase: 5m

k8s侧：

1、添加健康检查接口 /health/detect

2、配置滚动发布更新

3、jenkins的dockerfile配置 curl的安装下载 (保证docker中是可以直接执行curl命令的)

4、deployment.yaml配置健康检查+preStop钩子

terminationGracePeriodSeconds: 300
 
      lifecycle:
        preStop:
          exec:
            command:
              - sh
              - '-c'
              - >-
                curl http://127.0.0.1:10105/actuator/deregister;sleep
                30;curl -X POST http://127.0.0.1:10105/actuator/shutdown;sleep 5;
       readinessProbe:
        failureThreshold: 3
        httpGet:
          httpHeaders:
            - name: Connection
              value: keep-alive
            - name: Content-Type
              value: application/json
            - name: User-Agent
              value: Kubernetes-readinessProbe
          path: /health/detect
          port: 10105
          scheme: HTTP
        initialDelaySeconds: 30
        periodSeconds: 5
        successThreshold: 1
        timeoutSeconds: 60
       livenessProbe:
        failureThreshold: 3
        httpGet:
          httpHeaders:
            - name: Connection
              value: keep-alive
            - name: Content-Type
              value: application/json
            - name: User-Agent
              value: Kubernetes-readinessProbe
          path: /health/detect
          port: 10105
          scheme: HTTP
        initialDelaySeconds: 30
        periodSeconds: 5
        successThreshold: 1
        timeoutSeconds: 60

核心：

先调用应用程序的nacos主动下线缓冲一段时间，再优雅下线接口，再缓冲一段时间，最终才让k8s滚动发布

curl http://127.0.0.1:10105/actuator/deregister;
sleep 30;
curl -X POST http://127.0.0.1:10105/actuator/shutdown;
sleep 5

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub