1. HPA是什么

Kubernetes有一个HPA(Horizontal Pod Autoscaler)的资源,可以实现基于CPU使用率的Pod自动伸缩的功能。

(1)HPA基于Master Node上的kube-controller-manager服务启动参数horizontal-pod-autoscaler-sync-period定义的时长(默认为30秒),周期性的检测Pod的CPU使用率。

如果需要设置horizontal-pod-autoscaler-sync-period可以在Master Node上的/etc/default/kube-controller-manager中修改。

(2)HPA 与之前的 RC、Deployment 一样,也属于一种 Kubernetes 资源对象。通过追踪分析 RC 控制的所有目标 Pod 的负载变化情况,来确定是否需要针对性地调整目标Pod的副本数,这是HPA的实现原理。

(3)metrics-server 也需要部署到集群中, 它可以通过 resource metrics API 对外提供度量数据。

官网维护地址:
https://kubernetes.io/zh/docs/tasks/run-application/horizontal-pod-autoscale-walkthrough/

2. HPA实例

(1)运行 php-apache 服务器并暴露服务

首先,我们先启动一个 deployment 来运行这个镜像并暴露一个服务

[root@server1 hpa]# vim php-apache.yaml 
[root@server1 hpa]# cat php-apache.yaml 
apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-apache
spec:
  selector:
    matchLabels:
      run: php-apache
  replicas: 1
  template:
    metadata:
      labels:
        run: php-apache
    spec:
      containers:
      - name: php-apache
        image: hpa-example
        ports:
        - containerPort: 80
        resources:
          limits:
            cpu: 500m
          requests:
            cpu: 200m

---

apiVersion: v1
kind: Service
metadata:
  name: php-apache
  labels:
    run: php-apache
spec:
  ports:
  - port: 80
  selector:
    run: php-apache

其中需要的镜像hpa-example,已经拉至harbor仓库

(2)运行部署

[kubeadm@server1 hpa]$ vim php-apache.yaml
[kubeadm@server1 hpa]$ kubectl apply -f php-apache.yaml 
deployment.apps/php-apache created
service/php-apache created
[kubeadm@server1 hpa]$

查看状态,可以看出该部署文件创建了一个由deployment控制器维护的pod,以及一个service

在这里插入图片描述

3. 创建 Horizontal Pod Autoscaler

现在,php-apache服务器已经运行,我们将通过 kubectl autoscale 命令创建 Horizontal Pod Autoscaler。 以下命令将创建一个 Horizontal Pod Autoscaler 用于控制我们上一步骤中创建的 deployment,使 Pod 的副本数量在维持在1到10之间。 大致来说,HPA 将通过增加或者减少 Pod 副本的数量(通过 Deployment )以保持所有 Pod 的平均CPU利用率在50%以内 (由于每个 Pod 通过 yaml文件 申请了200 milli-cores CPU,所以50%的 CPU 利用率意味着平均 CPU 利用率为100 milli-cores)。

[root@server1 hpa]# kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
horizontalpodautoscaler.autoscaling/php-apache autoscaled

我们可以通过以下命令查看 autoscaler 的状态:

[root@server1 hpa]# kubectl get hpa
NAME         REFERENCE               TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   0%/50%    1         10        1          19s

请注意在上面的命令输出中,当前的CPU利用率是0%,这是由于我们尚未发送任何请求到服务器 (CURRENT 列显示了相应 deployment 所控制的所有 Pod 的平均 CPU 利用率)。

增加负载

现在,我们将看到 autoscaler 如何对增加负载作出反应。 我们将启动一个容器,并通过一个循环向 php-apache 服务器发送无限的查询请求:

[kubeadm@server1 hpa]$ kubectl get svc
NAME         TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)   AGE
kubernetes   ClusterIP   10.96.0.1        <none>        443/TCP   22d
php-apache   ClusterIP   10.109.183.127   <none>        80/TCP    6m22s
[kubeadm@server1 hpa]$ kubectl run test --image=reg.westos.org/k8s/busyboxplus -it --rm --restart=Never
If you don't see a command prompt, try pressing enter.
/ # while true; do wget -q -O- http://10.109.183.127; done

在这里插入图片描述

在几分钟时间内,通过以下命令,我们可以看到CPU负载升高了

[kubeadm@server1 ~]$ kubectl get hpa
NAME         REFERENCE               TARGETS    MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   250%/50%   1         10        1          6m22s
[kubeadm@server1 ~]$ 

这时,由于请求增多,CPU利用率已经升至250%。 可以看到,deployment 的副本数量已经增长到了5

[kubeadm@server1 ~]$ kubectl get hpa
NAME         REFERENCE               TARGETS    MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   250%/50%   1         10        5          6m57s
[kubeadm@server1 ~]$

查看pod的资源使用情况

在这里插入图片描述

停止负载

我们将通过停止负载来结束我们的示例。

在我们创建 busyboxplus容器的终端中,输入<Ctrl> + C来终止负载的产生。

然后我们可以再次查看负载状态(等待几分钟时间):

[kubeadm@server1 ~]$ kubectl get hpa
NAME         REFERENCE               TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   0%/50%    1         10        5          9m42s
[kubeadm@server1 ~]$

这时,CPU利用率已经降到0,所以 HPA 将自动缩减副本数量至1

注意: 自动伸缩完成副本数量的改变可能需要几分钟的时间。

在这里插入图片描述

4. HPA的伸缩过程

  • 收集HPA控制下所有Pod最近的cpu使用情况(CPU utilization)
  • 对比在扩容条件里记录的cpu限额(CPUUtilization)
  • 调整实例数(必须要满足不超过最大/最小实例数)
  • 每隔30s做一次自动扩容的判断

(1)为了保持集群的稳定,每次扩容后冷却3分钟才能再次进行扩容,而缩容则要等5分钟后。

(2)当前Pod Cpu使用率与目标使用率接近时,不会触发扩容或缩容

(3)触发条件 avg(CurrentPodsConsumption) / Target >1.1 或 <0.9

5. 引入其他度量指标(cpu+内存)

利用autoscaling/v2beta2API版本,您可以在自动伸缩 php-apache 这个 Deployment 时引入其他度量指标

[root@server1 hpa]# vim hpav2.yaml 
[root@server1 hpa]# cat hpav2.yaml 
apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: php-apache
spec:
  maxReplicas: 10
  minReplicas: 1
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-apache
  metrics:
  - type: Resource
    resource:
      name: cpu
      target:
        averageUtilization: 60
        type: Utilization
  - type: Resource
    resource:
      name: memory
      target:
        averageValue: 50Mi
        type: AverageValue

[root@server1 hpa]# kubectl apply -f hpav2.yaml 
Warning: kubectl apply should be used on resource created by either kubectl create --save-config or kubectl apply
horizontalpodautoscaler.autoscaling/php-apache configured

[root@server1 hpa]# kubectl get hpa
NAME         REFERENCE               TARGETS                 MINPODS   MAXPODS   REPLICAS   AGE
php-apache   Deployment/php-apache   13824512/50Mi, 0%/60%   1         10        8          26m

在这里插入图片描述

可以看出已经有了cpu和内存的双重指标,内存单位是字节。

Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐