点击上方“程序猿技术大咖”,关注并选择“设为星标”

回复“加群”获取入群讨论资格!

本篇文章来自《华为云云原生王者之路训练营》钻石系列课程第5课,由云原生存储解决方案Everest2.0的架构设计专家Jabin主讲,跟随K8S的存储演进史,进一步了解容器存储的架构设计。

K8s初期为存算分离所做的解耦设计Volume,采用强耦合、灵活性差的in-tree模式,虽然已经让用户专注于业务功能设计。但这类存储卷的生命周期是跟随pod的,只能用作存储临时数据,无法做为最终数据使用。随着K8S的不断成熟,为支持更多的应用场景,提供了一种脱离pod生命周期的、用户可管理的存储抽象设计低耦合、灵活性更强的PersistentVolume/PersistentVolumeClaim。

PV/PVC如何与Flexvolume/CSI的插件一起工作呢?那就是我们接下来要学习的StorageClass。

01

StorageClass工作原理分析

StorageClass工作原理解读

StorageClass是存储类,简称sc。K8S平台为存储提供商提供存储接入的一种声明,通过sc和相应的存储插件(csi/flexvolume)为容器应用提供动态分配存储卷的能力。

25ebb2c70a86e3c103421c06f364c318.png

sc用以指定存储池的:

  • 供应商的名字:everest-csi-provisioner

  • 分配PV卷的回收策略:Delete/Retain

  • 分配PV卷的绑定模式:Immediate/WaitForFirstConsumer

  • 存储是否支持扩容:true/false

  • 驱动名字:disk.csi.everest.io、……

  • 驱动类型:块存储、文件存储、对象存储……

StorageClass应用场景解读

无论在资源管控严格还是资源管控敏捷的场景,资源管理员都希望通过创建k8s的存储接口来管理容器存储资源。

k8s通过存储声明(pvc)、存储类(sc)和存储插件(driver)联合工作,满足用户一键式定义、创建存储。

  • 用户在StatefulSet模板中定义对存储的需要

  • StatefulSet控制器负责将claim模板转换为pvc

  • 结合自定的sc和sc中指定的driver,创建应用所需要的pv卷

b2b88765b439a56d91366f232e65b5a8.png

有状态应用使用动态PV卷示例

定义一个有状态应用:etcd

fed656595dc81966858ec0aee39d34b1.png

在workload模板中定义volumeClaimTemplates来使用动态PV卷:

aa0e2f7e69eadcaced3088e4beafbb3d.png

使用kubectl指令创建应用:

62498c3d95fac528edae96730799d624.png

查询sts、pods、pvc如下:

45b3f5254f7c082af76b1984b0ea2882.png

02

CSI容器存储接口架构解读

Kubernetes中存储相关的组件解读

PV  Controller:负责 PV/PVC 的绑定,并根据需求进行数据卷的 Provision/Delete 操作

代码位置:pkg/controller/volume/persistentvolume/

AD Controller:负责VolumeAttachement的生命周期管理,并通过external-attacher将设备挂载到目标节点或从目标节点卸载。VA是控制块存储设备的 Attach/Detach 操作的逻辑对象

代码位置:pkg/controller/volume/attachdetach/

Kubelet  volumeManager:管理存储卷的 Mount/Unmount 操作、卷设备的格式化等操作,如果当前节点并没有交给AD Controller管理,那么就是volumeManager负责管理VA的生命周期

代码位置:pkg/kubelet/volumemanager/

Volume plugin:K8S平台为存储提供商提供存储接入的插件接口,其中包含in-tree的多种存储插件和out-tree的两种存储插件。通过该插件机制进而为容器应用提供各种类型的存储。社区推荐的是CSI架构的扩展插件

代码位置:pkg/volume/csi

什么是云原生存储?

云原生从技术视角来看是一种还在不断演进中的设计思想,它主要是为了充分利用云计算的优势、促进云计算技术发展而构建和运行应用的设计思想;从用户视角看是一种让用户从迭代慢、运维重、升级难的包袱中解脱出来,聚焦业务开展的设计思想。

云原生应用是基于云原生技术构建、运行的应用程序,它具有:行为可预测,快速弹性扩缩容;持续交付,使研发流程更敏捷;基于API构建,团队协作更顺畅;独立性强,促进DevOps的开展;依赖少,轻量,故障恢复快速。

云原生存储从技术视角看是合以应用为中心、可被声明和组合实现、是API驱动和服务自治、具有敏捷等特性的存储系统;从用户视角看是大的是使能云原生应用特性的存储系统。

以CSI存储架构为例,解读容器存储架构,如下图所示:

  • 控制接口A:K8S平台通过控制接口调用存储提供商发布的控制API;

  • 控制接口B:K8S平台通过sideCar(external-provisioner/attacher等)调用存储提供商发布的控制API;

  • 数据接口C:数据面,存储通过文件系统、块设备等方式为K8S平台中运行的workload提供存储读写等能力;

6c3faeb89a369162e39b199ce17adfb4.png

CSI存储架构解读

external-provisioner:块存储/文件存储/对象存储的创建/删除组件,用以作为sideCar与存储提供商的driver插件统一完成存储的创建/删除操作。

external-attacher:块存储的attach/detach组件,用以作为sideCar与存储提供商的driver插件统一完成块存储与虚机/裸机的挂载/卸载操作。

external-snapshotter:块存储的快照组件,用以作为sideCar与存储提供商的driver插件统一完成块存储的快照操作。

external-resizer:块存储的扩容组件,用以作为sideCar与存储提供商的driver插件统一完成扩容操作。

node-driver-registrar:存储插件注册模块,用以作为sideCar与存储提供商的driver插件统一完成pv存储卷的格式化、mount/unmount操作。

74eccc5fcf75da1fdecd14234485cf8e.png

CSI存储接口解读

CSI接口共分为3类:identity、odeServer和ontrollerServer。

358ca6afad637092670d9bfb1a4ba423.png

CSI服务共分为2类:

  • NodeServer:kubelet对已经绑定到节点上的存储卷的操作,如mount/umount、格式化等;

  • ControllerServer:对存储服务管理的操作,如创建/删除、快照、扩容等

d77117d5425d5865425996d61cf51200.png

自研CSI插件的构建思路

CSI接口调用流程,我们以块存储为例,图示接口调用,如下图所示:

d3ff837e3c1a0218ba850208f3ff1f48.png

CSI插件的sideCar和node-driver之间的关系,如下图所示:

  • 控制面的sideCar与driver通过Deployment/StatefulSet部署;

  • 数据面的sideCar与driver通过DaemonSet部署;

  • sideCar容器和driver容器在pod中通过UDS(unix domain socket)调用,完成卷的生命周期管理;

  • Kubelet与node-driver之间通过UDS调用,完成节点上卷的格式化、挂载给容器使用操作。

e34b3446d11e4f27437c51074cf83de7.png

CSI插件注册流程解读

CSI插件在kubernetes中的注册流程:

1)Kubelet启动后,plugin Manager不断watch插件目录:

/var/lib/kubelet/plugin_registry/,主要方法是:

kubelet.getPluginsRegistrationDir()

2)通过DaemonSet部署的csi-driver,在节点启动后:

  • Drivers容器启动后,创建gRPC server,并监听csi.sock

  • sideCar容器启动后,也创建一个gRPC server,并监听 {driverName}.-reg.sock,node-driver-registrar通过UDS调用GetPluginInfo()向driver请求driver信息;

3)Kubelet pluginManager发现{driverName}.-reg.sock后,会纳入插件管理里;csi VolumePlugin会向{driverName}.-reg.sock通过gRPC client向node-driver-registrar发送GetInfo()请求;

4)Kubelet csi VolumeManager向driver的csi.sock发送NodeGetInfo()请求;

5)Kubelet根据收集到的信息,创建CSINode信息

6)Kubelet调用NotifyRegistrationStatus()通知node-driver-registrar注册情况。

d2aced772e811c86e92a64d7707113b8.png

03

云原生存储最佳实践:从FlexVolume插件向CSI插件迁移

CSI插件和Flexvolume插件对比

Flexvolume插件

e6c94afb312463cf7b68e9e25543c580.png

  • Flexvolume 插件是以二进制发布,并且集成在kube-controller-manager和kubelet的插件目录下: /usr/libexec/kubernetes/kubelet- plugins/volume/exec;

  • 控制面:以二进制的形式集成到kube-controller-manager容器中;

  • 数据面:以DaemonSet的形式部署,安装到node插件目录下,然后驱动插件向kubelet注册;

  • 功能:创建/删除、挂载/卸载、绑定/去绑定操作。

CSI插件

fca67ba7e41ead9af1e9a018ed1bfa43.png

  • CSI插件以全容器形式部署,通过sideCar+driver构建完整的解决方案;

  • 控制面:以Deployment或StatefulSet部署在用户集群中,通过订阅pvc、va等k8s对象,实现存储卷的生命周期管理;

  • 数据面:以DaemonSet的形式部署,通过kubelet gRPC(UDS)调用实现本节点上的存储与容器的绑定操作管理;

  • 功能:创建/删除、挂载/卸载、绑定/去绑定,以及增强功能扩容、快照等

CSI存储兼容in-tree插件存储的方案解读

K8s社区里通过CSIMigration来实现in-tree的存储插件向CSI插件“迁移”,或称之为兼容,这部分兼容会逐步“日落”并下线。

CSIMigration,归根到底就是起到一个转换器作用,在保证北向API不改变的情况下进行转换成CSI的持久卷,并能够被CSI插件管理。

主要涉及到的组件有:

1)Kube-controller-manager:

  • 添加支持CSIMigration的插件——appendAttachableLegacyProviderVolumes;

  • DSW、AttachDetach控制器、expand控制器中添加CSIMigration的csiMigratedPluginManager和intreeToCSITranslator,负责将intree的volume配置信息转换为CSI格式的配置信息,以供后续CSI插件调用;

2)Kubelet:

  • 添加支持CSIMigration的插件——appendLegacyProviderVolumes

  • volumeManger中添加CSIMigration的csiMigratedPluginManager和intreeToCSITranslator,负责将intree的volume配置信息转换为CSI格式的配置信息,以供后续CSI插件调用;

b561d3ad2c03fe639f250e6800506387.png

csi-migration-lib库解读

csi-migration-lib里有几个接口,只需将这些接口定义即可:

e9c688b4775b84e45ea870e0a1bd9913.png

CCE服务中CSI存储兼容Flexvolume持久卷的方案解读

华为CCE服务为了能够让用户使用CSI存储插件中提供的增强能力,在K8S 1.15版本中提供了兼容Flexvolume PV存储的CSI插件。

TranslateInTreeStorageClassToCSI:

316a727a3d2b81c5200d8944ea673882.png

TranslateInTreePVToCSI:

307dbadda2de9d5be3997471a48ce906.png

TranslateCSIPVToInTree:

25e192d4e875a12b390385e111b49dd5.png


感谢您的阅读,也欢迎您发表关于这篇文章的任何建议,关注我,技术不迷茫!

962dbc811850bed9a8c2f13eab0b3cc1.gif

a38c4060b6595535a3897a009959bf6f.gif

喜欢就点个"在看"呗,留言、转发朋友圈

Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐