kubernetes(k8s)架构和组件，工作流程，资源

xxxxxx

YJ Thoreau

486人浏览 · 2021-11-16 11:56:58

YJ Thoreau · 2021-11-16 11:56:58 发布

一： kubernetes 概述

1.1 K8S 是什么

K8S 的全程是kubernetes (k8个字母s)

作用：

用于自动部署，扩展和管理 “容器化（containerized) 应用程序” 的开源系统。

可以理解成功k8s 是负责自动化运维管理多个容器化程序（比如Docker)的集群，是一个生态及其丰富的容器编排框架工具

由来：

k8s 由google 的Borg系统（博格系统，google内部使用的大规模容器编排工具) 作为原型，后经过GO语言沿用Borg 的思路重写并捐献给CNCF基金会开源。

含义：

词根源于希腊与的舵手，飞行员。

官网:

https://kubernetes.io

GitHub

https://github.com/kubernetes/kubernetes

中文社区:

https://www.kubernetes.org.cn/docs

1.2 为什么使用k8s

1.2.1 传统后端部署的方法和缺陷

传统的后端部署方法：

把程序包(包括可执行二进制文件，配置文件等)放到服务器上，接着运行启动脚本把程序跑起来，同时启动守护脚本，定期检查程序运行状态，必要的话重新拉起程序

缺陷:

当服务的请求量上来，已部署的服务器可能响应不过来。传统的做法是当请求量，内存，cpu超过阈值做了告警，运维人员立即在部署几台服务器，部署好服务之后，接入负载均衡来分担已有的服务的压力

但是，从监控告警到部署服务，中间需要人力介入！我们就可以使用k8s：自动化运维管理容器化程序，来自动完成服务的部署，更新，卸载，扩容，缩容

1.2.2 裸跑docker的缺陷

裸跑docker的缺陷：

单机使用，无法有效集群
随着容器数量的上升，管理成本攀升
没有有效的容灾，自愈机制
没有预设编排模板，无法实现快速，大规模容器调度
没有同一的配置管理中心工具
没有容器生命周期的管理工具
没有图形化运维管理工具

而k8s可以有效的解决这些缺陷

1.3 k8s的特性

k8s提供了容器编排，资源调度，弹性伸缩，部署管理，服务发现等一些列功能

k8s 的特性：

弹性伸缩
- 使用命令，UI或者基于cpu使用情况自动快速扩容和缩容应用程序实例，保证业务高峰并发时的高可用性
- 业务低峰时回收资源，以最小成本运行服务
自我修复
- 在节点故障时重新启动失败的容器，替换和重新部署，保证预期的副本数量
- 杀死健康检查失败的容器，并且在未准备好之前不会处理客户端请求，确保线上服务不中断
服务发现和负载均衡
- k8s为多个容器提供一个统一访问入口（内部IP地址和一个DNS名称）,并且负载均衡关联的所有容器，使得用户无需考虑容器IP问题
自动发布（默认滚动发布模式）和回滚
- k8s采用滚动更新策略更新应用，一次更新一个pod，而不是删除所有pod
- 如果更新过程中出现问题，将回滚更改，确保升级不影响业务
集中化配置管理和密钥管理
- 管理机密数据和应用程序配置，而不需要把敏感数据暴露在镜像里，提高敏感数据安全性
- 可以将一些常用的配置存储在k8s中，方便应用程序使用
存储编排，支持外挂存储并对外挂存储资源进行编排
- 挂载外部存系统，无论是来自本地存储，公有云（如AWS）,还是网络存储(如NFS，GFS，Ceph)都作为集群资源的一部分使用，极大提高存储使用灵活性。
任务批处理运行：
- 提供一次性任务，定时任务
- 满足批量数据吹和分析的场景

二： kubernetes集群架构和核心组件

2.1 集群架构

k8s是属于主从设备模型（Master-Slave架构）,即有Master节点负责集群的调度，管理和运维，Slave节点时集群中的运算工作负载节点。

在K8S中，主节点一般称为Master节点，而从节点则被称为Worker Node节点，每个Node都会被Master分配一些工作负载。

Master组件可以在集群中的任何计算机上运行，但建议Master节点占据一个独立的服务器。因为Master是整个集群的大脑，如果Master所在的节点宕机或不可用，那么所有的控制命令都将失效。除了Master节点，在k8s集群中的其他机器都被称为Worker Node节点，当某个Node宕机时，其上的工作负载会被Master自动转移到其他节点上。

2.2 Master组件部分

2.2.1 kube-apiserver

用于暴露kubernetes API ，任何资源请求或调用操作都是通过 kube-apiserver 提供的接口进行。
以HTTP，Restful API 提供接口服务，所有对象资源的增删改查和监听操作都交给API Server 处理后再提交给Etcd存储
可以理解为API Server 是k8s的请求入口服务。API Server 负责接收 K8S所有请求（来自 UI界面或者 CLI 命令行工具)，然后根据用户的具体请求，去通知其他组件干活。可以说，API Server 是K8S集群架构的大脑

2.2.2 kube-controller-manager

运行管理控制器，是k8s集群中处理常规任务的后台线程，是k8s集群里所有资源对象的自动化控制中心
在k8s集群中，一个资源对应一个控制器，而controller manager 就是负责管理这些控制器的
由一些列控制器组成，通过API Server 监控整个集群的状态，并确保集群处于预期的工作状态，比如当某个Node意外宕机时，Controller Manager 会及时发现并执行自动化修复流程，确保集群始终处于预期工作状态
这些控制器主要包括：
- Node Controller（节点控制器）：负责在节点出现故障时发现和响应
- Replication Controller（副本控制器）：负责保证集群中一个RC（资源对象Replicaion Contraller)所关联的Pod副本数始终保持在预设值。可以理解成确保集群中有且仅有N个Pod实例，N是RC中定义的Pod副本数量
- Endpoints Controller（端点控制器）：填充端点对象（即连接Services和Pods）,负责监听Service和对应Pod副本的变化。可以理解端点是一个服务暴露出来的访问点，如果需要访问一个服务，则必须知道它的endpoint
- Service Accont && Token Controllers（服务账户和令牌控制器）：为新的命名空间创建默认账户和API访问令牌。
- ResourceQuota Controller (资源配置控制器)：确保指定的资源对象在任何时候都不会超量占用系统物理资源
- Namespace Controller（命名空间控制器）：管理namespace的生命周期
- Service Controller（服务控制器）：属于K8S集群与外部的云平台之间的一个接口控制器

2.2.3 Kube-scheduler

是负责资源调度的进程，根据调度算法为新创建的Pod选择一个合适的Node节点。
可以理解成 K8S 所有 Node 节点的调度器。当用户要部署服务时，Scheduler 会根据调度算法选择最合适的 Node 节点来部署 Pod，先使用预算策略在使用优选策略
- 预算策略（predicate）
- 优选策略（priorities）

2.3 etcd存储中心

K8S 的存储服务
etcd是分布式键值存储系统，存储了K8S的关键配置和用户配置。
K8S中仅API Server 才具备读写权限，其他组件必须通过API Server的接口才能读写数据

2.4 worker node 组件

2.4.1 Kubelet 组件

监视node 节点上的资源和服务状态，并汇报给master节点的apiserver;和容器引擎交互，实现容器的生命周期管理

Node 节点的监视器，以及与 Master 节点的通讯器。
- Kubelet 是 Master 节点安插在 Node 节点上的 “眼线”，它会定时向 API Server 汇报自己Node 节点上运行的服务的状态，并接受来自 Master 节点的指示采取调整措施。
从 Master 节点获取自已节点上 Pod 的期望状态（比如运行什么容器、运行的副本数量、网络或者存储如何配置等），直接跟容器引擎交互实现容器的生命周期管理，如果自已节点上Pod 的状态与期望状态不一致，则调用对应的容器平台接口（即 docker 的接口）达到这个状态。
管理镜像和容器的清理工作，保证节点上镜像不会占满磁盘空间，退出的容器不会占用太多资源。

2.4.2 Kube-Proxy

在每个 Node 节点上实现 Pod 网络代理，是 Kubernetes Service 资源的载体，负责维护网络规则和四层负载均衡工作。负责写入规则至iptables、ipvs实现服务映射访问的。
Kube-Proxy本身不是直接给 Pod 提供网络，Pod 的网络是由 Kubelet 提供的，Kube-Proxy 实际上维护的是虚拟的 Pod 集群网络。
Kube-apiserver 通过监控 Kube-Proxy 进行对 Kubernetes Service 的更新和端点的维护。
在 K8S 集群中微服务的负载均衡是由 Kube-proxy 实现的。Kube-proxy 是 K8S 集群内部的负载均衡器。它是一个分布式代理服务器，在 K8S 的每个节点上都会运行一个 Kube-proxy 组件。

2.4.3 docker 或rocket

容器引擎，运行容器，负责本机的容器创建和管理工作。

2.5 kubernetes 的工作过程

用户通过客户端发送请求给集群的唯一入口 API Server

API Server 先将用户的请求信息写入到 etcd存储中。再去找Controller manager 创建对应的pod

Controller Manager通过API Server 去读取etcd 里的用户请求信息，根据请求去预设的模板（如什么镜像，多少实例，健康检查等），将模板写入到etcd中，在根据模板创建pod

Controller Manager 通过 API Server 去找到Scheduler调度pod，为新创建的Pod选择node节点

Scheduler 通过API Server 再etcd 存储中读取node节点的资源信息，通过预算策略和优选策略，从node节点中挑选最优的，并把pod调度到这个节点运行。

预算策略：将所有node节点的剩余资源和pod所需的资源对比，找出符合pod资源需求的node节点
优选策略：预算策略筛选后的node节点被交给优选策略。通过cpu负载，内存剩余等因素，找出最合适的node节点。把pod调度到这个节点运行

Scheduler 确定了调度的节点后，通过API Server 去找到对应node节点上的kublet，由kublet 创建pod

kublet 不仅和容器引擎交互，实现容器的生命周期管理。还监控node节点上的资源信息，pod状态。将这些通过API Server 存储到etcd中。

kube-proxy创建网络规则，制定转发规则。创建service，把用户的请求负载均衡转发到关联的pod上

三：k8s的资源

k8s包含多种资源对象：Pod , Label , Service , Replication , Controller 等
所有的资源对象通过k8s提供的kubctl 工具进行增删改查等操作，并将其保存在etcd中持久化存储
Kubernets其实是一个高度自动化的资源控制系统，通过跟踪对比etcd存储里保存的资源期望状态与当前环境中的实际资源状态的差异，来实现自动控制和自动纠错等高级功能

3.1 Pod

Pod是 Kubernetes 创建或部署的最小/最简单的基本单位，一个 Pod 代表集群上正在运行的一个进程。可以把 Pod 理解成豌豆荚，而同一个Pod内的每个容器是一颗颗豌豆。
一个 Pod 由一个或多个容器组成，Pod中容器共享网络、存储和计算资源，在同一台 Docker 主机上运行。一个 Pod 里可以运行多个容器，又叫边车模式（SideCara）模式。而在生产环境中一般都是单个容器或者具有强关联互补的多个容器组成一个Pod。
同一个 Pod 之间的容器可以通过localhost 互相访问，并且可以挂载Pod内所有的数据卷

不同的 Pod 之间的容器不能用 localhost 访问，也不能挂载其他 Pod 的数据卷。

3.2 Pod 控制器

Pod 控制器是 Pod 启动的一种模版，用来保证在K8S里启动的 Pod 始终按照用户的预期运行（副本数、生命周期、健康状态检查等）
K8S内提供了众多的Pod控制器，常用的有以下几种:
1. **Deployment：无状态应用部署。**Deployment 的作用是管理和控制Pod和Replicaset，管控它们运行在用户期望的状态中 2
2. Replicaset: 确保预期的Pod副本数量。
  
  Replicaset的作用就是管理和控制Pod，管控他们好好干活。但是，Replicaset受控于Deployment .
  - 可以理解成Deployment 就是总包工头，主要负责监督底下的工人Pod干活，确保每时每刻有用户要求数量的Pod在工作,如果一旦发现某个工人Pod不行了，就赶紧新拉一个Pod过来替换它。而ReplicaSet就是总包工头手下的小包工头。
  - 从K8S使用者角度来看，用户会直接操作Deployment部署服务，而当Deployment被部署的时候，K8S会自动生成要求的ReplicaSet和Pod。用户只需要关心Deployment而不操心ReplicaSet 资源对象.
  - Replication Controller是ReplicaSet的前身，官方推荐用Deployment取代Replication Controller来部署服务
3. Daemonset: 确保所有节点运行同一类Pod，保证每个节点上都有一个此类Pod运行，通常用于实现系统级后台任务
4. Statefulset:有状态应用部署
5. Job: 一次性任务。根据用户的设置，Job管理的Pod把任务成功完成就自动退出了
6. Cronjob: 周期性计划性任务

3.3 Label 标签

标签，是K8S特色的管理方式，便于分类管理资源对象
Label可以附加到各种资源对象上，例如Node、Pod、Service、 RC等，用于关联对象、查询和筛选
一个Label是一个key-value 的键值对，其中key 与value 由用户自己指定
一个资源对象可以定义任意数量的Label，同一个Label也可以被添加到任意数量的资源对象中，也可以在对象创建后动态添加或者删除
可以通过给指定的资源对象捆绑一个或多个不同的Label，来实现多维度的资源分组管理功能
与Label类似的，还有Annotation (注释)。区别在于有效的标签值必须为63个字符或更少，并且必须为空或以字母数字字符([a-z0-9A-Z]) 开头和结尾，中间可以包含横杠(-)、下划线(_)、点(.)和字母或数字。注释值则没有字符长度限制

3.4 Label选择器（label selector

给某个资源对象定义一个Label，就相当于给它打了一个标签;随后可以通过标签选择器(Label selector) 查询和筛选拥有某些Label的资源对象
标签选择器目前有两种:基于等值关系(等于、不等于)和基于集合关系(属于、不属于、存在)

3.5 service

在K8S的集群里，虽然每个Pod会被分配一个单独的IP地址，但由于Pod是有生命周期的(它们可以被创建，而且销毁之后不会再启动)，随时可能会因为业务的变更，导致这个IP地址也会随着Pod的销毁而消失

Service就是用来解决这个问题的核心概念:

K8S中的Service并不是我们常说的“服务”的含义，而更像是网关层，可以看作一组提供相同服务的Pod的对外访问接口、流量均衡器
Service作用于哪些Pod是通过标签选择器来定义的:
- 在K8S集群中，Service可以看作一组提供相同服务的Pod的对外访问接口。客户端需要访问的服务就是Service对象。
- 每个Service都有一个固定的虚拟ip (这个ip也被称为Cluster IP) ，自动并且动态地绑定后端的Pod, 所有的网络请求直接访问Service的虚拟ip，Service会自动向后端做转发。
- 通俗来说就是Service通过标签选择器选择那些关联了对应label的Pod，把Pod的IP加入到自己的endpoints当中，当service收到请求后根据endpoints里的ip进行转发
Service除了提供稳定的对外访问方式之外，

还能起到负载均衡(Load Balance) 的功能

，自动把请求流量分布到后端所有的服务上，service可以做到对客户透明地进行水平扩展(scale)，

实现service这一功能的关键，就是kube-proxy。
- kube -proxy运行在每个节点上，监听API Server中服务对象的变化，
- 可通过以下三种流量调度模式: userspace (废弃)、iptables (濒临废弃)、ipvs (推荐，性能最好)来实现网络的转发
Service是K8S服务的核心，屏蔽了服务细节，统一对外暴露服务接口，真正做到了“微服务”。
- 比如我们的一个服务A，部署了3个副本，也就是3个Pod;对于用户来说，只需要关注一个Service 的入口就可以，而不需要操心究竞应该请求哪一个Pod。
- 优势非常明显:一方面外部用户不需要感知因为Pod. 上服务的意外崩溃、 K8S重新拉起Pod而造成的IP变更，外部用户也不需要感知因升级、变更服务带来的Pod替换而造成的IP变化

service 不是通过ip地址找到后端pod，而是通过标签选择器关联具有对应label 的pod，然后把相关pod的ip加入到自己的endpoints(端点）中，service再根据endpoints里的ip进行转发

3.6 Ingress

Service主要负责K8S集群内部的网络拓扑，那么集群外部怎么访问集群内部呢?这个时候就需要Ingress了
Ingress是整个K8S集群的接入层，负责集群内外通讯
Ingress是K8S集群里工作在OSI网络参考模型下，第7层的应用，对外暴露的接口，典型的访问方式是http/https
Service只能进行第四层的流量调度，表现形式是ip+port

。Ingress则可以调度不同业务域、不同URL访问路径的业务流量。
- 比如:客户端请求http://www.mynet.com:port —> Ingress —> Service —> Pod
具体访问流程：客户端使用http/https通过url路径访问K8S集群里的Ingress接入层对外暴露的接口，Ingress层收到请求后找到对应是Service，Service根据标签选择器筛选查询label对应的Pod，根据Pod的IP进行转发获取相应服务

3.7 Name

由于K8S内部，使用“资源”来定义每一种逻辑概念(功能)，所以每种“资源”，都应该有自己的“名称”
“资源”有api版本(apiversion) 、类别(kind)、元数据(metadata) 、定义清单(spec)、状态(status) 等配置信息
“名称”通常定义在“资源”的“元数据”信息里。在同一个namespace 空间中必须是唯一的

3.8 Namespace

随着项目增多、人员增加、集群规模的扩大，需要一种能够逻辑上隔离K8S 内各种“资源"的方法，这就是Namespace
Namespace是为了把一个K8S集群划分为若千个资源不可共享的虚拟集群组而诞生的
不同Namespace 内的“资源”名称可以相同，相同Namespace 内的同种“资源”， “名称”不能相同
合理的使用K8S的Namespace，可以使得集群管理员能够更好的对交付到K8S里的服务进行分类管理和浏览
K8S里默认存在的Namespace 有: default、 kube-system、 kube-public 等
查询K8S里特定“资源”要带上相应的Namespace

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub

k8s 火了！

2020，上云之年，产品云端化成为一种趋势。在一线城市，很多公司都已经构建了自己的私有云环境，比如阿里云、网易云、华为云等。而Kubernetes 作为基于容器编排领域的王者，具备扩展...

所有评论(0)

查看更多评论

YJ Thoreau

已为社区贡献9条内容