容器,毫无疑问是近年来的又一个技术热词。容器化技术的诞生和兴起,以及它所催生的微服务架构、DevOps、云原生等技术理念,都对软件行业产生了深远的影响。

容器的优点有很多了,完善的封装、便捷的部署、轻量的启动和调度,这些都是容器技术受到欢迎的原因。与编排系统配合后,它能让我们的应用程序容易管理和迭代,即便是再复杂的系统也不在话下。同时呢,容器应用还能做到非常好的可迁移性,环境中只要有符合标准的容器运行时就可以顺利运行。

相信你对容器其实有一定的了解,也知道 Docker 和 Kubernetes 分别是容器技术和容器编排的事实标准。甚至,不少同学已经有过一些实践的经验。

那么在容器这一讲中,我们主要关心什么问题呢?我认为,需要重点搞清楚两个问题:

容器和云是什么关系呢?

在云上运行容器有哪些方式,它们各自又有什么特点呢?

让我们顺着容器上云的发展历程,来了解这两个问题的答案。

容器上云:从 Docker 到 Kubernetes

轻量的容器和富有弹性的云计算,互相之间其实是非常契合的。容器对于运行环境的极强适应性和快速启动的能力,配合云上动态扩展的庞大资源规模,让云端的容器应用可以在短时间内拓展到成千上万个实例。所以,云可以说是容器应用的最佳载体,容器应用也非常适合在云上运行和扩展

其实在 Docker 技术家喻户晓之前,云厂商已经在研究和使用类似容器的技术了,因为云本身是多租户的,需要运行环境的隔离性。所以云本身也是容器技术的用户和受益者,只是部分厂商会考虑进行自研,未必直接使用 Docker 而已。

补充:比如说第 11 讲提到过的 AWS 的 Elastic Beanstalk,它就使用了类似容器的私有技术,以实现 Web 应用之间的隔离。当然后来呢,它也直接支持了 Docker 容器封装的应用。

而当 Docker 兴起之后,各大公有云都不约而同地开始对外提供容器相关的标准 PaaS 服务,并持续地进行改进。如果我们梳理容器 PaaS 服务的发展脉络,就会发现它经历了一系列的发展阶段。

在初期,云上容器平台把 Docker 容器在云上的顺畅运行,作为首要的目标。产品服务的主要目的是帮助用户创建底层虚拟机集群,免去了用户自己手动管理虚拟机的麻烦。然后呢,随着容器应用的复杂化,编排逐渐成为了用户最急迫的需求,所以各厂商又纷纷推出和加强容器编排方面的解决方案。

在那个编排框架群雄并起的年代,有的厂商选择了多点开花,比如微软当时的 Azure Container Service,可以支持 Docker Swarm、Apache Mesos(DC/OS)和 Kubernetes 等多种编排系统;也有的厂商呢,选择了自己的编排方式,以便更好地和自己其他的云服务集成,比如 AWS 的 Elastic Container Service(ECS)。

当然,后来编排框架大战的结果你已经都知道了,Kubernetes 最终一统天下,成为了事实标准。所以各大厂商又很快地调转方向,纷纷为云上 Kubernetes 的支持加码,推出面向 Kubernetes 的专属服务了,比如 AWS 的 Elastic Kubernetes Service(EKS)和 Azure 的 Azure Kubernetes Service(AKS)。阿里云呢,同样也逐渐停止了旗下容器服务对 Swarm 的支持,而把发展重点聚焦在容器服务 Kubernetes 版(ACK)上。

你看,云对容器技术的支持,是伴随着容器生态发展而发展的,所以很多时候,云也是容器生态重要的参与者和推动者。就像 Google Cloud 中的 GKE(Google Kubernetes Engine),由于“根正苗红”,也一直是云上 Kubernetes 服务的标杆之一。

补充:如果说之后的技术潮流还有什么变化,我想你在云上也一样会看到领域内的最新进展。比如 Service Mesh(服务网格),也有越来越多的云服务正在探索和提供相关的支持与服务。这也是云与时俱进的魅力所在。

所以,就现在最新的形势而言,如果要容器上云,那我想你几乎不用犹豫,直接选择各大云上最新的针对 Kubernetes 的服务即可。

关于 Kubernetes 本身,它是一个非常庞大的技术体系,我建议你通过专门的课程来系统学习。但在这里你需要重点了解一下,相对于自建 Kubernetes 集群,云上 Kubernetes 服务的几个独有特点。

首先,很多云上的 Kubernetes 服务,由于云端的多租户特性,可以免除你在 Master 节点方面的开销。换句话说,你只需要创建 Worker 节点,并为之付费就行了。云平台会统一为你提供和托管 Master 节点,降低你的资源和运维成本。

另外,我们都知道 Kubernetes 虽然复杂性较高,但抽象设计出色,能够支持大量灵活的扩展。所以云厂商在这个方面花了很多功夫,能够让很多云平台上的 IaaS 或 PaaS 功能组件,渗透到 Kubernetes 的体系中来,这样可以让两边有一个更紧密的集成。

比如说,在常用来引导外部流量的 Ingress Controller(入口控制器)方面,就有 AWS 的 ALB Ingress Controller,和 Azure 的 AKS Application Gateway Ingress Controller 等基于云上负载均衡器的控制器实现。它们会创建相应的 PaaS 服务实例,来为 Kubernetes 集群服务。

再比如,我们可以在 Kubernetes 中定义动态存储卷分配策略的 StorageClass 层面,指定使用云端的块存储服务,来按需创建和挂载持久化存储。下面的配置文件片段(注意它的 provisioner 和 parameters 字段),就展示了一个使用 AWS EBS 服务来提供的 SSD 云硬盘的例子。

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: standard
provisioner: kubernetes.io/aws-ebs
parameters:
  type: gp2

云和 K8s 集成的方面还有很多,权限认证、日志集成、私有网络等许多方面,这里就不一一展开讨论了。这些集成共同构成了 K8s 在云上运行,以及和云全方位融合的坚实保障。

目前,AWS 还正在积极地研发推进 AWS Service Operator for Kubernetes,它把 S3、RDS 等有状态的 AWS 云服务,以自定义资源的形式纳入到了 Kubernetes 中。这让我们能够通过使用云服务来扩展 Kubernetes 的能力,并反过来使用 Kubernetes 来管理这些云资源。我们可以预期,类似 Service Operator 这样的服务,未来将会不断走向成熟,也能够进一步加快容器和云一体化架构的发展。

架构灵活性的角度来看,云上 Kubernetes 服务还带来了另一个好处:多集群

由于建立 K8s 集群的门槛大大降低了,如果业务间的关联较小,你是可以考虑为不同的业务单独创建 K8s 集群的。这样,不同的集群之间就有了更好的隔离性,也可以单独地扩展。

容器镜像服务

容器方面的另一种常见而且又很重要的云服务,就是容器镜像服务(Container Registry)。我们知道,容器的镜像是容器化程序封装后的基本单位,在云上,你肯定需要一个可以存储和管理自己程序镜像的地方,就像 Docker Hub 管理了很多公开镜像一样。

所以,在大多数云上都提供了自己的容器镜像服务,如 AWS 的 ECR、Azure 的 ACR 等。它们能让你建立私有的镜像仓库,支持镜像的推送和拉取,还可以进行版本管理等操作。镜像服务虽然看上去简单,却是云上容器体系中不可或缺的一环,容器的运行肯定要和它打交道。

全托管的容器实例服务

上面我们所讨论的容器服务,一般还是能够看到虚拟机的,在云虚拟机的层面都有相应的集群被创建。这其实是一种半托管的 PaaS 模式。

那么,有没有更加方便易用,不用关心底层基础设施的容器服务呢?

答案是肯定的,这也是近期云计算在容器领域的另一个特点和趋势:容器实例服务。常见的有 AWS 的 Fargate、阿里云的弹性容器实例、Azure 的 Azure Container Instance 等等。它们都是“全托管”思想在容器服务上的体现。

如果你只是有一个容器镜像,想要尽快地在云上跑起来,那么这类服务很可能就是你的最佳选择。因为它简便易行,成本低、速度快,而且你不需要操心底层的虚机和集群,也可以绕开复杂的编排系统,只需要关注 Pod 运行层面的目标就可以了。这是容器实例类云服务很大的卖点,尤其对于无状态的应用非常适合。

接下来,举一个实际的例子,把第 11 讲中,我们计算斐波那契数列的 Node.js 程序容器化,并且把它搬到云上的容器实例服务。我们这里使用 Azure 云上的容器实例(Azure Container Instance)来完成这个实验。

首先,要把我们之前的 Node 程序用 Docker 封装起来,相关的 Dockerfile 如下:

FROM node:10
WORKDIR /usr/src/app
COPY package.json ./
COPY app.js ./
RUN npm install
ENV PORT=80
EXPOSE 80
CMD [ "node", "app.js" ]

可以用一个简单的打包命令,来获得本地的 Docker 镜像,我们就叫它 fiboapp:

docker build --rm -f dockerfile -t fiboapp:1.0.0 .

然后,我们在 Azure 上新建一个容器注册表,也就是前面提到的容器镜像服务。云上会为我们分配一个镜像服务器的域名:

接着我们就可以用标准 Docker 命令登录,并且将镜像上传到这个私有的镜像仓库:

docker login geektimehellocloud.azurecr.io        
docker tag fiboapp:1.0.0 geektimehellocloud.azurecr.io/fiboapp:1.0.0
docker push geektimehellocloud.azurecr.io/fiboapp:1.0.0

推送完成后,界面上就显示出了这个镜像的信息。

然后,我们就可以创建一个容器实例,并且指向相关的镜像了:

随后通过一些特别简单的配置,我们就可以让容器在云上跑起来了。它还贴心地“赠送”给我们一个域名:fiboapp.japaneast.azurecontainer.io。

这就大功告成了。我们用 curl 工具测试一下运行在云容器中的斐波那契服务,一切正常:

client@clientVM:~$ curl http://fiboapp.japaneast.azurecontainer.io/fibo/30
Fibo(30) = 1346269
Computed by wk-caas-3fa7a6b99b-7703b0c1f33ab2xxxxxxxx with private ip 10.244.32.63

至此,我们把斐波那契数列应用就成功地迁移到了容器实例服务上。你可以看到,这个服务为我们准备好了容器运行所需的一切环境,我们需要做的,就只是简单地把镜像打包上传而已。

课堂总结与思考

从 Docker 到 Kubernetes,容器生态不断的发展,云原生的技术浪潮已经袭来。不单是我们开发者要学习和拥抱容器技术,各个云计算厂商也都想把自己变成运行容器的最佳场所。所以,云平台们推出了各种各样的容器相关服务,以争夺云上的容器用户。

相信通过今天的介绍,你能够回答这一讲开头提出的两个问题了。容器和云是相辅相成的,云承载着容器的运行,容器生态也驱动着云的发展。从运行方式上来看,你既可以轻量方便地在云上运行容器,也可以在云上 Kubernetes 服务的帮助下创建集群,进行较大规模的编排和部署。

这里还整理了各大云的容器相关服务名称和缩写,可以参考下面的表格:

不知道你有没有注意,其实容器与云还有一层微妙的关系,那就是容器与厂商力推的一些云服务,存在一定的竞争和替代关系。

就像部分 PaaS 的功能,能够使用 IaaS 来实现一样,容器由于它极高的构建自由度和便捷的封装部署机制,也可以一定程度地替代部分云上的可复用组件(就像我们的实验中,用容器完成了第 12 讲中类似效果的应用部署)。而且,它可以作为系统的一部分参与编排,还是避免厂商绑定的“神器”。

注:从资源编排的角度来看同样如此,K8s 的各种 yaml 配置,和第 8 讲中提到过的 ARM Template 和 AWS CloudFormation 等私有的资源描述方式,同样存在能力交集。

这就是为什么你会发现,像 Google 这样在云计算领域相对后发的厂商,会更热衷于云原生生态的建设,并积极创立和发展 CNCF(Cloud Native Computing Foundation,云原生计算基金会)这样的组织。因为以厂商中立为特点的云原生阵营若能崛起,有助于挑战已经在云计算产品体系中占据优势的老玩家。这是有商业考量的。

当然,不论背后的商业用意如何,业界从碎片化的私有技术到统一的技术标准上面来,这本身就是云原生带来的一种进步,有着非常积极的意义。对我们开发者也是好事情,它帮我们保证了应用的可迁移性。

所以尽管容器一定程度地威胁到了部分云服务,不过云计算再一次体现了技术中立性,云平台们都大大方方地支持和承载了容器的运行,甚至作为重点服务来进行发展。把选择权留给用户,这是云的胸怀所在。

K8s 还在快速地发展,云上各种 IaaS/PaaS 服务也是实力雄厚,两者亦敌亦友,又相互渗透。未来的走向究竟如何,十分值得关注,让我们拭目以待。

好了,今天同样留两个思考题,欢迎你参与讨论:

后半篇所讲的容器实例类服务,与前半篇讲到的云上 Kubernetes 编排服务,其实并不是割裂的关系。通过集成和调度,不少云上 Kubernetes 服务中的 Pod 能够在容器实例服务中运行。你知道它是通过 K8s 中什么机制来完成的吗?

对于最后讨论的容器与云的微妙关系,你是怎么看的?你觉得未来更多是以 K8s 为中心、云原生吞噬一切,还是云自身的 IaaS/PaaS 产品体系更为强大,K8s 只是云中的一个服务呢?

[上讲问题参考回答]

1. 在Hadoop的黄金时代,就近访问是诞生在当时网络传输速度远远低于本地硬盘IO的大背景下的,所以它的作用非常大。随着数据中心高速网络技术的发展,网络传输得以不断接近本地IO,反而是算力容易成为瓶颈,所以使用对象存储时计算存储分离等优势就凸显出来了。

2. Hive是基于Hadoop生态的数据仓库,早期使用MapReduce作为计算实现引擎,更侧重大数据量的支持,查询实时性不佳。后来虽然使用Tez/Spark等引擎进行了很多性能优化,但仍然和MPP类分析型数据库存在查询执行架构和效能方面的区别。所以相对来说,分析型数据库擅长即席查询,而Hive更适合离线计算。

Logo

一起探索未来云端世界的核心,云原生技术专区带您领略创新、高效和可扩展的云计算解决方案,引领您在数字化时代的成功之路。

更多推荐