K8S快速搭建手记

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。这个工具能通过两条指令完成一个kubernetes集群的部署：创建一个 Master 节点$ kubeadm init将一个 Node 节点加入到当前集群中$ kubeadm join <Master节点的IP和端口 >安装要求在开始之前，部署Kubernetes集群机器需要满足以下几个条件：一台或多台机器

风意水无痕

1326人浏览 · 2022-01-04 18:27:10

风意水无痕 · 2022-01-04 18:27:10 发布

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。
这个工具能通过两条指令完成一个kubernetes集群的部署：

创建一个 Master 节点

$ kubeadm init

将一个 Node 节点加入到当前集群中

$ kubeadm join <Master节点的IP和端口 >

安装要求
在开始之前，部署Kubernetes集群机器需要满足以下几个条件：
一台或多台机器，操作系统 CentOS7.x-86_x64
硬件配置：2GB或更多RAM，2个CPU或更多CPU，硬盘30GB或更多
集群中所有机器之间网络互通
可以访问外网，需要拉取镜像
禁止swap分区
学习目标
1.在所有节点上安装Docker和kubeadm
2.部署Kubernetes Master
3.部署容器网络插件
4.部署 Kubernetes Node，将节点加入Kubernetes集群中
5.部署Dashboard Web页面，可视化查看Kubernetes资源
准备环境

角色 IP
k8s-master 192.168.231.132
k8s-node 192.168.231.133
以下红字很重要：
关闭防火墙：
$ systemctl stop firewalld
$ systemctl disable firewalld

关闭selinux：
$ sed -i ‘s/enforcing/disabled/’ /etc/selinux/config # 永久
$ setenforce 0 # 临时

关闭swap：
$ swapoff -a # 临时
$ sed -ri ‘s/.swap./#&/’ /etc/fstab #永久

$ vim /etc/fstab # 永久
删除 /mnt/swap swap swap defaults 0 0 这一行或者注释掉这一行

设置主机名：
$ hostnamectl set-hostname

在master添加hosts：
$ cat >> /etc/hosts << EOF
192.168.231.132 k8s-master
192.168.231.133 k8s-node
EOF

将桥接的IPv4流量传递到iptables的链：
$ cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
$ sysctl --system # 生效

时间同步：
$ yum install ntpdate -y
$ ntpdate time.windows.com
4. 所有节点安装Docker/kubeadm/kubelet
Kubernetes默认CRI（容器运行时）为Docker，因此先安装Docker。
4.1 安装Docker
$ wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
$ yum -y install docker-ce-18.06.1.ce-3.el7
$ systemctl enable docker && systemctl start docker
$ docker --version
Docker version 18.06.1-ce, build e68fc7a

cat > /etc/docker/daemon.json << EOF

{
“registry-mirrors”: [“https://b9pmyelo.mirror.aliyuncs.com”]
}
EOF
4.2 添加阿里云YUM软件源
$ cat > /etc/yum.repos.d/kubernetes.repo << EOF
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
4.3 安装kubeadm，kubelet和kubectl
由于版本更新频繁，这里指定版本号部署：
$ yum install -y kubelet-1.17.0 kubeadm-1.17.0 kubectl-1.17.0
$ systemctl enable kubelet
5. 部署Kubernetes Master
在192.168.231.132（Master）执行。
$ kubeadm init
–apiserver-advertise-address=192.168.231.132
–image-repository registry.aliyuncs.com/google_containers
–kubernetes-version v1.17.0
–service-cidr=198.36.0.0/16
–pod-network-cidr=192.72.0.0/16
期间init有报错，重置kubeadm命令：
kubeadm reset
此步要记录下生成的join命令，node节点加入时使用
由于默认拉取镜像地址k8s.gcr.io国内无法访问，这里指定阿里云镜像仓库地址。
使用kubectl工具：
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(i d - u) :$ (id -g) $HOME/.kube/config
$ kubectl get nodes
6. 安装Pod网络插件（CNI）
以下命令一般下载不到该镜像，该镜像已经在百度网盘中了，docker load后下载yml修改相关镜像名执行即可
$ kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
确保能够访问到quay.io这个registery。
如果Pod镜像下载失败，可以改成这个镜像地址：lizhenliang/flannel:v0.11.0-amd64
下载失败的清除方案：
删除yaml安装的组件
找到最初安装flannel时的yaml文件：
kubectl delete -f kube-flannel.yml
在所有master、worker节点上执行：
ip link delete cni0
ip link delete flannel.1
rm -rf /var/lib/cni/
rm -f /etc/cni/net.d/*
7. 加入Kubernetes Node
在192.168.31.62/63（Node）执行。
向集群添加新节点，执行在kubeadm init输出的kubeadm join命令：
$ kubeadm join 192.168.31.61:6443 --token esce21.q6hetwm8si29qxwn
–discovery-token-ca-cert-hash sha256:00603a05805807501d7181c3d60b478788408cfe6cedefedb1f97569708be9c5
8. 测试kubernetes集群
在Kubernetes集群中创建一个pod，验证是否正常运行：
$ kubectl create deployment nginx --image=nginx
$ kubectl expose deployment nginx --port=80 --type=NodePort
$ kubectl get pod,svc
访问地址：http://NodeIP:Port
9. 部署 Dashboard
以下命令一般下载不到该镜像，该镜像已经在百度网盘中了，下载yaml修改执行即可
$ kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.0.0-beta8/aio/deploy/recommended.yaml
默认Dashboard只能集群内部访问，修改Service为NodePort类型，暴露到外部：
kind: Service
apiVersion: v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
spec:
type: NodePort
ports:
- port: 443
targetPort: 8443
nodePort: 30001
selector:
k8s-app: kubernetes-dashboard
访问地址：http://NodeIP:30001
创建service account并绑定默认cluster-admin管理员集群角色：
kubectl create serviceaccount dashboard-admin -n kube-system
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin
kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk ‘/dashboard-admin/{print $1}’)

问题：安装dashboard时出现secret “kubernetes-dashboard-certs” not found
在安装过程中，不用停止或删除安装，手动生成kubernetes-dashboard-certs证书
cd /etc/kubernetes/pki/
openssl req -new -key dashboard.key -out dashboard.csr -subj “/O=HTI/CN=kubernetes-dashboard”
openssl x509 -req -in dashboard.csr -CA ca.crt -CAkey ca.key -CAcreateserial -out dashboard.crt -days 3650
kubectl create secret generic kubernetes-dashboard-certs --from-file=dashboard.crt --from-file=dashboard.key -n kubernetes-dashboard
或者
mkdir key && cd key
#生成证书
openssl genrsa -out dashboard.key 2048
openssl req -new -out dashboard.csr -key dashboard.key -subj ‘/CN=192.168.231.132’
openssl x509 -req -in dashboard.csr -signkey dashboard.key -out dashboard.crt
#删除原有的证书secret
kubectl delete secret kubernetes-dashboard-certs -n kubernetes-dashboard
#创建新的证书secret
kubectl create secret generic kubernetes-dashboard-certs --from-file=dashboard.key --from-file=dashboard.crt -n kubernetes-dashboard
#查看pod
kubectl get pod -n kubernetes-dashboard

两种方案最后都需要重启pod
kubectl delete pod -n kubernetes-dashboard

问题：Readiness probe failed: Get http://192.168.136.38:8080/health: dial tcp 192.168.136.38:8080: connect: connection refused
1.可能是jvm内存超过了k8s的deployment配置上限
2.有可能是生存探针和就绪探针初始化时间早于docker内部项目启动完毕时间

备记：
重启kubelet
systemctl restart kubelet

查看某pod启动详情
kubectl describe pod ${pods_name} -n kube-system

查看目前启动的所有系统pod
kubectl get pods -n kube-system

类似Https 503报错
先从describe 详情探针开始查，如果是探针提示探测失败，然后查到springboot的健康检查是否为down，如果down就检查哪个项目是down

进入pod
kubectl exec -ti -n – /bin/sh

完全删除pod
kubectl get pod -n nginx
kubectl delete deployment {deploymentName} -n cxy
kubectl delete pod nginx-8698b5449c-grbdm
删除服务
kubectl delete service nginx

pod容器扩容（不推荐的方式）
kubectl scale deployment nginx --replicas=3

获取所有的命名空间
kubectl get namespace

获取服务
kubectl get svc = kubectl get service

若没有设置开机启动项，则开机需启动：
swapoff -a
systemctl start docker
systemctl start kubelet

kubelet出现问题查错命令：
journalctl -xefu kubelet

ImagePullBackOff错误多半是镜像拉取不到的问题：
1.通过yml文件delete之后重新apply
2.第一步未成功后检查kubectl describe pod ${pods_name} -n kube-system详情

yaml中：
imagePullPolicy: Always //镜像的拉取策略，总是拉取
IfNotPresent ：如果本地存在镜像就优先使用本地镜像。
Never：直接不再去拉取镜像了，使用本地的；如果本地不存在就报异常了。
参数的作用范围：
.spec:
.  containers:
.    - name: nginx
.      image: image: reg.docker.lc/share/nginx:latest
.      imagePullPolicy: IfNotPresent   #或者使用Never

因为此参数默认为：imagePullPolicy: Always ，如果你yaml配置文件中没有定义那就是使用默认的。