K8S快速搭建手记
kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。这个工具能通过两条指令完成一个kubernetes集群的部署:创建一个 Master 节点$ kubeadm init将一个 Node 节点加入到当前集群中$ kubeadm join <Master节点的IP和端口 >安装要求在开始之前,部署Kubernetes集群机器需要满足以下几个条件:一台或多台机器
kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。
这个工具能通过两条指令完成一个kubernetes集群的部署:
创建一个 Master 节点
$ kubeadm init
将一个 Node 节点加入到当前集群中
$ kubeadm join <Master节点的IP和端口 >
- 安装要求
在开始之前,部署Kubernetes集群机器需要满足以下几个条件:
一台或多台机器,操作系统 CentOS7.x-86_x64
硬件配置:2GB或更多RAM,2个CPU或更多CPU,硬盘30GB或更多
集群中所有机器之间网络互通
可以访问外网,需要拉取镜像
禁止swap分区 - 学习目标
1.在所有节点上安装Docker和kubeadm
2.部署Kubernetes Master
3.部署容器网络插件
4.部署 Kubernetes Node,将节点加入Kubernetes集群中
5.部署Dashboard Web页面,可视化查看Kubernetes资源 - 准备环境
角色 IP
k8s-master 192.168.231.132
k8s-node 192.168.231.133
以下红字很重要:
关闭防火墙:
$ systemctl stop firewalld
$ systemctl disable firewalld
关闭selinux:
$ sed -i ‘s/enforcing/disabled/’ /etc/selinux/config # 永久
$ setenforce 0 # 临时
关闭swap:
$ swapoff -a # 临时
$ sed -ri ‘s/.swap./#&/’ /etc/fstab #永久
$ vim /etc/fstab # 永久
删除 /mnt/swap swap swap defaults 0 0 这一行或者注释掉这一行
设置主机名:
$ hostnamectl set-hostname
在master添加hosts:
$ cat >> /etc/hosts << EOF
192.168.231.132 k8s-master
192.168.231.133 k8s-node
EOF
将桥接的IPv4流量传递到iptables的链:
$ cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
$ sysctl --system # 生效
时间同步:
$ yum install ntpdate -y
$ ntpdate time.windows.com
4. 所有节点安装Docker/kubeadm/kubelet
Kubernetes默认CRI(容器运行时)为Docker,因此先安装Docker。
4.1 安装Docker
$ wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo
$ yum -y install docker-ce-18.06.1.ce-3.el7
$ systemctl enable docker && systemctl start docker
$ docker --version
Docker version 18.06.1-ce, build e68fc7a
cat > /etc/docker/daemon.json << EOF
{
“registry-mirrors”: [“https://b9pmyelo.mirror.aliyuncs.com”]
}
EOF
4.2 添加阿里云YUM软件源
$ cat > /etc/yum.repos.d/kubernetes.repo << EOF
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF
4.3 安装kubeadm,kubelet和kubectl
由于版本更新频繁,这里指定版本号部署:
$ yum install -y kubelet-1.17.0 kubeadm-1.17.0 kubectl-1.17.0
$ systemctl enable kubelet
5. 部署Kubernetes Master
在192.168.231.132(Master)执行。
$ kubeadm init
–apiserver-advertise-address=192.168.231.132
–image-repository registry.aliyuncs.com/google_containers
–kubernetes-version v1.17.0
–service-cidr=198.36.0.0/16
–pod-network-cidr=192.72.0.0/16
期间init有报错,重置kubeadm命令:
kubeadm reset
此步要记录下生成的join命令,node节点加入时使用
由于默认拉取镜像地址k8s.gcr.io国内无法访问,这里指定阿里云镜像仓库地址。
使用kubectl工具:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown (id−u):(id -u):(id−u):(id -g) $HOME/.kube/config
$ kubectl get nodes
6. 安装Pod网络插件(CNI)
以下命令一般下载不到该镜像,该镜像已经在百度网盘中了,docker load后下载yml修改相关镜像名执行即可
$ kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml
确保能够访问到quay.io这个registery。
如果Pod镜像下载失败,可以改成这个镜像地址:lizhenliang/flannel:v0.11.0-amd64
下载失败的清除方案:
删除yaml安装的组件
找到最初安装flannel时的yaml文件:
kubectl delete -f kube-flannel.yml
在所有master、worker节点上执行:
ip link delete cni0
ip link delete flannel.1
rm -rf /var/lib/cni/
rm -f /etc/cni/net.d/*
7. 加入Kubernetes Node
在192.168.31.62/63(Node)执行。
向集群添加新节点,执行在kubeadm init输出的kubeadm join命令:
$ kubeadm join 192.168.31.61:6443 --token esce21.q6hetwm8si29qxwn
–discovery-token-ca-cert-hash sha256:00603a05805807501d7181c3d60b478788408cfe6cedefedb1f97569708be9c5
8. 测试kubernetes集群
在Kubernetes集群中创建一个pod,验证是否正常运行:
$ kubectl create deployment nginx --image=nginx
$ kubectl expose deployment nginx --port=80 --type=NodePort
$ kubectl get pod,svc
访问地址:http://NodeIP:Port
9. 部署 Dashboard
以下命令一般下载不到该镜像,该镜像已经在百度网盘中了,下载yaml修改执行即可
$ kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.0.0-beta8/aio/deploy/recommended.yaml
默认Dashboard只能集群内部访问,修改Service为NodePort类型,暴露到外部:
kind: Service
apiVersion: v1
metadata:
labels:
k8s-app: kubernetes-dashboard
name: kubernetes-dashboard
namespace: kubernetes-dashboard
spec:
type: NodePort
ports:
- port: 443
targetPort: 8443
nodePort: 30001
selector:
k8s-app: kubernetes-dashboard
访问地址:http://NodeIP:30001
创建service account并绑定默认cluster-admin管理员集群角色:
kubectl create serviceaccount dashboard-admin -n kube-system
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin
kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk ‘/dashboard-admin/{print $1}’)
问题:安装dashboard时出现secret “kubernetes-dashboard-certs” not found
在安装过程中,不用停止或删除安装,手动生成kubernetes-dashboard-certs证书
cd /etc/kubernetes/pki/
openssl req -new -key dashboard.key -out dashboard.csr -subj “/O=HTI/CN=kubernetes-dashboard”
openssl x509 -req -in dashboard.csr -CA ca.crt -CAkey ca.key -CAcreateserial -out dashboard.crt -days 3650
kubectl create secret generic kubernetes-dashboard-certs --from-file=dashboard.crt --from-file=dashboard.key -n kubernetes-dashboard
或者
mkdir key && cd key
#生成证书
openssl genrsa -out dashboard.key 2048
openssl req -new -out dashboard.csr -key dashboard.key -subj ‘/CN=192.168.231.132’
openssl x509 -req -in dashboard.csr -signkey dashboard.key -out dashboard.crt
#删除原有的证书secret
kubectl delete secret kubernetes-dashboard-certs -n kubernetes-dashboard
#创建新的证书secret
kubectl create secret generic kubernetes-dashboard-certs --from-file=dashboard.key --from-file=dashboard.crt -n kubernetes-dashboard
#查看pod
kubectl get pod -n kubernetes-dashboard
两种方案最后都需要重启pod
kubectl delete pod -n kubernetes-dashboard
问题:Readiness probe failed: Get http://192.168.136.38:8080/health: dial tcp 192.168.136.38:8080: connect: connection refused
1.可能是jvm内存超过了k8s的deployment配置上限
2.有可能是生存探针和就绪探针初始化时间早于docker内部项目启动完毕时间
备记:
重启kubelet
systemctl restart kubelet
查看某pod启动详情
kubectl describe pod ${pods_name} -n kube-system
查看目前启动的所有系统pod
kubectl get pods -n kube-system
类似Https 503报错
先从describe 详情探针开始查,如果是探针提示探测失败,然后查到springboot的健康检查是否为down,如果down就检查哪个项目是down
进入pod
kubectl exec -ti -n – /bin/sh
完全删除pod
kubectl get pod -n nginx
kubectl delete deployment {deploymentName} -n cxy
kubectl delete pod nginx-8698b5449c-grbdm
删除服务
kubectl delete service nginx
pod容器扩容(不推荐的方式)
kubectl scale deployment nginx --replicas=3
获取所有的命名空间
kubectl get namespace
获取服务
kubectl get svc = kubectl get service
若没有设置开机启动项,则开机需启动:
swapoff -a
systemctl start docker
systemctl start kubelet
kubelet出现问题查错命令:
journalctl -xefu kubelet
ImagePullBackOff错误多半是镜像拉取不到的问题:
1.通过yml文件delete之后重新apply
2.第一步未成功后检查kubectl describe pod ${pods_name} -n kube-system详情
yaml中:
imagePullPolicy: Always //镜像的拉取策略,总是拉取
IfNotPresent :如果本地存在镜像就优先使用本地镜像。
Never:直接不再去拉取镜像了,使用本地的;如果本地不存在就报异常了。
参数的作用范围:
.spec:
. containers:
. - name: nginx
. image: image: reg.docker.lc/share/nginx:latest
. imagePullPolicy: IfNotPresent #或者使用Never
因为此参数默认为:imagePullPolicy: Always ,如果你yaml配置文件中没有定义那就是使用默认的。
更多推荐



所有评论(0)