k8s问题排查
【代码】k8s问题排查。
·
重启k8s
systemctl restart kubelet
日志查看
kubectl describe pods -n kube-system|grep dns
网络插件
kubectl apply -f https://docs.projectcalico.org/v3.20/manifests/calico.yaml
网络插件运用失败 k8s提示certificate signed by unknown authority
k8s提示certificate signed by unknown authority (possibly because of "crypto/rsa: verification error" while trying to verify candidate authority certificate "kubernetes")
原因:这是在重新创建集群之前,原来集群的rm -rf $HOME/.kube文件没有删除,所以导致了认证失去作用。
解决方法1:
1、删除这个路径下的文件
rm -rf $HOME/.kube
2、重新执行命令
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
3、重新查看节点
[root@master1 ~]# kubectl get nodes
NAME STATUS ROLES AGE VERSION
master1 Ready control-plane,master 28m v1.20.0
master2 Ready control-plane,master 24m v1.20.0
master3 Ready control-plane,master 23m v1.20.0
node1 Ready <none> 23m v1.20.0
解决方法2:
echo export KUBECONFIG=/etc/kubernetes/kubelet.conf >> ~/.bashrc
source ~/.bashrc
重新挂载文件
mount -t nfs 192.168.110.182:/nfs/data /nfs/data
mount -t nfs 192.168.110.183:/nfs/data /nfs/data
文件挂载
解决办法:
#先看看挂载点:
tail /nfs/data
#修改为修改之后的Ip
[root@localhost ~]# vi /etc/fstab ## /etc/fstab# Created by anaconda on Thu Apr 27 01:18:20 2017## Accessible filesystems, by reference, are maintained under '/dev/disk'# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info#/dev/mapper/centos-root / xfs defaults 0 0UUID=f19e0dd5-1b9a-47fa-b34d-38a77c91f800 /boot xfs defaults 0 0/dev/mapper/centos-opt /opt xfs defaults 0 0UUID=b35c4a8d-18c5-4db2-9e6b-0fb37821e930 swap swap defaults 0 01.1.1.1:/opt/htdocs /opt/htdocs nfs nolock 0 0
#先强制把挂载去掉
umount -lf /nfs/data
#重新挂载
mount -a
最后再执行
df -h
查看,就好了
k8s sc.yaml
最近玩玩k8s,在看雷神的课
云原生Java架构师的第一课K8s+Docker+KubeSphere+DevOps
在 编辑 了 sc.yaml 之后 apply文件报错
error: error validating "sc.yaml": error validating data: apiVersion not set; if you choose to ignore these errors, turn validation off with --validate=false
问题一:ftp: connect: 拒绝连接
问题二:ftp: connect: 没有到主机的路由
解决方法:
问题一:
原因是因为没有关闭防火墙,将对应ip地址的虚拟机防火墙关闭即可。
#关闭防火墙
systemctl stop firewalld
#永久关闭防火墙
systemctl disable firewalld
关闭防火墙后重新连接即可。
问题二:
原因是因为没有开启ftp,开启ftp服务即可。
#启动服务
systemctl start vsftpd
#重新启动服务
systemctl restart vsftpd
开启服务后重新连接即可。
解决CentOS 7下TELNET “no router to host”错误问题解决
使用CENTOS7系统搭建了一个FTP服务器,TELNET该服务器时出现“no router to host”的错误提示,
经一番搜索。找到问题是出现在防火墙没清理的问题导致的
解决办法:
[sunhf@localhost ~] sudo iptables -F
查看描述
kubectl describe pod -n kubesphere-system ks-installer-54c6bcf76b-4xvpj
问题 To see the stack trace of this error execute with --v=5 or higher
方案1
kubeadm token create --print-join-command --ttl 0
方案2
kubeadm join k8s-master:6443 --token zwkp5f.27tbo2c1d43d8aed --discovery-token-ca-cert-hash sha256:9a57b2a0fcde07cf0b5a71d80907a5f1527df898509ec9c526a6d527fe1045dd --v=5
kubeadm token
kubeadm init或输出的命令中返回的kubeadm join…
kubeadm token create --print-join-command
kubectl delete -f kubernetes-dashboard.yaml
完成后再试一次(注意最好每个节点都做这样的操作,因为调度器随机选择节点部署,简而言之是在被部署的节点上操作)
重新部署
①kubectl delete -f kubernetes-dashboard.yaml,
②kubectl apply -f kubernetes-dashboard.yaml 或者 kubectl create -f kubernetes-dashboard.yaml --save-config
如果还有问题。可以describe或者log来看下具体问题
kubectl describe pods metrics-server -n kube-system
kubectl logs -f pod/metrics-server-cd4d8f6f9-9hmb8 -n kube-system -c metrics-server
1、在master和node上执行重置
swapoff -a #关闭swap空间
#初始化
kubeadm reset
#重新加载 #重启kubelet服务
systemctl daemon-reload
systemctl restart kubelet
iptables -F #清空iptables规则
rm -rf $HOME/.kube
查看安装过程中的报错
更多推荐
已为社区贡献16条内容
所有评论(0)