k8s问题排查

【代码】k8s问题排查。

StrongCertain

1136人浏览 · 2024-01-04 19:08:47

StrongCertain · 2024-01-04 19:08:47 发布

重启k8s

systemctl restart kubelet

日志查看

kubectl describe pods -n kube-system|grep dns

网络插件

kubectl apply -f https://docs.projectcalico.org/v3.20/manifests/calico.yaml

网络插件运用失败 k8s提示certificate signed by unknown authority

k8s提示certificate signed by unknown authority (possibly because of "crypto/rsa: verification error" while trying to verify candidate authority certificate "kubernetes")
原因：这是在重新创建集群之前，原来集群的rm -rf $HOME/.kube文件没有删除，所以导致了认证失去作用。

解决方法1：

1、删除这个路径下的文件

rm -rf $HOME/.kube
2、重新执行命令

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
3、重新查看节点

[root@master1 ~]# kubectl get nodes 
NAME      STATUS   ROLES                  AGE   VERSION
master1   Ready    control-plane,master   28m   v1.20.0
master2   Ready    control-plane,master   24m   v1.20.0
master3   Ready    control-plane,master   23m   v1.20.0
node1     Ready    <none>                 23m   v1.20.0
解决方法2：

echo export KUBECONFIG=/etc/kubernetes/kubelet.conf >> ~/.bashrc
source ~/.bashrc

重新挂载文件

 mount -t nfs 192.168.110.182:/nfs/data /nfs/data
 mount -t nfs 192.168.110.183:/nfs/data /nfs/data

文件挂载

解决办法：
#先看看挂载点：

tail  /nfs/data


#修改为修改之后的Ip

[root@localhost ~]# vi /etc/fstab ## /etc/fstab# Created by anaconda on Thu Apr 27 01:18:20 2017## Accessible filesystems, by reference, are maintained under '/dev/disk'# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info#/dev/mapper/centos-root /                       xfs     defaults        0 0UUID=f19e0dd5-1b9a-47fa-b34d-38a77c91f800 /boot                   xfs     defaults        0 0/dev/mapper/centos-opt  /opt                    xfs     defaults        0 0UUID=b35c4a8d-18c5-4db2-9e6b-0fb37821e930 swap                    swap    defaults        0 01.1.1.1:/opt/htdocs  /opt/htdocs  nfs    nolock   0 0

#先强制把挂载去掉

umount -lf  /nfs/data

#重新挂载

mount -a

最后再执行
df -h
查看，就好了

k8s sc.yaml

最近玩玩k8s，在看雷神的课

云原生Java架构师的第一课K8s+Docker+KubeSphere+DevOps
 

在 编辑 了 sc.yaml 之后 apply文件报错

error: error validating "sc.yaml": error validating data: apiVersion not set; if you choose to ignore these errors, turn validation off with --validate=false

问题一：ftp: connect: 拒绝连接
问题二：ftp: connect: 没有到主机的路由

解决方法：
问题一：
原因是因为没有关闭防火墙，将对应ip地址的虚拟机防火墙关闭即可。
#关闭防火墙
systemctl stop firewalld
#永久关闭防火墙
systemctl disable firewalld
关闭防火墙后重新连接即可。



问题二：

原因是因为没有开启ftp，开启ftp服务即可。
#启动服务
systemctl start vsftpd
#重新启动服务
systemctl restart vsftpd
开启服务后重新连接即可。

解决CentOS 7下TELNET “no router to host”错误问题解决

使用CENTOS7系统搭建了一个FTP服务器，TELNET该服务器时出现“no router to host”的错误提示，
经一番搜索。找到问题是出现在防火墙没清理的问题导致的 
解决办法：

[sunhf@localhost ~]   sudo iptables -F

查看描述

 kubectl describe pod -n kubesphere-system   ks-installer-54c6bcf76b-4xvpj

问题 To see the stack trace of this error execute with --v=5 or higher

方案1
kubeadm token create --print-join-command --ttl 0

方案2
kubeadm join k8s-master:6443 --token zwkp5f.27tbo2c1d43d8aed     --discovery-token-ca-cert-hash sha256:9a57b2a0fcde07cf0b5a71d80907a5f1527df898509ec9c526a6d527fe1045dd     --v=5

kubeadm token
kubeadm init或输出的命令中返回的kubeadm join…

kubeadm token create --print-join-command

kubectl delete -f kubernetes-dashboard.yaml

完成后再试一次(注意最好每个节点都做这样的操作，因为调度器随机选择节点部署，简而言之是在被部署的节点上操作)
重新部署
①kubectl delete -f kubernetes-dashboard.yaml,
②kubectl apply -f kubernetes-dashboard.yaml 或者 kubectl create -f kubernetes-dashboard.yaml --save-config

如果还有问题。可以describe或者log来看下具体问题

kubectl describe pods metrics-server -n kube-system
kubectl logs -f pod/metrics-server-cd4d8f6f9-9hmb8  -n kube-system -c metrics-server

1、在master和node上执行重置
swapoff -a #关闭swap空间
#初始化
kubeadm reset
#重新加载 #重启kubelet服务
systemctl daemon-reload 
systemctl restart kubelet 
iptables -F #清空iptables规则
rm -rf $HOME/.kube
 查看安装过程中的报错