外部etcd集群检查状态异常

登录etcd服务节点上查询etcd服务

# systemctl status etcd.service

重启etcd服务发现服务启动异常,

# journalctl -xeu etcd 

 提示cannot unmarshal event: proto: wrong wireType = 0 for field Key。经查询资料,此报错是由于服务器非正常关机(意外掉电,强制拔电)后 etcd数据损坏导致的,这个节点之前确实是出现异常关机,etcd无法启动,那么解决此问题就行了。

在故障节点上停止etcd服务并删除损坏的 etcd 数据,现在etcd服务本来就没有启动,删除前先备份数据,最后启动etcd服务。

检查etcd的数据存储位置

将 /var/lib/etcd/deafault.etcd/member 下的数据备份出来并移走

 

 后重启etcd服务

# systemctl restart etcd

另外两节点也有类似异常重启情况,也同步进行上述清理操作,并重启etcd服务

检查外部etcd集群状态

 

Logo

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐