搭建k8s时，etcd无法正常开启

问题1.：在构建etcd集群的时候，node节点上的etcd就是起不来[root@localhost ~]# journalctl -xe可以看到提示信息：member c2c5804bd87e2884 has already been bootstrapped，意思就是：成员c2c5804bd87e2884已经启动，就来我就查询了下资料，说是其中一个成员是通过discovery service引

doctor @yang

4473人浏览 · 2020-12-05 12:12:33

doctor @yang · 2020-12-05 12:12:33 发布

问题1.：在构建etcd集群的时候，node节点上的etcd就是起不来

[root@localhost ~]# journalctl -xe

可以看到提示信息：member c2c5804bd87e2884 has already been bootstrapped，意思就是：成员c2c5804bd87e2884已经启动，就来我就查询了下资料，说是其中一个成员是通过discovery service引导的。必须删除以前的数据目录来清理成员信息。否则成员将忽略新配置，使用旧配置。这就是为什么你看到了不匹配。

看到了这里，问题所在也就很明确了，启动失败的原因在于data-dir （/var/lib/etcd/default.etcd）中记录的信息与 etcd启动的选项所标识的信息不太匹配造成的。

解决办法

第一种方式：

我们可以通过修改启动参数解决这类错误。既然 data-dir 中已经记录信息，我们就没必要在启动项中加入多于配置。具体修改–initial-cluster-state参数：

vim /usr/lib/systemd/system/etcd.service
修改：我们将 --initial-cluster-state=new 修改成 --initial-cluster-state=existing，再次重新启动就ok了

第二种方式：

删除所有etcd节点的 data-dir 文件（不删也行），重启各个节点的etcd服务，这个时候，每个节点的data-dir的数据都会被更新，就不会有以上故障了。

第三种方式：

是复制其他节点的data-dir中的内容，以此为基础上以 --force-new-cluster 的形式强行拉起一个，然后以添加新成员的方式恢复这个集群

问题2

还有一个就是加入etcd集群的时候，无法加入，系统提示“Nov 26 05:35:38 localhost.localdomain etcd[7525]: publish error: etcdserver: request timed out, possibly d…lost”

大概意思就是“发布错误:etcdserver:请求超时，可能d…丢失”

解决思路

在搭建的时候首先就要先关闭以下俩点：
1.首先要关闭核心防火和关闭核心防护。
2.要关闭防火墙

之后查询了一下果然是防火墙没有关闭

K8S/Kubernetes

K8S/Kubernetes社区为您提供最前沿的新闻资讯和知识内容

更多推荐

【深度】阿里巴巴万级规模 K8s 集群全局高可用体系之美

作者 | 韩堂、柘远、沉醉来源 | 阿里巴巴云原生公众号前言台湾作家林清玄在接受记者采访的时候，如此评价自己 30 多年写作生涯：“第一个十年我才华横溢，‘贼光闪现’，令周边黯然失色；第二个十年，我终于‘宝光现形’，不再去抢风头，反而与身边的美丽相得益彰；进入第三个十年，繁华落尽见真醇，我进入了‘醇光初现’的阶段，真正体味到了境界之美”。长夜有穷，真水无香。领略过了 K8s“身在江

K8S/Kubernetes

如何基于 K8s 构建下一代 DevOps 平台？

作者 | 孙健波（天元）导读：当前云原生 DevOps 体系现状如何？面临哪些挑战？如何通过 OAM 解决云原生 DevOps 场景下的诸多问题？云原生开发应用模型 OAM(Open Application Model) 社区核心成员孙健波将为大家一一解答，并分享如何基于 OAM 和 Kubernetes 打造无限能力的下一代 DevOps 平台。什么是 DevOps？为什么基于 Kub