hadoop集群之YARN`s ResourceManager HA（三）

如果有看蒙圈的地方，请看下HDFS HA官方给出的方案如下配置目标：node1 node2 node3：3台ZooKeepernode1 node2：为2台ResourceManager首先配置node1，配置etc/hadoop/yarn-site.xml：<property><name>yarn.resourcemanager.ha.enabled</name>

MR_Radish666

6166人浏览 · 2016-12-10 17:29:20

MR_Radish666 · 2016-12-10 17:29:20 发布

如果有看蒙圈的地方，请看下HDFS HA这篇文章
官方给出的方案如下

官方给出的方案

配置目标：

node1 node2 node3：3台ZooKeeper
node1 node2：为2台ResourceManager

首先配置node1，配置etc/hadoop/yarn-site.xml：

<property>
   <name>yarn.resourcemanager.ha.enabled</name>
   <value>true</value>
 </property>
 <property>
   <name>yarn.resourcemanager.cluster-id</name>
   <value>rmcluster</value>
 </property>
 <property>
   <name>yarn.resourcemanager.ha.rm-ids</name>
   <value>rm1,rm2</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname.rm1</name>
   <value>node1</value>
 </property>
 <property>
   <name>yarn.resourcemanager.hostname.rm2</name>
   <value>node2</value>
 </property>
 <property>
   <name>yarn.resourcemanager.zk-address</name>
   <value>node1:2181,node2:2181,node3:2181</value>
 </property>
<property>
   <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>

配置etc/hadoop/mapred-site.xml:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

将node1的这2个配置文件拷贝（scp命令）到其他4台机器中
然后在node1上启动yarn：start-yarn.sh(同时会启动nodemanager（在DN的机器上，一一对应）)
或者使用start-all.sh 命令启动dfs和yarn
然后停掉ZooKeeper：zkServer.sh stop，停掉集群：stop-dfs.sh
启动ZooKeeper：zkServer.sh start
启动备用yarn（node2上）：yarn-daemon.sh start resourcemanager
启动集群：start-dfs.sh
访问主节点web界面：node1:8088和node1:50070
访问备用节点：node2:8088
kill 掉node1的 Resourcemanager进行，之后访问standby结点，需要较慢的时间才能完全接管。是因为，所有的NM都需要给RM进行汇报，而且有一定的超时时间，超过了这个时间才会证明此RM已经宕机。
如果访问node1:50070时，显示standby，则可能是zkfc和ZooKeeper出现了问题，需要去检查日志。、
解决方式：killall java，然后重新启动zkServer.sh start 和集群 start-all.sh

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...