docker 容器实现 hadoop分布式集群部署

在学习hadoop课程中，讲师介绍了hadoop的单机以及集群部署方式，由于本地资源限制，只有一台虚拟机，所以考虑使用docker的方式实现分布式集群搭建。如上图：需要在主节点启动NameNode,Secondary namenode,Resource Manager从节点启动：DataNode，Node Manager准备下载centos镜像: docker pull centos启动一个容器：

yangqin@1225

3617人浏览 · 2021-12-18 15:25:05

yangqin@1225 · 2021-12-18 15:25:05 发布

在学习hadoop课程中，讲师介绍了hadoop的单机以及集群部署方式，由于本地资源限制，只有一台虚拟机，所以考虑使用docker的方式实现分布式集群搭建。
在这里插入图片描述
如上图：
需要在主节点启动NameNode,Secondary namenode,Resource Manager
从节点启动：DataNode，Node Manager

准备

下载centos镜像: docker pull centos
启动一个容器：docker run -td --name base -i centos bash
进入容器，安装jdk及hadoop，方法和主机一样
容器中安装ssh：yum install openssh-server openssh-clients
设置免密登录： ssh-keygen -t rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
保存容器修改：docker commit base hadoop:4

配置

新建目录结构如下，只需要创建两个文件：docker-compose.yml以及Dockerfile，其他文件夹是启动后自动生成的

在这里插入图片描述
docker-compose.yml

version: '2.0'
services:
  hadoop01:
    build: .
    container_name: "hadoop01"
    volumes:
     - ./hadoop01:/data/hadoop_repo
    tty: true
    privileged: true
    hostname: hadoop01
    ports:
     - "9870:9870"  
     - "8088:8088"
  hadoop02:
    image: "hadoopdockercluster_hadoop01"
    container_name: "hadoop02"
    tty: true
    privileged: true
    hostname: hadoop02
    volumes:
     - ./hadoop02:/data/hadoop_repo
  hadoop03:
    image: "hadoopdockercluster_hadoop01"
    container_name: "hadoop03"
    tty: true
    privileged: true
    hostname: hadoop03
    volumes:
     - ./hadoop03:/data/hadoop_repo

Dokerfile

FROM hadoop:4
ENV JAVA_HOME=/opt/jdk1.8.0_181
ENV HADOOP_HOME=/opt/hadoop-3.2.0-cluster
ENV PATH=.:$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin
CMD ["/usr/sbin/sshd","-D"]

启动

docker-compose build
docker-compose up -d
docker exec -it hadoop01 bash
格式化HDFS： hdfs namenode -format
启动： start-all.sh

验证

查看容器列表

在这里插入图片描述

前台访问：

hdfs: http://192.168.56.104:9870/

在这里插入图片描述

yarn: http://192.168.56.104:8088/

在这里插入图片描述

向您推荐>>Eolink开发者社区

权威｜前沿｜技术｜干货｜国内首个API全生命周期开发者社区

更多推荐

深入理解 Mocha 测试框架：从零实现一个 Mocha

前言什么是自动化测试自动化测试在很多团队中都是Devops环节中很难执行起来的一个环节，主要原因在于测试代码的编写工作很难抽象，99%的场景都需要和业务强绑定，而且写测试代码的编写工作量往往比编写实际业务代码的工作量更多。在一些很多业务场景中投入产出比很低，适合写自动化测试的应该是那些中长期业务以及一些诸如组件一样的基础库。自动化测试是个比较大的概念，其中分类也比较多，比如单元测试，端对端测试，集

云原生

ELK实现containerd的容器日志采集展示【基于logging的全栈监测】

企业级ELK Stack构建介绍

云原生

(20200916 Solved)docker-compose up创建容器自动退出

问题描述如题，创建容器后自动退出了。并且docker start container无效解决方案原因是缺失了控制终端的配置，需要在docker-compose.yml中增加tty:true ，有时候这样也不行，需要再增加一个command:/bin/bash，命令不一定是这个，需要是一个不会退出的命令，然后用-d后台启动容器。Referencesdocker-compose启动容器后自动退出...