一、准备:项目前期已经配置好VMware虚拟机以及Ubuntu16.04

        项目前期的准备工作可以参照博客:ETL学习-前期准备

二、需要配置JAVA环境:

        参照文章:Ubuntu配置JAVA环境

三、安装和配置Tomcat:

        Tomcat是由Apache软件基金会属下Jakarta项目开发的Servlet容器,按照Sun Microsystems提供的技术规范,实现了对Servlet和JavaServer Page的支持,并提供了作为Web服务器的一些特有功能,如Tomcat管理和控制平台、安全局管理和Tomcat阀等。

        参照文章:Ubuntu16.04下安装和配置Tomcat

四、Nginx

        Nginx是一个高性能的HTTP和反向代理服务器,特点是占用内存少,并发能力强。

        安装和配置参照:Nginx Linux详细安装部署教程

        学习教程:Nginx学习手册Nginx极简教程

五、Nginx搭配Tomcat

        Nginx搭配Tomcat实现负载均衡

六、Hadoop

        Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。(VMware开启多个虚拟机

        安装和配置参照:VMware + Ubuntu18.04 搭建Hadoop集群环境的图文教程

        学习教程:Hadoop教程(菜鸟教程)

七、zookeeper

        zookeeper的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原语集,并以一系列简单易用的接口提供给用户使用。

        安装和配置参照:伪集群模式搭建(在一台物理机上运行多个zookeeper实例)

                                     集群模式搭建(所有的zookeeper运行于一个集群上,适合生产环境)

                                     单例模式(zookeeper只运行在一台服务器上,适合测试环境)

                                     三种搭建模式

        学习教程:zookeeper学习zookeeper教程(菜鸟教程)

补充:Linux教程Linux命令大全(手册)

以上内容均基于本人基于尚学堂2021大数据最新课程安排,对应学习路线找到的技术博客,希望能帮助大家节约一点时间。

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐