简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
hadoop完全分布式+hive+sqoop+hbase+spark+zookeeper
hadoop2.7 完全分布式部署教程hadoop 2.7 + hive 安装部署hive2 的安装部署sqoop 工具的安装spark集群的安装hbase集群部署
Spark 3.0.3 伪分布式
1、spark 概述Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎Spark Core中提供了Spark的最基础的与最核心的功能Spark SQL是Spark用来操作结构化数据的组件Spark Streaming是Spark平台上针对实时数据进行流式计算的APISpark MLib 是Spark提供一个机器学习算法库Spark GraphX 是spark面向图计算提供的框架与算法
到底了