logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

hadoop完全分布式+hive+sqoop+hbase+spark+zookeeper

hadoop2.7 完全分布式部署教程hadoop 2.7 + hive 安装部署hive2 的安装部署sqoop 工具的安装spark集群的安装hbase集群部署

#hadoop#hive#大数据 +2
Spark 3.0.3 伪分布式

1、spark 概述Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎Spark Core中提供了Spark的最基础的与最核心的功能Spark SQL是Spark用来操作结构化数据的组件Spark Streaming是Spark平台上针对实时数据进行流式计算的APISpark MLib 是Spark提供一个机器学习算法库Spark GraphX 是spark面向图计算提供的框架与算法

#spark#scala#big data
到底了