
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
hadoop2.7.7+spark2.4.3+idea2020.1.4——搭建完全分布式集群+实现wordcount(MR和Spark本地及打jar包)-2022-12-18
hadoop2.7.7+spark2.4.3+idea2020.1.4搭建完全分布式集群,实现MR和Spark(基于scala)的简单使用,即以wordcount为例。可以作为初学MR分析和Spark分析的入门练习。
pyspark学习笔记:spark-local和spark on yarn的简单实现-2022年12月30日
本学习笔记提供spark+python的local和yarn两种部署模式的讲解及使用示例。spark-local仅用1台虚拟机。spark on yarn仅需1台安装spark(用于任务提交yarn)的虚拟机,全部虚拟机需要配好hadoop完全分布式集群及python环境。
到底了







