logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Spark----RDD(弹性分布式数据集)

RDD,RDD是什么?为么需要RDD?,RDD的五大属性,WordCount中的RDD的五大属性,如何创建RDD?RDD的操作,基本算子/操作/方法/API,分区操作,重分区操作,聚合操作,四个有key函数的`区别`,关联操作,排序操作,RDD的缓存/持久化,cache和persist,checkpoint检查点,共享变量,Shuffle本质

文章图片
#spark#分布式#大数据 +1
到底了