logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

SparkRDD算子(二)(键值对聚合操作 combineByKey)

Spark RDD算子 键值对聚合操作 combineByKeycombineByKeyScala版本java版本combineByKey聚合数据一般在集中式数据比较方便,如果涉及到分布式的数据集,该如何去实现呢。这里介绍一下combineByKey, 这个是各种聚集操作的鼻祖,应该要好好了解一下,参考scala API简要介绍def combineByKey[C](createCombiner:

#spark
Linux虚拟机扩容磁盘详细教程

最近在VMware虚拟机上使用Centos,用着用着,发现虚拟机的磁盘空间不够了。通过以下步骤成功扩展了根目录的磁盘空间1、Centos 关机,选择编辑虚拟机设置,硬盘,在实用工具那里选择“扩展”填写扩展的磁盘容量点击扩展后,VMware会提示磁盘已成功扩展。您必须从客户机操作系统内部对磁盘重新进行分区和扩展文件系统。也就是说,这里扩展的磁盘空间,在操作系统里面还不可用,还没生效,需要在操作系统里

#linux
暂无文章信息