2401_82463165 个人主页

@2401_82463165

2401_82463165

2024-12-11 16:02:05 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Spark

Shuffle指的是集群范围内跨节点、跨进程的数据分发。之前学的几个算子比如map，filter，mapPartition，flatmap都是用于RDD内部的数据转换，不会引入Shuffle计算而groupByKey，sortByKey，reduceByKey，aggregateByKey都会引入Shuffle计算，并且这些算子只可以作用在paired（KV）RDD上。这是最核心的瓶颈。Map 端

#spark #ajax #大数据

机器学习基础

#机器学习 #人工智能

到底了