logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据倾斜的原因及解决方案

数据倾斜数据倾斜定义数据倾斜表现数据倾斜原因数据倾斜解决方案1、group by导致数据倾斜2、count(distinct)特殊值较多3、join操作4、空值或数据类型不一致所致5、优化in/exists6、排序选择数据倾斜定义定义:对于集群系统,一般缓存是分布式的,即不同节点负责一定范围的缓存数据。我们把缓存数据分散度不够,导致大量的缓存数据集中到了一台或者几台服务节点上,称为数据倾斜。一般来

#大数据#数据仓库
暂无文章信息