
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
大数据如何找中位数,TopN,大体思路(通用)。
文章目录1.从10亿个数据(int型占据4B)中找中位数,内存限制为1GB2.从10亿数中选取前1000大的数字从10亿个数据(int型占据4B)中找中位数,内存限制为1GB不可能一次性把数据全部加载到内存中,再使用快速排序算法,因为10亿*4B大约为4GB,内存不够可以一次性读入1GB的数据(分10次读取),然后对读入的1GB数据按照最高位即第32位的值进行分类并写入文件,如果最高位是...
到底了







