
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Spark基础知识
Spark是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序。Hadoop虽然已经称为大数据技术的事实标准,但其本身还存在诸多缺陷,最主要的缺陷是MapReduce计算模型延迟高,无法胜任实时、快速计算的需求,因而只适用于离线批处理的应用场景。:Spark在借鉴了Hadoop MapReduce优点的同时,解决了MapReduce所面临的缺陷。相比于MapReduce,
到底了







