logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Spark(林子雨慕课课程)

Spark最初由美国加州伯克利大学 ( UC Berkeley )的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序2013年Spark加入Apache孵化器项目后发展迅猛,如今己成为Apache软件基金会最重要的三大分布式计算系统开源项目之一 ( Hadoop、Spark、 Storm )运行速度快:使用DAG执行引擎以支持循环数据流与

文章图片
#spark#大数据#分布式
云服务器搭建Spark集群

参数 3 含义:指定保存 Application 历史记录的个数,如果超过这个值,旧的应用程序信息将被删除,这个是内存中的应用数,而不是页面上显示的应用数。需要注意的是,增加保留的应用程序数量将会增加 Spark 历史服务器的磁盘和内存使用量,因为它需要存储更多的元数据和日志信息。因此,在增加这个值时,你需要确保你的系统有足够的资源来支持这么做。参数 3 含义:指定保存 Application 历

#服务器#spark
Kafka常用命令行命令

kafka常用的命令行命令

#kafka#java#大数据
到底了