咸鱼翻身记个人主页

@asd315861547

咸鱼翻身记

2024-08-24 10:45:08 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Spark on Yarn集群高可用搭建

软件环境:linux系统: CentOS6.7Hadoop版本: 2.6.5zookeeper版本: 3.4.8主机配置:一共m1, m2, m3这五部机, 每部主机的用户名都为centos192.168.179.201: m1192.168.179.202: m2192.168.179.203: m3 m1: Zookeeper, Namenode, DataNode, Resourc

#spark #yarn #大数据 +1

Hive扩展功能(九)--Hive的行级更新操作(Update)

软件环境:linux系统: CentOS6.7Hadoop版本: 2.6.5zookeeper版本: 3.4.8主机配置:一共m1, m2, m3这三部机, 每部主机的用户名都为centos192.168.179.201: m1192.168.179.202: m2192.168.179.203: m3 m1: Zookeeper, Namenode, DataNode, Resourc

#hive #云计算

搭建Spark所遇过的坑

一.经验1.Spark Streaming包含三种计算模式：nonstate .stateful .window2.kafka可通过配置文件使用自带的zookeeper集群3.Spark一切操作归根结底是对RDD的操作4.部署Spark任务，不用拷贝整个架包，只需拷贝被修改的文件，然后在目标服务器上编译打包。5.kafka的log.dirs不要设置成/tmp下的目录，貌似tmp目录有文件数和磁盘容

#spark #大数据 #云计算

到底了