logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Spark on Yarn集群高可用搭建

软件环境:linux系统: CentOS6.7Hadoop版本: 2.6.5zookeeper版本: 3.4.8主机配置:一共m1, m2, m3这五部机, 每部主机的用户名都为centos192.168.179.201: m1192.168.179.202: m2192.168.179.203: m3 m1: Zookeeper, Namenode, DataNode, Resourc

#spark#yarn#大数据 +1
Hive扩展功能(九)--Hive的行级更新操作(Update)

软件环境:linux系统: CentOS6.7Hadoop版本: 2.6.5zookeeper版本: 3.4.8主机配置:一共m1, m2, m3这三部机, 每部主机的用户名都为centos192.168.179.201: m1192.168.179.202: m2192.168.179.203: m3 m1: Zookeeper, Namenode, DataNode, Resourc

#hive#云计算
搭建Spark所遇过的坑

一.经验1.Spark Streaming包含三种计算模式:nonstate .stateful .window2.kafka可通过配置文件使用自带的zookeeper集群3.Spark一切操作归根结底是对RDD的操作4.部署Spark任务,不用拷贝整个架包,只需拷贝被修改的文件,然后在目标服务器上编译打包。5.kafka的log.dirs不要设置成/tmp下的目录,貌似tmp目录有文件数和磁盘容

#spark#大数据#云计算
到底了