logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

hadoop3.x伪分布式搭建,在启动HDFS时出现Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).

启动HDFS时出现错误:Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 翻译:许可被拒绝。解决方案: 创建秘钥ssh-keygen -t rsacat id_rsa.pub >> authorized_keys

#hdfs#分布式#hadoop
spark案例:Top10 热门品类

数据格式:数据文件中每行数据采用下划线分隔数据每一行数据表示用户的一次行为,这个行为只能是 4 种行为的一种如果搜索关键字为 null,表示数据不是搜索数据如果点击的品类 ID 和产品 ID 为-1,表示数据不是点击数据针对于下单行为,一次可以下单多个商品,所以品类 ID 和产品 ID 可以是多个,id 之 间采用逗号分隔,如果本次不是下单行为,则数据采用 null 表示支付行为和下单行为类似需求

#spark#学习
spark实现wordcount

创建spark上下文环境def main(args: Array[String]): Unit = {val sc = new SparkContext(new SparkConf().setMaster("local[*]").setAppName("wc"))val rdd: RDD[String] = sc.makeRDD(List("spark hello", "hive", "hadoo

#spark
zookeeper伪分布集群的搭建

1,准备一台Linux系统的虚拟机2,下载zookeeper安装包下载链接:Index of /dist/zookeeper3,上传到虚拟机上并进行解压tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz -C 你指定的位置为方便识别,可以重命名mv apache-zookeeper-3.5.7-bin/ zookeeper-3.5.74,配置文件进入conf目录

#zookeeper#linux#分布式
spark实现wordcount

创建spark上下文环境def main(args: Array[String]): Unit = {val sc = new SparkContext(new SparkConf().setMaster("local[*]").setAppName("wc"))val rdd: RDD[String] = sc.makeRDD(List("spark hello", "hive", "hadoo

#spark
到底了