我都记得撒泼个人主页

@m0_63500252

我都记得撒泼

2022-11-26 21:10:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

用spark-submit将py提交到yarn时警告Neither spark.yarn.jars nor spark.yarn.archive is set

意思是spark无法找到要在YARN集群上执行任务所需的JAR包或归档文件。它会尝试从SPARK_HOME目录上传所需的库文件，所以会卡在这里一段时间。意思是将$SPARK_HOME/jars/里的文件全部打包为当前目录的spark-libs.jar。然后再到$SPARK_HOME/conf/spark-env.sh中添加。到SPARK_HOME中找到jars文件夹，将它们打包。用spark-su

#spark

ubuntu配置hadoop，HDFS和YARN（单机）

vim workers后，里面默认只有一个localhost，可以按照需求填写节点主机的ip，这里不做修改。创建软连接hadoop后cd进去，进入hadoop/etc/hadoop下，修改文件配置。vim打开hadoop-env.sh后添加以下内容，这里JAVA_HOME注意别填错了。执行start-dfs.sh可以打开9870端口进入webui就代表成功了。下载hadoop，用清华镜像下载很快，

#ubuntu #hadoop #linux +3

到底了