logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

用spark-submit将py提交到yarn时警告Neither spark.yarn.jars nor spark.yarn.archive is set

意思是spark无法找到要在YARN集群上执行任务所需的JAR包或归档文件。它会尝试从SPARK_HOME目录上传所需的库文件,所以会卡在这里一段时间。意思是将$SPARK_HOME/jars/里的文件全部打包为当前目录的spark-libs.jar。然后再到$SPARK_HOME/conf/spark-env.sh中添加。到SPARK_HOME中找到jars文件夹,将它们打包。用spark-su

#spark
ubuntu配置hadoop,HDFS和YARN(单机)

vim workers后,里面默认只有一个localhost,可以按照需求填写节点主机的ip,这里不做修改。创建软连接hadoop后cd进去,进入hadoop/etc/hadoop下,修改文件配置。vim打开hadoop-env.sh后添加以下内容,这里JAVA_HOME注意别填错了。执行start-dfs.sh可以打开9870端口进入webui就代表成功了。下载hadoop,用清华镜像下载很快,

文章图片
#ubuntu#hadoop#linux +3
到底了