Windows下PyCharm远程连接Spark

我这里的spark部署在虚拟机内，使用的版本为：python3.8hadoop3.3spark3.2java8为了防止报错，在windows环境我也安装了python3.8和虚拟机同步此时linux集群已经部署好了spark环境1、配置Hadoop DLL在编写spark时可能会用到hadoop的一些功能，所以需要配置hadoop的运行环境文件可以在github上下载，https://github

UserOrz

3756人浏览 · 2022-03-03 19:38:36

UserOrz · 2022-03-03 19:38:36 发布

我这里的spark部署在虚拟机内，使用的版本为：

	python3.8
	hadoop3.3
	spark3.2
	java8

为了防止报错，在windows环境我也安装了python3.8和虚拟机同步
此时linux集群已经部署好了spark环境

1、配置Hadoop DLL

在编写spark时可能会用到hadoop的一些功能，所以需要配置hadoop的运行环境

文件可以在github上下载，https://github.com/cdarlint/winutils

因为没有对应的hadoop版本，我用的是对应hadoop3.1的文件，目前没有发现问题

在这里插入图片描述
下载完成后将bin目录的hadoop.dll文件复制进C盘的System32下

配置完成后，需要加上环境变量

变量名为HADOOP_HOME
变量值为 apache-hadoop-3.1.1-winutils-master文件的位置

在这里插入图片描述

2、下载pyspark库

本机的python版本最好和虚拟机保持一致，以免出现问题
可以使用anaconda创建虚拟环境

pip install pyspark

3、配置pycharm

3.1新建python工程，配置解释器

解释器选择之前创建的虚拟环境下的python.exe 在这里插入图片描述

3.2远程连接linux的python解释器

点击pycharm左上角的File -> Settings，找到Python Interpreter
点击右上角的齿轮，选择add增加解释器
在这里插入图片描述

进入后选择SSH，填入主机名和用户名，点击next

因为linux我使用的也是anaconda安装python，且anaconda的所有者是用户user，所以我这里填的是user
在这里插入图片描述
然后填入登录密码

然后填入linux下的python的位置，点击finish

在这里插入图片描述

完成后可以在pycharm的右下角选择解释器
在这里插入图片描述

4、一些环境变量

为了确保spark在运行时少出现问题，需要在windows配置一些环境变量

因为Spark程序是运行在JVM基础之上的，所以需要配置JAVA_HOME
在这里插入图片描述

PYSPARK_PYTHON指向python的解释器，这是为了本地模式能运行spark程序
在这里插入图片描述

Linux

更多推荐

Linux虚拟文件系统之文件系统卸载（sys_umount())

Linux中卸载文件系统由umount系统调用实现，入口函数为sys_umount()。较于文件系统的安装较为简单，下面是具体的实现。1. /*sys_umont系统调用*/2. SYSCALL_DEFINE2(umount, char __user *, name, int, flags)3. {4.struct path path;

Linux

网卡速率和双工模式的配置

http://linux.chinaitlab.com/system/792187.html1、mii-tool 配置网络设备协商方式的工具； 1.1 mii-tool 介绍； mii-tool - view, manipulate media-independent interface status （mii-tool 是查看，管理介质的网络接口的状态）

Linux

Linux系统下超级终端Minicom的使用方法（例如：连接交换机，路由器等）转http://baike.baidu.com/view/2911642.htm?fr=ala0_1

Linux系统下超级终端Minicom的使用方法 　　Linux下的Minicom的功能与下的超级终端功能相似，适于在通过超级终端对设备的管理以及对嵌入操作系统的升级，现写出Minicom的使用手册： 　　1．启动minicom 　　以root权限登录系统 　　使用命令 　　minicom –s 则minicom启动，屏

Linux

所有评论(0)

查看更多评论

UserOrz

@jdsaiasodh

已为社区贡献1条内容