Spark通过JDBC操作数据库

Spark应用程序支持通过JDBC方式连接MySQL数据库并且读取或者保存数据。

高过蓝天的云

644人浏览 · 2023-05-18 12:38:13

高过蓝天的云 · 2023-05-18 12:38:13 发布

Spark应用程序支持通过JDBC方式连接MySQL数据库并且读取或者保存数据。

1. 驱动报错

如果 spark/jars 目录下没有MySQL的连接驱动会报下面错误：
在这里插入图片描述
解决方法：

cp /export/software/mysql-connector-java-8.0.13.jar /export/server/spark/jars    # 将驱动拷贝到spark安装目录
cd /export/server/spark/bin/
./pyspark --jars /export/server/spark/jars/mysql-connector-java-8.0.13.jar --driver-class-path /export/server/spark/jars/mysql-connector-java-8.0.13.jar    # 启动时添加jars和driver参数

2. 从数据库读数据

spark.read.format("jdbc").\
    option("url", "jdbc:mysql://Master:3306/bigdata").\
    option("dbtable", "province_total_sale").\
    option("user", "root").\
    option("password", "root").\
    load()

3. 保存数据到数据库

方式1:

perp = {}
perp["user"]="root"
perp["password"]="root"
province_sale_df.write.jdbc("jdbc:mysql://Master:3306/bigdata?useSSL=false&useUnicode=true&characterEncoding=utf8&createDatabaseIfNotExist=true", "province_total_sale", "overwrite", perp)

方式2:

province_sale_df.write.mode("overwrite").format("jdbc").\
        option("url", "jdbc:mysql://Master:3306/bigdata?useSSL=false&useUnicode=true&characterEncoding=utf8").\
        option("dbtable", "province_total_sale").\
        option("user", "root").\
        option("password", "root").\
        option("encoding", "utf-8").\
        save()

4. 保存到Hive的数据仓库中

province_sale_df.write.mode("overwrite").saveAsTable("default.province_total_sale", "parquet")			# default库的province_total_sale表

亚马逊云科技技术品牌专区

更多推荐

STM32节点移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）

STM32移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）前言前言在移植协议之前，先给大家科普一下Lora 和 lorawan 的区别。LoRa 是LPWAN通信技术中的一种，是美国Semtech公司采用和推广的一种基于扩频技术的超远距离无线传输方案。这一方案改变了以往关于传输距离与功耗的折衷考虑方式为用户提供一种简单的能实现远距离、长电池寿命、大容量的系统，进而扩...

亚马逊云科技技术品牌专区

物联网主机E6000引领工业自动化的新篇章

亚马逊云科技技术品牌专区

搞 IoT 物联网，你居然要懂这么多种协议...

物联网协议是指在物联网环境中用于设备间通信和数据传输的协议。根据不同的作用，物联网协议可分为传输协议、通信协议和行业协议。传输协议：一般负责子网内设备间的组网及通信。例如 Wi-Fi、Ethernet、NFC、 Zigbee、Bluetooth、GPRS、3G/4G/5G等。这些协议能够确保在网络上传输的数据的安全性和可靠性。通讯协议：主要是运行在传统互联网TCP/IP协议之上的设备通讯协议，负责