Spark专栏_大数据技术专区

Spark

基于内存计算的大数据处理引擎，支持批处理、流处理和机器学习等多种计算模式

10篇内容

Spark SQL数据源：Hive表

将该文件数据导入表student1中，执行命令：spark.sql(“LOAD DATA INPATH ‘hdfs://master:9000/student/input/student.txt’ INTO TABLE student1”)将数据帧数据写入hive表，执行命令：studentDf.select(“name”, “age”).write.mode(SaveMode.Overwrite

2099 

梁辰兴 · 2023-06-14 15:38:27

SparkSQL列数量比较多引发的Too many arguments in method signature in class file问题

也可能我的命名太长了，但是感觉很难超过64KB，需要打印相关的解析参数才可以确定，但是基本上可以确定的是参数数量较多导致的。这个错误一般是由于 JVM 的方法参数限制所导致的。JVM 对于方法的参数数量有一定的限制，通常情况下，方法的参数数量不应该超过 255 个。如果你的代码中包含了过多的参数，可以考虑将一部分参数合并为一个对象，或者使用 Spark 的 Tuple 类型来代替。我的程序并没有超

1471 

子安 · 2023-05-25 18:30:09

大数据编程实验三：SparkSQL编程

大数据编程实验，学习有关SparkSQL的基础操作以及编程实现将RDD转换为DataFrame和利用DataFrame读写MySQL的数据的方法。

1.3w 

41 

-北天- · 2022-11-12 12:36:09

第一部分：Spark基础篇

Spark基础篇包含：job运行流程、任务提交阶段、运行原理、与MR的区别、RDD、DAG、算子类等知识点

7337 

奔跑者-辉 · 2022-09-05 18:02:44

Spark框架

Spark 框架模块包含：Spark Core、 Spark SQL、 Spark Streaming、 Spark GraphX、 Spark MLlib，而后四项的能力都是建立在核心引擎之上。【Spark Core】：Spark的核心，Spark核心功能均由Spark Core模块提供，是Spark运行的基础。Spark Core以RDD为数据抽象，提供Python、Java、Scala、R语

3200 

万里长江横渡 · 2022-07-12 20:51:19

Centos7上安装配置Spark

该文章主要是描述单机版Spark的简单安装，版本为 spark-3.1.3-bin-hadoop3.2.tgz1、Spark 下载、解压、安装Spark官方网站： Apache Spark™ - Unified Engine for large-scale data analyticsSpark下载地址：Index of /dist/sparktar -zxvf spark-3.1.3-bin-h

7119 

ykqidev · 2022-04-20 17:19:22

Spark集群搭建

spar搭建简单易学

2252 

二手Java程序员 · 2022-04-16 13:28:10

Spark端口

一、4040端口spark任务运行后，会将Driver所在机器绑定到4040端口，提供当前任务的监控页面。此端口号默认为4040，展示信息如下：调度器阶段和任务列表RDD大小和内存使用情况环境信息正在运行的executors的信息演示如下：通过spark的java接口启动sparkSparkConf sc = new SparkConf(); // 创建一个SpakrConf对象用于配置Spark

5559 

tangfatter · 2021-12-23 16:20:53

Spark初识-什么是Spark

Spark是一个基于内存的开源计算框架，于2009年诞生于加州大学伯克利分校AMPLab（AMP：Algorithms，Machines，People），它最初属于伯克利大学的研究性项目，后来在2010年正式开源，并于 2013 年成为了 Apache 基金项目，到2014年便成为 Apache 基金的顶级项目，该项目整个发展历程刚过六年时间，但其发展速度非常惊人。正由于Spark来自于大学，其整

7768 

栗筝i · 2020-12-17 09:42:01

Spark Shell 的使用

前言前一章中我们介绍了Spark的Standalone模式的安装. 本章我们介绍下Spark Shell操作窗口的基本的安装.基本启动与使用基本启动与使用本地启动进入./bin目录, 使用spark-shell即可启动.localhost:bin Sean$ spark-shellPicked up JAVA_TOOL_OPTIONS: -Dfile.encoding=UT...

1.6w 

在风中的意志 · 2019-03-30 15:32:56