logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

sparkSQL的三种join(broadcast join、shuffle hash join和sort merge join)以及AE

每天一个小例子:spark中,1.left semi join (左半连接)的意思就是,JOIN 子句中右边的表只能在 ON 子句中设置过滤条件,右表中有重复的数据会自动跳过,具体详见:https://blog.csdn.net/happyrocking/article/details/798850712. left anti join含义:left anti join 是 not in/not

文章图片
#spark#大数据
py4j.protocol.Py4JJavaError: An error occurred while calling None.org.apache.spark.api.java.JavaSpar

py4j.protocol.Py4JJavaError: An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext.: java.io.FileNotFoundException: File file:/Users/didi/Desktop/IdeaProjects/spark_learn/log

#scala#spark
MySQL基础

DDL操作delete from table where 条件;truncate table table;区别:1.delete可以加条件2.truncate删除,整个表一起删了,然后建一张空表,效率高一些,delete是一条数据一条数据删除的3.假如要删除的表中有自增的长列,如果用delete删除,再插入数据,自增长列的值从**断点(比如上次从id为5的删除,则下次新增就从id就从6开始)**开

文章图片
#mysql#数据库#sql
到底了