logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一、大数据基础之文件格式

文章目录大数据中常见的几种文件格式Ⅰ.TextFile文件01文件格式:02如何建表03格式评估优点:缺点:Ⅱ.SequenceFile文件01文件格式02如何建表03数据存储结构04格式评估优点:缺点:Ⅱ.Parquet文件02文件格式①字段组成:②存储分析大数据中常见的几种文件格式Ⅰ.TextFile文件01文件格式:文件存储展示为正常的文本文件,也就是我们普通的windows上的txt后缀文

数据仓库之拉链表

拉链表一、数据仓库二、拉链表原理三、拉链表实现步骤1、准备数据:2、数据加载过程:3、刷新customer_inc表数据到customer表(2017-01-02):4、刷新customer_inc表数据到customer表(2017-01-03)5、查询拉链表:今天看到了一篇讲解数仓建设之拉链表的好文。看过之后,感觉甚好。讲解的很是详细。在这里贴出来一方面是给自己留个记录,可以之后翻出来看看;另

如何解决【mac】中【Termius】中文显示乱码

按照步骤来亲测可解决①如果没有~/.zshrc这个文件,那么新建一个该文件②新建命令:touch ~/.zshrc③打开文件文件编辑vim ~/.zshrc④修改内容并保存export LANG=en_US.UTF-8⑤重启终端即可发现中文可以显示了......

文章图片
#macos
数据仓库之拉链表

拉链表一、数据仓库二、拉链表原理三、拉链表实现步骤1、准备数据:2、数据加载过程:3、刷新customer_inc表数据到customer表(2017-01-02):4、刷新customer_inc表数据到customer表(2017-01-03)5、查询拉链表:今天看到了一篇讲解数仓建设之拉链表的好文。看过之后,感觉甚好。讲解的很是详细。在这里贴出来一方面是给自己留个记录,可以之后翻出来看看;另

为什么mac设置环境变量无法生效?

MAC环境变量设置前提:解决:1、配置后不起作用2、加入export PATH后可以执行3、切换终端后无法执行4、问题解决感谢!前提:mac环境安装kafka,不想每次在kafka目录的bin下启动,而是想实现在各个目录都可以启动kafka,所以想设置kakfa为全局环境变量解决:1、配置后不起作用在~/.bash_profile文件中设置或执行命令source ~/.bash_profile发现

#kafka#java
为什么【spark】使用【org.json4s.jackson】报错

spark使用json4s包报错报错代码:报错信息:排查问题:报错代码:import org.apache.spark.ml.feature.BucketedRandomProjectionLSHimport org.apache.spark.ml.linalg.Vectorsimport org.apache.spark.sql.SparkSessionimport org.apache.spa

文章图片
#spark#big data#scala
到底了