logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

最详细数据仓库项目实现:从0到1的电商数仓建设(数仓部分)

其中业务总线矩阵,就像是一个分析的笔记.后面还会有各个属性值和度量值的统计等// 见讲义中第四个讲义数仓的第5章。

文章图片
#数据仓库#大数据#kafka +3
最详细数据仓库项目实现:从0到1的电商数仓建设(数仓部分)

其中业务总线矩阵,就像是一个分析的笔记.后面还会有各个属性值和度量值的统计等// 见讲义中第四个讲义数仓的第5章。

文章图片
#数据仓库#大数据#kafka +3
历史最全大数据开发面试攻略【吐血整理32w+字,260+页】

暑期实习、秋招一路走来,踩过不少坑,比如,刚开始在选择岗位时,明确大数据开发后,迷茫如何学习大数据的时候。太多的组件框架、太多的源码分析、太多的架构和知识点。离线、实时、数据治理、数据倾斜、小文件、内存管理等等,不知道如何下手。还有在找工作的时候,不知道如何做好充分的准备,不知道如何应对面试问答,如何发挥个人正常水平等等问题。接下来我主要介绍大数据开发的学习路线,以及八股文总结相关内容,总的来说就

最详细数据仓库项目实现:从0到1的电商数仓建设(采集部分)

行为数据(行为日志)业务数据(MySQL)这两类数据,都是通过模拟数据的程序生成,通过脚本文件执行lg.sh,模拟生成行为日志数据和业务数据。日志数据生成后直接写入/opt/module/applog/log目录下,而业务数据是在下载配置好MySQL后创建名为gmall的数据库,直接将业务数据通过jdbc远程连接,写入数据库中对应的表中。

文章图片
#数据仓库#flume#kafka +3
最详细数据仓库项目实现:从0到1的电商数仓建设(数仓部分)

其中业务总线矩阵,就像是一个分析的笔记.后面还会有各个属性值和度量值的统计等// 见讲义中第四个讲义数仓的第5章。

文章图片
#数据仓库#大数据#kafka +3
Linux笔记

也有简单一些的方法,就是借助工具​通常在工作过程中,公司中使用的真实服务器或者是云服务器,都不允许除运维人员之外的员工直接接触,因此就需要通过远程登录的方式来操作。所以,远程登录工具就是必不可缺的,目前,比较主流的有 Xshell, SSH Secure Shell, SecureCRT,FinalShell 等,同学们可以根据自己的习惯自行选择.然后配置里面的用户身份,就是虚拟机的用户名和密码想

文章图片
#linux
Kafka总结文档

/主要见讲义第21-23页1、定义类实现 Partitioner 接口。2、重写 partition()方法。代码中实际完成的就是重写partition方法中的几个步骤:获取消息,将参数的value值变成tostring然后根据需求,去分析value,然后返回不同情况返回不同的partition值最后将这个类的全类名,放在生产者的代码中,添加一个参数// 添加自定义分区器。

文章图片
#kafka#分布式#学习
到底了