logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据仓库DW、ODS、DM概念及其区别

数据仓库DW、ODS、DM概念及其区别一、整体结构在具体分析数据仓库之前先看下一下数据中心的整体架构以及数据流向数据中心整体架构DB 是现有的数据来源(也称各个系统的元数据),可以为mysql、SQLserver、文件日志等,为数据仓库提供数据来源的一般存在于现有的业务系统之中。ETL的是 Extract-Transform-Load 的缩写,用来描述将数据从来源迁移到目标...

#数据仓库
python调用shell命令之三大方法

python调用shell命令之三大方法前言: 如何直接在python代码里面直接执行终端的命令。博友博客描写叙述得非常具体,这里直接转载过来并做些凝视了。目录如下:一、os 模块1.1、os模块的exec方法1.2、os模块的system方法1.3、os模块popen方法二、commands模块2.1、commands.getstatusoutput方...

#python
日志采集系统flume和kafka有什么区别及联系,它们分别在什么时候使用,什么时候又可以结合?

日志采集系统flume和kafka有什么区别及联系,它们分别在什么时候使用,什么时候又可以结合?观点一:简言之:这两个差别很大,使用场景区别也很大。先说flume:日志采集。线上数据一般主要是落地文件或者通过socket传输给另外一个系统。这种情况下,你很难推动线上应用或服务去修改接口,直接向kafka里写数据。这时候你可能就需要flume这样的系统帮你去做传输。对于数量级别,做过单机upd的fl

Win10下python 2.7与python 3.7双环境安装教程

Win10下python 2.7与python 3.7双环境安装教程1、python软件下载网址:https://www.python.org/downloads/windows/2、 安装python2.7.16第一步双击安装包,选择你要安装的路径第二步默认next,这里不能配置环境变量,只能安装好后手动配。点击finish安装完成。这样python2和...

前向传播算法(Forward propagation)与反向传播算法(Back propagation)以及sigmoid函数介绍

 前向传播算法(Forward propagation)与反向传播算法(Back propagation)以及sigmoid函数介绍虽然学深度学习有一段时间了,但是对于一些算法的具体实现还是模糊不清,用了很久也不是很了解。因此特意先对深度学习中的相关基础概念做一下总结。先看看前向传播算法(Forward propagation)与反向传播算法(Back propagation),sigmoid函数

#深度学习
关于mac键盘部分数字键和字母键失灵,无法使用的问题的解决方案

mac,键盘失灵——一直在mac上开发,昨天下午却遇到了部分数字键盘(7,8,9)和字母键盘(u,i,l,k,j,m)失灵的问题,被折磨了好久,终于找到了解决方案——系统偏好设置-->辅助功能-->鼠标与触控板-->把“启用鼠标键”这个按钮去掉勾选(如果被勾选的话),失灵键盘瞬间变好啦

CASE WHEN 及 SELECT CASE WHEN的用法

CASE WHEN 及 SELECT CASE WHEN的用法(1)Case具有两种格式。简单Case函数和Case搜索函数。1)、简单Case函数CASE sexWHEN '1' THEN '男'WHEN '2' THEN '女'ELSE '其他' END2)、Case搜索函数 CASE WHEN sex = '1' THEN '男' WHEN sex = '...

【数仓系列】数仓分层的意义价值及如何设计数据分层

文章目录一、前言二、数仓建模三、数仓分层四、数仓的基本特征五、数据仓库用途六、数仓分层的好处七、如何分层一、前言现在说数仓,更多的会和数据平台或者基础架构搭上,已经融合到整个基础设施的搭建上。这里呢,我们不说Hadoop各种组件之间的配合,我们就简单说下数仓分层的意义价值和该如何设计分层。二、数仓建模说到数仓建模,就得提下经典的2套理论:范式建模Inmon提出的集线器的自上而下(EDW-DM)的数

#数据仓库
Hive实现分组排序、分组求取topN或者分页的实现方法

使用到的语法:ROW_NUMBER() OVER(PARTITION BY COL1 ORDER BY COL2)简单的说row_number()从1开始,为每一条分组记录返回一个数字,这里的ROW_NUMBER() OVER (ORDER BY xlh DESC) 是先把xlh列降序,再为降序以后的每条xlh记录返回一个序号。表示根据COL1分组,在分组内部根据 COL2排序,而此函数计算的..

#hive
理解维度数据仓库——事实表、维度表、聚合表

理解维度数据仓库——事实表、维度表、聚合表一、事实表在多维数据仓库中,保存度量值的详细值或事实的表称为“事实表”。一个按照州、产品和月份划分的销售量和销售额存储的事实表有5个列,概念上与下面的示例类似。SateProductMouthUnitsDollarsW...

    共 91 条
  • 1
  • 2
  • 3
  • 10
  • 请选择