简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据仓库系列文章数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系数据仓库之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓—ID Mapping数仓—OneID数仓—AARRR海盗模型数仓—总线矩阵数仓—数据安全数仓—数据质量数仓—数仓建模和业务建模什么是CDC?CDC是(Change Data Capture 变更数据获取)的简称。核
R语言解释器自带有一些系统包,对于大多数人来说够用了,但是这些基础包通常不能满足我们的需要,这时候就需要从互联网下载一些第三方或者官方包以满足我们的需要。不光是R语言,包...
在过去的十年,我们对存储和管理数据的方式发生了很大的变化,并从ETL模式逐渐转向ELT,然而,小编认为这并不会是终点;未来极有可能会向EL(T)发展,也就是EL和T进行完全解耦。当然这只是...
在本文中,我们将深入研究ClickHouse索引。我们将对此进行详细说明和讨论:ClickHouse的索引与传统的关系数据库有何不同ClickHouse是怎样构建和使用主键稀疏索引的ClickHouse索引的最佳实践这篇文章主要关注稀疏索引,clickhouse主键使用的就是稀疏索引。数据集在本文中,我们将使用一个匿名的web流量数据集。我们将使用样本数据集中的887万行(事件)的子集。未压缩的数
Manhattan图算是GWAS分析的标配图了,可参考Bio|manhattan图进行绘制。由于Manhattan点太多,后期AI/PS修改的话难度有点大,如果可以“个性化”绘制的话那...
作者:穆晨来源:https://www.cnblogs.com/muchen/p/5310732.html阅读目录数据分布图简介绘制基本直方图基于分组的直方图绘制密度曲线绘制基本...
1. count(1) and count(*)当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了!从执行计划来看,count(1)和count(...
记得点击"小林玩大数据,设为星标⭐前言大家好,我是林哥!2021年以来,云原生、云计算时代的趋势已经在渐渐的铺开了,这些都与 Dokcer + K8S 两个技术的盛行分不开。今天。林哥...
clickhouse目前用在实时BI后台,只要数据稳定落库了,出报表很快,临时查询也很快,在使用过程中,对它的一些优点和不足也是深有体会,这里总结一下,不能做到面面俱到,但尽可能详细的介绍实际应用需要注意的问题和应用技巧。我们是通过编写Flink程序,消费kafka数据,将数据清洗,扩充维度,然后落在clickhouse里面,半年以来,Flink程序很少出问题,数据落库也很稳定。对于clickho
1#!/usr/bin/python2#-*-coding:utf-8-*-3importjson4importurllib.request...