
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、简介Apache Kylin™是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay 开发并贡献至开源社区。之所以说它是国人之光,是因为它是首个由国人主导的Apache顶级开源项目,能在亚秒内查询巨大的表。二、基本概念先了解一下几个概念,如下有一张表查询某个客户在哪个时间进行某种交易的金额,这种
视图可以理解为一张表或多张表的预计算,这些表称为基表。它可以将所需要查询的结果封装成一张虚拟表,基于它创建时指定的查询语句返回的结果集。视图具有以下特点:例如:物化视图对于普通视图而言,其真实数据在基表中,即每次查询视图都是需要执行查询语句。有时候为了防止每次都查询,将结果集存储起来,这种有真实数据的视图,称为物化视图。什么情况下适合用物化视图?基表没有很多 DML,且每次查询都需要耗费较大资源的

一、简介Apache Kylin™是一个开源的、分布式的分析型数据仓库,提供Hadoop/Spark 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由 eBay 开发并贡献至开源社区。之所以说它是国人之光,是因为它是首个由国人主导的Apache顶级开源项目,能在亚秒内查询巨大的表。二、基本概念先了解一下几个概念,如下有一张表查询某个客户在哪个时间进行某种交易的金额,这种
JVM(Java Virtual Machine)是一个可以执行 Java 字节码文件(即 .class 文件)的虚拟机进程。当 Java 源文件能被成功编译成 .class 文件,就能在不同平台上的不同版本的 JVM 运行,因为 JVM 能将相同的 .class 文件解释称不同平台的机器码。正是因为 JVM 的存在,Java 被称为与平台无关的语言。一般而言,.java 文件经过编译后会得到 .

让你熟练掌握Kafka生产者

初始消息中间件及Kafka
按照度娘的解释:“拉链表是一种针对数据仓库设计中表存储数据的方式而定义的数据模型,它有点类似于快照,用于维护历史状态及最新状态数据。假如有张表如表1-1所示,每天的数据量大概有50w表中有些字段会被 update,如表1-2,且每天更新的数据量很小,大约只有5k有些报表需要查看历史某个日期的数据存储空间有限,需要尽可能的节约存储空间你会怎么将其装入数仓中?

记录系统架构设计师考试,分享考试经验








