大数据的奇妙冒险个人主页

@weixin_43596734

大数据的奇妙冒险

2022-09-29 16:00:26 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

国人之光：大数据分析神器Apache Kylin

一、简介Apache Kylin™是一个开源的、分布式的分析型数据仓库，提供Hadoop/Spark 之上的 SQL 查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由 eBay 开发并贡献至开源社区。之所以说它是国人之光，是因为它是首个由国人主导的Apache顶级开源项目，能在亚秒内查询巨大的表。二、基本概念先了解一下几个概念，如下有一张表查询某个客户在哪个时间进行某种交易的金额，这种

#大数据 #kylin

什么是视图？普通视图和物化视图什么区别？看这一篇就明白了

视图可以理解为一张表或多张表的预计算，这些表称为基表。它可以将所需要查询的结果封装成一张虚拟表，基于它创建时指定的查询语句返回的结果集。视图具有以下特点：例如：物化视图对于普通视图而言，其真实数据在基表中，即每次查询视图都是需要执行查询语句。有时候为了防止每次都查询，将结果集存储起来，这种有真实数据的视图，称为物化视图。什么情况下适合用物化视图？基表没有很多 DML，且每次查询都需要耗费较大资源的

#数据库 #database #oracle

国人之光：大数据分析神器Apache Kylin

#大数据 #kylin

JVM 之类加载器

JVM（Java Virtual Machine）是一个可以执行 Java 字节码文件（即 .class 文件）的虚拟机进程。当 Java 源文件能被成功编译成 .class 文件，就能在不同平台上的不同版本的 JVM 运行，因为 JVM 能将相同的 .class 文件解释称不同平台的机器码。正是因为 JVM 的存在，Java 被称为与平台无关的语言。一般而言，.java 文件经过编译后会得到 .

#java #经验分享 #程序人生

Kafka从入门到放弃(二) —— 生产者

让你熟练掌握Kafka生产者

#kafka #java #分布式 +1

Kafka从入门到放弃(一) —— 初识Kafka

初始消息中间件及Kafka

#大数据 #kafka #分布式

通俗易懂：什么是拉链表

按照度娘的解释：“拉链表是一种针对数据仓库设计中表存储数据的方式而定义的数据模型，它有点类似于快照，用于维护历史状态及最新状态数据。假如有张表如表1-1所示，每天的数据量大概有50w表中有些字段会被 update，如表1-2，且每天更新的数据量很小，大约只有5k有些报表需要查看历史某个日期的数据存储空间有限，需要尽可能的节约存储空间你会怎么将其装入数仓中？

#数据仓库 #数据库

2021系统架构设计师一次过，分享下经验

记录系统架构设计师考试，分享考试经验

#系统架构

到底了