logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Doris【数据模型】

在 Doris 中,数据以表(Table)的形式进行逻辑上的描述。一张表包括行(Row)和列(Column)。Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。Column 可以分为两大类:Key 和 Value。从业务角度看,Key 和 Value 可以分别对应维度列和指标列。

文章图片
#java#前端#linux
数据域VS主题域

数据域和主题域是数据仓库中两个重要的概念,他们在数据仓库建设和数据分析中扮演着不同的角色,两者有着明显的区别。总结:建设数仓就像饭店做菜一样,数据域如同厨房根据采购的食材特点将他们摆放在不同货架区,如肉区、蔬菜区、水果区、调味区等。主题域如同饭店根据不同食客群体的口味需求将食材做成不同的菜系,如鲁菜、川菜等。

文章图片
#大数据
OLTP、OLAP与HTAP、HSAP详解

HTAP、HSAP是OLAP与OLTP综合需求驱动下的新的数据库系统,既满足事务处理,又满足大规模分析查询,并且是基于一套系统下实现。

文章图片
#数据仓库#大数据
数据仓库【模型好坏】

数据仓库的好坏分为内部评价标准和外部评价标准。数据仓库既不能闭门造车,也不能完全跟着业务需求走,好的数据仓库模型一定是将数仓模型跟业务需求很好的兼容结合,适合我们自己的才是最好的。

文章图片
#数据仓库#大数据
数据仓库【开发流程】

本文重在梳理数据开发的整体流程,以及每个环节需要注意的点,有啥不足之处,希望大家多多提意见,多多交流~

文章图片
#数据仓库#大数据
CDA-LevelⅡ【数据分析模型】

解释性建模:理解模型中的关键因素和变量之间的互相作用。解释性建模的目标是创建一个能够清楚的解释模型的结果和结论的模型,以便可以帮助人们更好的解释数据和现象。聚类方法的基本逻辑是将数据集中的对象划分成多个类别或簇,使得同一类内的对象相似度尽可能高,不同类间的对象相似度尽可能低。需要注意的是,PCA是一种基于样本协方差矩阵的无监督学习方法,因此对数据的可信度和有效性有一定要求。残差期望为0(无内生性)

文章图片
#数据分析#机器学习#数据挖掘
数据仓库【数据治理】

数据治理是要贯穿整个数据仓库的设计开发全流程的,数据治理也不是能一步到位的,在我们不断对业务了解、数据了解、需求了解后,不断的优化迭代,设计开发出适合自己业务的数据仓库才是最好的。数据治理是一个不断雕刻的过程,有点类似代码重构,只有不断的将数据跟业务融合,才能不断的提升数据服务,体现数据仓库价值。

文章图片
#数据仓库#大数据#数据库开发
到底了