logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

实时数仓方案五花八门,实际落地如何选型和构建

【作者介绍】王磊,阿里云 MVP,华院计算技术总监。著有:《图解 Spark 大数据快速分析实战》;《offer 来了:Java 面试核心知识点精讲(原理篇)》;《offer 来了:Java 面试核心知识点精讲(架构篇)》。编辑 | 韩楠约4,989 字 | 10 分钟阅读01文章概览(一至五)✦一、为何需要实时数仓架构二、数仓如何分层&各层用途三、数仓分层的必...

#大数据#编程语言#hadoop +2
一文探究数据仓库体系(2.7万字建议收藏)

一 什么是数据仓库1.1数据仓库概念数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它...

#数据仓库#scipy
漫谈数据仓库的分层架构与演进

作者:暮角 编辑:数据社全文共2845个字,建议5分钟阅读大家好,我是一哥,今天跟大家分享一下怎么理解建模方法和分层架构?分层架构很容易在各种书籍和文档中去理解,但是把建模方法和分层架构放在一起就会出现很多困惑了。接下来,我会从数据研发与建模的角度,演进一下分层架构的设计原因与层次的意义。01分层的演进之所以会有分层架构,最主要的原因还是要把复杂冗长的...

#大数据#人工智能#数据分析 +2
京东零售数据仓库演进之路

摘要:京东零售十年交易额快速增长的背后,不仅是京东零售高速发展的十年,也是数据仓库技术架构演进创新的十年,EB级数据如何进行资产化沉淀和治理?如何支撑业务高速发展、精细化运营、规模化创新的不同阶段?在未来更加复杂多变的环境下,将如何持续演进?作者:尹翔编辑:老鱼尹翔,京东零售数据仓库技术负责人,负责数仓体系的建设,2013年加入京东,一路伴随京东大数据的发展,在这个过程中...

#数据仓库#大数据#编程语言 +2
如何从0到1搭建大数据平台

大数据时代这个词被提出已有10年了吧,越来越多的企业已经完成了大数据平台的搭建。随着移动互联网和物联网的爆发,大数据价值在越来越多的场景中被挖掘,随着大家都在使用欧冠大数据,大数据平台的...

#大数据
大数据数仓高级面试题整理

大家好,给大家整理了一下大数据数仓高级面试题,希望大侠们能够喜欢。数仓高内聚低耦合是怎么做的定义高内聚:强调模块内部的相对独立性,要求模块内部的元素尽可能的完成一个功能,不混杂其他功能,从而使模块保持简洁,易于理解和管理。低耦合:模块之间的耦合度要尽可能的低,避免模块之间的复杂依赖,使得每个模块都可以独立存在,从而减少模块间的相互影响,提高系统的可维护性。做到低耦合、高内聚一般复杂的公共逻辑可以采

#大数据#数据仓库#数据挖掘 +2
大数据相关交流群

可以关注公众号:数据社添加微信,申请加入交流群,备注:加群qrcode_for_gh_b1e471355711_258.jpg

大模型时代下的数据治理:AI序幕拉开,垂直行业模型如何加速突破?

大家好,我是一哥,好久不发文,今天送三本书!--文末获取赠书--随着ChatGPT和其他大语言模型(LLM)的快速发展,AI已成为我们工作和生活中不可或缺的一部分,并从简单的文本生成逐渐演变成为能够处理复杂语义理解和生成的高级AI系统。这些模型的能力和应用范围的扩展,不仅标志着技术的进步,也标志着它们在实际业务中已经从辅助角色逐步走向舞台中央。01大模型的进化与升级通用大模型通常基于大量多样化的数

#人工智能
企业数字化转型设计(107页PPT)

大家好,我是一哥,给大家分享一个数字化转型的材料,长达107页!公众号回复「数字化转型」下载公众号回复「数字化转型」下载「数仓面试」如何确定主题域?企业级数据仓库建设最新版(附16页文档)...

#大数据#ssl#https +1
写给数据分析师的数据仓库知识(1)

数据库说到数据库,我们一般是指传统的关系型数据库,也就是“联机事务处理”(OLTP),主要用户在线交易处理。比如银行业务、电信业务之前很多都是Oracle或者DB2(可能现在很多开发者没再用过),到后来的互联网电商用的MySql,这些都是关系型数据库。后来有了newSQL、NoSQL(not only sql),现在也分了很多种类,比如大型互联网公司存储用户画像的HBase,还有用于存储文档,..

    共 105 条
  • 1
  • 2
  • 3
  • 11
  • 请选择