logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据中台:数据模型设计

如果把指标⽐喻成⼀棵树上的果实,那模型就是这棵⼤树的躯⼲,想让果实结得好,必须让树⼲变得粗壮。真实场景举例:⼤多数公司的分析师会结合业务做⼀些数据分析(需要⽤到⼤量的数据),通过报表的⽅式服务于业务部⻔的运营。但是在数据中台构建之前,分析师经常发现⾃⼰没有可以复⽤的数据,不得不使⽤原始数据进⾏清洗、加⼯、计算指标。由于他们⼤多是⾮技术专业出⾝,写的SQL质量⽐较差,甚⾄⻅过5层以上的嵌套。这种SQ

#数据库#数据仓库
2021大数据开发面试高频100题最新汇总(附答案详解)

又到了金三银四的招聘旺季,很多想入行大数据开发的程序员却在面试上发了愁。大数据方向技术栈繁多,不同的面试官和公司用到的技术栈也不一样,问的问题也是各有不同。大厂面试题回忆:【腾讯PCG事...

#面试#编程语言#spark +1
数据湖系列(1) - Hudi 核心功能原理剖析

随着互联网业务的逐步成熟,数仓和模型训练的基本盘逐步稳固,越来越多的工程师从业务开发需求转移到了工程的架构升级,而常用的 Hudi 和 Iceberg 往往会成为替代 Hive/Hdfs 等架构升级的选型。概要网上关于 Hudi 和 Iceberg 对比的内容有很多,比如 Iceberg 对 Schema 友好,Hudi 支持 Upsert 等优劣点的对比,这些内容很大程...

#大数据#数据库#python +2
EMQ X + ClickHouse 实现物联网数据接入与分析

物联网数据采集涉及到大量设备接入、海量的数据传输,EMQ X 物联网消息中间件与 ClickHouse 联机分析 (OLAP) 数据库的组合技术栈完全能够胜任物联网数据采集传输与存储、...

#数据库#大数据#物联网 +1
如何申请 Midjourney API ,一文教会你,欢迎收藏

要使用 Midjourney Imagine API,首先可以到 Midjourney Imagine API 页面点击「获取」按钮:如果你尚未登录,会自动跳转到登录页面。需要对接的+微信:weixin605405145扫码关注公众号即可自动登录,无需额外注册步骤。登录完了之后会跳回原页面 Midjourney Imagine API ,此时会提示「您尚未申请该服务,需要申请」。申请时会校验实名认

文章图片
#前端#java#javascript +1
原创|5万字详谈大数据面试题,面试必备

1一面维度建模 如何建 确认主题 确认粒度 确认度量 确认事实表 确认维度表 Hive shuffle 和 spark shuffle的区别 Spark 为什么快 Spark任务是怎么执行...

#网络#分布式#webgl
附PPT下载|蚂蚁金服数据分析平台演进之路

01PDF下载识别下方二维码,回复“小晨011”,即可下载。感觉干货多,记得设为星标哦02PPT预览...

#qt#数据可视化#https
数据湖系列(2) - Iceberg 核心功能原理剖析

上一篇文章数据湖系列(1) - Hudi 核心功能原理剖析[1]中讲解了关于 Hudi 的基本概念和功能原理,Hudi 利用主键索引的方法来实现了 Upsert 的语义。Apache Iceberg[2]也是一个广为应用的数据湖框架,虽然两个框架的设计初衷和思路不同,但如今随着需求逐步丰富,两者对于使用者来说,却是越来越趋于一致了。•数据湖系列(1) - Hudi ...

#大数据#数据库#java +2
老王跑步入场GPT,要搞AI,先送外卖?

十年前AlphaGo火的时候,百度在送外卖;十年后ChatGPT火的时候,抖音还在送外卖;而十年前送外卖的大佬,现在出来搞AI;所以……要搞AI,先送外卖?公众号后台回复:“ChatGPT”,便可以下载到干货包!!目录:一、ChatGPT简介ChatGPT本质是一个对话模型,它可以回答日常问题、挑战不正确的前提,甚至会拒绝不适当的请求,在去除偏见和安全性上不同于以往的语言模型。ChatGPT从闲聊

#人工智能
微博基于Flink的机器学习实践和未来实时数仓规划

关注上方????公众号,及时获得大数据最新资料。flink峰会相关ppt,大家可以直接公众号回复:"峰会",即可获得今天所有的ppt资料,已经上传到百度云盘。我大体看了一...

    共 40 条
  • 1
  • 2
  • 3
  • 4
  • 请选择