
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于北京时间 2021年4月9日在官方渠道宣布Apache DolphinScheduler 毕业成为Apache...
本文选自清华大学出版社的新书《深入浅出Python数据分析》章节,推荐一下。利用可视化探索图表一、数据可视化与探索图数据可视化是指用图形或表格的方式来呈现数据。图表能够清楚地呈现数据性质, 以及数据间或属性间的关系,可以轻易地让人看图释义。用户通过探索图(Exploratory Graph)可以了解数据的特性、寻找数据的趋势、降低数据的理解门槛。二、常见的图表...
众所周知,“架构师”一直是被仰望的存在,是高阶技术人员的典范。随手打开招聘App,凡是带“架构师”字样的岗位,几乎都拥有行业内较高的待遇和薪水,而市场上稀缺的“大数据架构师”,光是看看就...
未来十年,企业数据管理模式将如何进化?Cloudera 的答案是 — 企业数据云。在数据爆炸时代“掘金”数字正在“吞噬”世界。过去的十几年里,我们进入了一个数据爆炸、信息过载的时代。数据规...
写在前面的话,学Hive这么久了,发现目前国内还没有一本完整的介绍Hive的书籍,而且互联网上面的资料很乱,于是我决定写一些关于《Hive的那些事》序列文章,分享给大家。我会在接下来的时间整理有关Hive的资料,如果对Hive的东西感兴趣,请关注本博客。 Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据;而元数据是用来存储表的名字,表的列和分区及其属性,表的属性(
Apache Hop(Hop Orchestration Platform 的首字母缩写)是一种数据编排(data orchestration )和数据工程平台(data engineer...
最近有幸在一位字节跳动大数据高级工程师手里扒到了这份学习笔记,将部分知识章节发布到了在知乎上竟然获得了5000+点赞!今天就拿出来分享给大家,不管你是学生,还是已经步入职场的同行,希望你...
背景在大数据业务系统中,所有技术栈生态均是围绕着存储进行扩展的,目前开源的主流存储技术栈主要包含如下 3 种类型:· HDFS:Hadoop 系列套件,包含 Hive、HBase、Phoe...
【过往记忆大数据】已开通技术交流及招聘求职内推群,加微信号fangzhen0219为好友后入群。1那些让人眼花缭乱的概念不知道大家有没有发现,这几年的数据领域有好多的概念,例如:大...
随着信息化进程的加快,传统数仓越来越无法适应海量数据存储和分析的需求,天下苦数据仓库久矣!数仓只能存储结构化数据,无法采集存储非机构化数据数仓无法存储原始数据,所有数据须经过ETL清洗过...







