logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Apache DolphinScheduler:国人主导的分布式工作流调度平台正式成为 Apache 顶级项目...

全球最大的开源软件基金会 Apache 软件基金会(以下简称 Apache)于北京时间 2021年4月9日在官方渠道宣布Apache DolphinScheduler 毕业成为Apache...

#分布式#大数据#编程语言 +2
这几个Python数据可视化探索实例,拿走不谢!

本文选自清华大学出版社的新书《深入浅出Python数据分析》章节,推荐一下。利用可视化探索图表一、数据可视化与探索图数据可视化是指用图形或表格的方式来呈现数据。图表能够清楚地呈现数据性质, 以及数据间或属性间的关系,可以轻易地让人看图释义。用户通过探索图(Exploratory Graph)可以了解数据的特性、寻找数据的趋势、降低数据的理解门槛。二、常见的图表...

#python#机器学习#数据分析 +1
华为大数据面试官:兄弟,说说典型的Kafka集群架构吧

众所周知,“架构师”一直是被仰望的存在,是高阶技术人员的典范。随手打开招聘App,凡是带“架构师”字样的岗位,几乎都拥有行业内较高的待遇和薪水,而市场上稀缺的“大数据架构师”,光是看看就...

#编程语言#大数据#xhtml
大数据先驱Cloudera拥抱云计算,探索后Hadoop时代的下一代数据平台

未来十年,企业数据管理模式将如何进化?Cloudera 的答案是 — 企业数据云。在数据爆炸时代“掘金”数字正在“吞噬”世界。过去的十几年里,我们进入了一个数据爆炸、信息过载的时代。数据规...

#大数据#人工智能#hadoop +2
Hive的数据存储模式

写在前面的话,学Hive这么久了,发现目前国内还没有一本完整的介绍Hive的书籍,而且互联网上面的资料很乱,于是我决定写一些关于《Hive的那些事》序列文章,分享给大家。我会在接下来的时间整理有关Hive的资料,如果对Hive的东西感兴趣,请关注本博客。  Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据;而元数据是用来存储表的名字,表的列和分区及其属性,表的属性(

起源于 Kettle 的新一代数据集成平台 Apache Hop 成为 Apache 顶级项目

Apache Hop(Hop Orchestration Platform 的首字母缩写)是一种数据编排(data orchestration )和数据工程平台(data engineer...

#数据库#大数据#python +1
知乎获赞5K+,大数据工程师进阶学习笔记!

最近有幸在一位字节跳动大数据高级工程师手里扒到了这份学习笔记,将部分知识章节发布到了在知乎上竟然获得了5000+点赞!今天就拿出来分享给大家,不管你是学生,还是已经步入职场的同行,希望你...

#编程语言#人工智能#大数据 +1
继CDH收费之后,这家公司率先推出了免费版大数据套件服务!

背景在大数据业务系统中,所有技术栈生态均是围绕着存储进行扩展的,目前开源的主流存储技术栈主要包含如下 3 种类型:· HDFS:Hadoop 系列套件,包含 Hive、HBase、Phoe...

#运维#搜索引擎#大数据 +2
数据中台:浅析数据湖和数据中台的关系

【过往记忆大数据】已开通技术交流及招聘求职内推群,加微信号fangzhen0219为好友后入群。1那些让人眼花缭乱的概念不知道大家有没有发现,这几年的数据领域有好多的概念,例如:大...

#大数据#人工智能#数据分析 +2
数仓出局,中台已凉,数据湖称王!

随着信息化进程的加快,传统数仓越来越无法适应海量数据存储和分析的需求,天下苦数据仓库久矣!数仓只能存储结构化数据,无法采集存储非机构化数据数仓无法存储原始数据,所有数据须经过ETL清洗过...

#大数据#人工智能#编程语言 +2
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择