
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据分析师的工作绩效到底该怎么定?这个又是一个很蛋疼的话题,甚至很多从业很久的老鸟都没想明白,也很容易中坑。所有部门里,数据分析的绩效可能是最蛋疼的。其他部门的职责和绩效都非常清晰。比...
0x00 前言本文的话题来自一名应届生关于毕业后职业发展方向的选择。在职业选择上,数据分析和算法工程师是很多小伙伴都会纠结选择的地方,本文正好对该问题进行了讨论,也希望给更多的小伙伴以参...
0x00 前言前段时候写了《数据分析师做成了提数工程师,该如何破局?》这篇文章后,收到了一些朋友的反馈,其中一些对于数据分析持有很强的否认态度。比如下面这些评论:关于数据...
数据挖掘面试题之:朴素贝叶斯本文为数据茶水间群友原创,经授权在本公众号发表。关于作者:DD-Kylin,一名喜欢编程与机器学习的统计学学生,勤学好问,乐于钻研,期待跟大家...
0x00 前言前段时候写了《数据分析师做成了提数工程师,该如何破局?》这篇文章后,收到了一些朋友的反馈,其中一些对于数据分析持有很强的否认态度。比如下面这些评论:关于数据...
0x00 前言本文会分享数据仓库中和缓慢变化维度相关的内容。在看之前建议回顾一下和维度建模相关的知识点,可参考这篇博客:《漫谈数据仓库之维度建模》。为什么会分享这个听起来很奇怪的东西?因为站在的笔者的视角中,只要是做数据仓库的小伙伴们,在工作中基本上都会接触和维度建模相关的内容,而谈到维度建模,就少不了会和维度表打交道。我们要谈的就是维度表相关的知识点。在正式开始之前,先解释一下什么是缓慢变化维度
0x00 前言本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。全文由下面几个部分组成:先分享一下拉链表的用途、什么是拉链表。通过一些小的使用场景来对拉链表做近一步的阐释,以及拉链表和常用的切片表的区别。举一个具体的应用场景,来设计并实现一份拉链表,最后并通过一些例子说明如何使用我们设计的这张表(因为现在Hive的大规模使用
直接删除目录(不放入回收站)hdfs dfs -rm -skipTrash /path/to/file/you/want/to/remove/permanently如果不加-skipTrash,删除的目录会放入/user/hdfs/.Trash中。有专门的配置项来指定什么时候清空回收站。清空回收站hdfs dfs -expungeThis should give you output simi
文章一共3500多字,读完预计需要30分钟,不过内容相对独立,有兴趣可以先收藏后查阅。OCPM 或者OCPC 能力在最近几年得到长足的发展,在广告行业中大放异彩,如果一个广告平台不支持...
0x00 前言最近很多小伙伴都来问居士入门数据分析看什么书比较好,之前一直没有写文章来回答是因为还有一两本书没翻完,自己没好好看的书,居士不太愿意分享的。而,之前看到的很多别人的推荐书单...







