logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据结构--哈希表

在哈希表中,输入空间是所有 key ,输出空间是所有桶(数组索引)。「哈希表 hash table」,又称「散列表」,其通过建立键 key 与值 value 之间的映射,实现高效的元素查询。当发生冲突时,平方探测不是简单地跳过一个固定的步数,而是跳过“探测次数的平方”的步数,即1,4,9,…对于上述示例中的哈希函数,当输入的 key 后两位相同时,哈希函数的输出结果也相同。从本质上看,哈希函数的作

文章图片
#数据结构#散列表
大数据Flume--入门

Flume 是 Cloudera 提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。

文章图片
#大数据#flume
大数据Hive--文件格式和压缩

压缩格式算法文件扩展名是否可切分DEFLATEDEFLATE.deflate否GzipDEFLATE.gz否bzip2bzip2.bz2是LZOLZO.lzo是SnappySnappy.snappy否为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器,如下表所示:Hadoop查看支持压缩的方式hadoop checknative。Hadoop在driver端设置压缩。压缩格式对应的编码/

文章图片
#大数据#hive#hadoop
大数据Hive--查询

本例中会首先启动一个MapReduce job对表e和表d进行连接操作,然后会再启动一个MapReduce job将第一个MapReduce job的输出和表l进行连接操作。union和union all都是上下拼接sql的结果,这点是和join有区别的,join是左右关联,union和union all是上下拼接。在很多情况下,并不需要全局排序,此时可以使用Sort by。对于distribut

文章图片
#大数据#hive#hadoop
Java数据结构--堆

堆顶元素是二叉树的根节点,即列表首元素。“从顶至底堆化”的操作方向与“从底至顶堆化”相反,我们将根节点的值与其两个子节点的值进行比较,将最大的子节点与根节点交换。如图所示,给定索引 i,其左子节点索引为 2i+1 ,右子节点索引为 2i+2,父节点索引为 (i-1)/2(向下整除)。然后继续执行此操作,从底至顶修复堆中的各个节点,直至越过根节点或遇到无须交换的节点时结束。需要指出的是,许多编程语言

文章图片
#数据结构#算法
大数据Hive--安装和配置

有需要Hive-3.1.3.安装包和 MySQL安装包以及MySQL驱动jar包的,请浏览文章末尾。

文章图片
#大数据#hive
FineBI安装部署

FineBI是帆软软件有限公司推出的一款商业智能(Business Intelligence)产品,其定位是一个大数据自助分析工具,旨在帮助企业的业务人员充分了解和利用他们的数据。

#finebi
到底了