logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据可视化神器Tableau学习小结3——函数及应用

函数类型数学函数、字符串函数、日期函数、类型函数、逻辑函数、聚合函数、直通函数、用户函数、表计算函数等。数字函数:abs(-7)=7\ceiling(3.1215)=4返回比数字更大的最近整数\degrees(PI()/4)=45.0 弧度转度数\div(11,2)=5返回商\exp(2)=7.389返回数字的e次幂\floor(3.1215)=3类似于ceiling但是取更小值\高级应用相关的应

数据可视化神器Tableau学习小结2

创建图表条形图要素:组数、组宽度和组限;分为垂直条形图和水平条形图;一般维度在行功能上,度量在列功能上;2.饼状图3.直方图一种统计报告图,一般横轴(列)表示数据类型(维度),纵轴(行)表示分布情况(度量);4.折线图显示数据的变化趋势,可以显示随时间而变化的连续数据;适合显示相等时间间隔的数据趋势;类别在列(横),数值在行(纵);5.散点图表示因变量随自变量变化的大致趋势,据此可以选择合适的函数

hive构建数据仓库

Oracle数据库中的数据表多表联合查询综合生成一张大的事实表,直接在Oracle中执行发现根本运行不起来,所以直接将Oracle中的原表迁移到了hive中。然后建表、联合查询生成新的hive表。hive建表语句在此不再赘述,直接执行联合查询的插入语句:(总共用时582.30s即9.7min,记录的条数在千万级)表的总记录条数:数据情况:

kylin2.0之spark构建cube

在kylin2.0中引入了构建cube的spark引擎,因此在构建cube的时候用spark代替MR。kylin2.0+spark1.6kylin2.1+spark2.1.1        kylin2.0.0+HBase1.XHadoop等的底层依赖:hdp2.4,hive,hbase,yarn1.修改Hadoop配置在kylin.properties中配置好Hadoop的配置路径(注意要新建一

sqoop1安装在hadoop2.6.0上不能使用import命令的问题

本人是菜鸟一枚,之前自己就在dell的台式机上安装了hadoop2.6.0的伪分布式,一直认为hadoop高深非我等常人可以明白理解的,怀揣着不求机理、问题清楚明了,只求能折腾出我想要的结果的心游走在Hadoop的边缘,所谓擦边球。但最近发现很多功能试了又试就是达不到预想的结果。然后网上搜了n多解决方案,依然不能解决。看了一个帖子,评论上说回归logs,如果连logs都看不明白,那你只能上个棒槌了

hadoop开发:eclipse运行wordcount实例

首先是hadoop平台的搭建。。。。(既然都要用eclipse运行wordcount实例了,肯定要搭建hadoop平台,或已经搭建好了平台)该实例是在伪分布式上进行的。搭建好伪分布式后,安装好eclipse,在用eclipse运行第一个wordcount实例之前先要给eclipse安装hadoop开发插件。关于安装插件博主pig2给出了两种方法,我运用的是后者,即安装插件。博中给出的另一种

浅谈透明计算与云计算的区别

透明计算定义:透明计算是一种用户无需感知计算机操作系统、中间件、应用程序和通信网络的具体所在,只需根据自己的需求,通过网络从所使用的各种终端设备(包括固定、移动、以及家庭中的各类终端设备)中选择并使用相应服务(例如计算、电话、电视、上网和娱乐等)的计算模式。透明客户端、透明网络和透明服务器。2015年1月9日,“2014年度国家自然科学奖”揭晓,一等奖颁给了清华大学教授、中南大学校

可用性和可靠性的区别

可用性和可靠性区别简介可用性(Availability)是关于系统可供使用时间的描述,以丢失的时间为驱动(Be DrivenBy Lost Time)。可靠性(Reliability)是关于系统无失效时间间隔的描述,以发生的失效个数为驱动(Be Driven By Number  of  Failure)。两者都用百分数的形式来表示。在一般情况下,可用性不等于可靠性,只有在没有宕机和失效发生的理想

检验数据集是否服从正态分布

1.图示法1.p-p图以样本的累积频率作为横坐标,以正太分布计算的响应累积概率作为纵坐标,把样本值表现为执教坐标系中的散点。若数据集服从正太分布,则样本点应围绕第一象限的对角线分布。1.2 QQ图以样本的分位数作为横坐标,以按照正太分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。若服从正太分布,则样本点应该呈一条围绕第一象限对角线的直角。https://jingyan.baidu.c

浅谈透明计算与云计算的区别

透明计算定义:透明计算是一种用户无需感知计算机操作系统、中间件、应用程序和通信网络的具体所在,只需根据自己的需求,通过网络从所使用的各种终端设备(包括固定、移动、以及家庭中的各类终端设备)中选择并使用相应服务(例如计算、电话、电视、上网和娱乐等)的计算模式。透明客户端、透明网络和透明服务器。2015年1月9日,“2014年度国家自然科学奖”揭晓,一等奖颁给了清华大学教授、中南大学校

    共 12 条
  • 1
  • 2
  • 请选择