logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何用python编写hive udf函数

相比于java编写udf,python编写udf就显得简单的多。站在数据处理的角度来说,python也更合适。那python如何编写udf函数呢?使用方法:(1)将编写的python代码上传到服务器(2)添加python文件(3)使用函数:TRANSFORM (data) USING “python udf_test.py” as (name,address)对比java编写udf函数来说,少了打

#大数据#数据仓库#hive +2
hive如何创建视图

视图:1、视图是一个逻辑表,本身不存储数据。数据来源于它依赖的物理表2、视图只是简化复杂的查询,相当于一个sql数据集,对于一个大表来说,简化查询sql,并不能提高查询效率。反而增加资源开销,建议频繁查询的数据落地1.视图如何创建hive> create view if not exists test.test_view as> select>apptypeid,>acci

#大数据#hadoop#hdfs +1
hive最全的常用时间函数(非常全,建议收藏)

在实际生产中,经常由于某个特殊需求涉及到时间函数的转换,例如求上周六到本周日的pv、uv,本月第一天和本月最后一天的访问量的时候。不知如何下手,或者想尽一切办法写出来的代码,却很复杂。本文详细介绍了很多常用的时间函数,基本包括了所有的可能用到的函数

#大数据#hive
hive经典面试题2--次日留存、3日、7日留存怎么计算

背景:互联网公司,分析app上线后的效果,通常会通过很多指标来分析,其中一个指标就是留存率,留存率中最重要的就是次日留存,如果次日留存很高,说明这个app很成功,用户粘性高。留存是怎么定义的呢?一个用户第一天来了,第二天又来了,说明这个用户留存了。次日留存率就是100%第一天来了100个用户,第二天这100用户中只有50个用户过来了,第三天这100个用户中只有30个用户过来了;那么次日留存率就是5

#大数据#数据仓库#hive
暂无文章信息