logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hive自定义函数

1.UDF的实现方法:简单的接口UDF、较为复杂的GenericUDF。2.简单 UDF 只需要重写evalute()方法。

文章图片
#hive#hadoop#数据仓库
HDFS Java API编程

1.相关方法(1)已经读取了指定的字符数, 底层流的read方法返回-1,指示文件末尾(),或者底层流的ready方法返回false,指示将阻塞后续的输入请求。(2) 如果第一次对底层流调用read返回-1(指示文件末尾),则此方法返回-1,否则此方法返回实际读取的字符数。

文章图片
#hdfs#hadoop#大数据
HBase高级特性:过滤器(一)

1.使用过滤器的步骤:(1)创建过滤器:RowFilter(CompareOperator op,ByteArrayComparable rowComparator),第一个参数接收的是比较操作对象,第二个参数接收的是条件。(2)设置过滤器。

文章图片
#hbase#数据库#大数据
HBase Java API开发:表的扫描与扫描的缓存和批量处理

在右侧编辑器begin-end处编写代码补全tablename为待操作表的表名,要求实现如下操作:删除表中行键为row1row2的行;获取表中行键为row3row10的行;四个操作需要依照以上先后顺序,即先删除在获取row3,row10。不需要你直接输出,只需要将批量操作的返回即可。

文章图片
#hbase#数据库#大数据
Pandas统计分析基础

的整数获取数值,Series对象使用。

文章图片
#pandas
Hive基本查询操作

查询出工作职责涉及hive的并且工资大于8000的公司名称以及工作经验。

文章图片
#hive#hadoop#数据仓库
到底了