logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

HBase批量导入操作

shell--buckload数据准备1,zss,23,M2,lss,33,M3,fj,35,F4,ny,42,M5,xq,44,F1)在hbase中创建表create'tb_friends' , 'cf'2) 使用shell命令将数据转换成hfile文件hbase org.apache.hadoop.hbase.mapreduce.ImportTsv \-- 使用类执行操作-Dimporttsv

#hbase#hadoop#big data
HBase--Region拆分策略

Region为什么要拆分?随着数据的增加,一个Region管理的数据条数越来越多,出现传统SQL数据库的单节点并发问题,将region拆分,将region移动均衡到其他的节点!1.默认的拆分策略(大小)当region的大小达到一定大小的时候会被拆分IncreasingToUpperBoundRegionSplitPolicysplit策略实现类<property><name&gt

#hbase#sql#数据库
ClickHouse视图

ClickHouse拥有普通和物化两种视图,其中物化视图拥有独立的存储,而普通视图只是一层简单的查询代理1.普通视图语法CREATE VIEW [IF NOT EXISTS] [db_name.]view_name AS SELECT ...普通视图不会存储任何数据,它只是一层单纯的SELECT查询映射,起着简化查询,明晰语义的作用,对查询性能不会有任何增强drop view test3_view

#big data#database#数据库
Flink-join的三种方式

Join/**** 将两个数据流,进行join** 如果让两个流能够join上,必须满足以下两个条件* 1.由于数据是分散在多台机器上,必须将join条件相同的数据通过网络传输到同一台机器的同一个分区中(按照条件进行KeyBy)* 2.让每个流中的数据都放慢,等等对方(划分相同类型,长度一样的窗口)**/public class EventTumblingWindowJoin {public st

#flink#大数据#big data
暂无文章信息