KG大数据个人主页

@CLKTOY

KG大数据

2022-12-21 15:06:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

kafka配置多个消费者groupid kafka多个消费者消费同一个partition（java）

kafka在一个消费者组内设置多个消费者

#kafka #java #分布式

一文读懂大数据实时计算（好文点赞收藏！！）

目录0-前言1-实时计算2-实时计算应用场景2.1-实时智能推荐2.2-实时欺诈检测2.3-舆情分析2.4-复杂事件处理2.5-实时机器学习3-实时计算架构4-实时数仓解决方案0-前言本文分为四个章节介绍实时计算，第一节介绍实时计算出现的原因及概念；第二节介绍实时计算的应用场景；第三节介绍实时计算常见的架构；第四节是实时数仓解决方案。1-实时计算实时计算一般都是针对海量数据进行的，并且要求为秒级。

#hive #数据仓库 #flink +2

SQL进阶--6__如何使用hiveSQL提取JSON中的value值（超级详细！）

如何使用hiveSQL提取JSON中的value值0-需求1-Hive自带的json解析函数2-Hive解析json数组3-总结0-需求在Hive中会有很多数据是用Json格式来存储的，如开发人员对APP上的页面进行埋点时，会将多个字段存放在一个json数组中，因此数据平台调用数据时，要对埋点数据进行解析。接下来就聊聊Hive中是如何解析json数据的。1-Hive自带的json解析函数（1）ge

#sql #json #hive +2

Hive数据存储格式详细讲解（好文点赞收藏！）

目录0-前言1-TextFile2-SequenceFile3-RCFile4-ORCFile4.1-ORC相比较 RCFile 的优点4.2-ORC的基本结构4.3-ORC的数据类型4.4-ORC 的 ACID 事务的支持4.5-ORC 相关的 Hive 配置5-Parquet5.1-Parquet基本结构5.2-Parquet 的相关配置：5.3-使用Spark引擎时 Parquet 表的压缩

#hive #hdfs #大数据 +2

到底了