logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hudi0.9--初步使用

1. 编译官方网址: https://hudi.apache.org/docs/spark_quick-start-guide.html编译指导: https://github.com/apache/hudi#building-apache-hudi-from-source环境准备Unix-like system (like Linux, Mac OS X)Java 8 (Java 9 or 10

#spark
presto安装及初步使用

1.下载安装包#下载页面 http://prestodb.github.io/download.html服务端:presto-server-0.227.tar客户端:presto-cli-0.227-executable2.解压安装包并且创建对应目录和文件解压[hadoop@hadoop001 software]$ tar -zxvfpresto-server-0.227...

ES--top_hits的简单使用获取最早进 最晚出的数据

需求:业务 需要知道工人打卡记录最早进 与 最早出 一天记录原始信息,现通过 top_hits来实现如下:GET /hw-attendance-2022-3month/_search{"query": {"bool": {"filter": [{"range": {"record_time": {"gte": "2022-03-07T00:00:00",.

#elasticsearch
ES--cardinality(统计去重) top_hits(内容去重) 的简单使用

统计去重 cardinality## 对时间范围内sn 考勤的人员 身份证去重GET /hw-attendance-aliases/_search{"query": {"bool": {"must": [{"terms": {"sn.keyword": ["5043517855901153563I","5043517855901153563O"]}},.

Flink小知识--任务调度slot的配置 slotSharingGroup

flink通过调整默认行为以及控制作业链与作业分配(处理槽共享组)来提高应用的性能

#flink#java#大数据
暂无文章信息