logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

flink实战教程-使用set实时计算当天网站uv

文章目录背景案例讲解模拟source定义窗口自定义聚合算子处理输出结果背景对于web网站,我们一般会有这样的需求,实时的计算出来当天网站的uv,尽可能快的展示出来。今天我们就讲一下基于java的set集合做一下实时uv的统计。简易需求:实时计算出当天零点截止到当前时间各个端(android,ios,h5)下的uv每秒钟更新一次统计结果案例讲解模拟source首先我们模拟生成一下最简单的数据,生成一

#flink#uv
hadoop2.7.3源码解析之hdfs删除文件全流程分析

客户端删除文件namenode删除文件从命名空间删除文件将相应的数据块加到InvalidateBlocks中ReplicationMonitor监控线程心跳生成删除命令datanode删除相应的block并汇报心跳处理删除命令异步单独开启线程删除磁盘数据向namenode汇报删除的块namenode处理删除block的汇报总结客户端删除文件先来一段简单的代码,用java的api

#hadoop#hdfs
hadoop源码解析之hdfs内部结构分析

概述命名空间Namesystem文件目录管理i-node介绍linux i-node介绍hdfs的 INode介绍INodeFileINodeDirectory块管理数据块BlockInfoContiguous集群中所有的块的管理DatanodeStorageInfo 数据节点存储总结概述hdfs的内部的文件和目录是如何以树的结构存储的,每个文件对应的块是如何存储的,每个块对

#hadoop#hdfs
flink教程-基于flink 1.11 使 sql客户端支持执行sql文件

目前flink的sql客户端提供了一种交互式的sql查询服务,用户可以使用sql客户端执行一些sql的批任务或者流任务。但是当我想执行一些sql的定时任务时,flink却没有提供一个合适的方式,所以综合考虑了一下,我决定在sql的客户端基础上给加一个 ‘-filename (-f)’ 参数,就像类似’hive -f abc.sql’ 一样,可以执行一批sql任务。

#flink#sql
如何成为apache开源社区的贡献者

作为一个程序员,给世界上顶级的apache社区贡献一下自己的代码,成为一个apache contributer,把这个写到简历里,是不是觉得很爽,下面我结合apache flink来简单讲讲如何给apache 贡献你的第一行代码。

#apache#flink#开源 +1
大数据开源组件图谱

转载自:https://blog.csdn.net/u010039929/article/details/70157376文件系统数据存储内存技术数据搜集消息系统数据处理查询引擎分析和报告工具调度与管理服务机器学习开发平台文件系统HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高...

flink cep 案例之机架温度监控报警

记录下需要学习的相关知识点1.watermark原理,设置水印的方法,分布式情况下水印的处理2.分布式快照算法3.window4.自定义udf5.sql、table6.异步io7.机器学习8.流处理和批处理的api9.checkpoint,savepoint10.flink执行job流程11.flink的资源管理12.状态管理13.join14.Event Time1...

#flink
到底了