
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文深入解析 Flink 时间机制与 Timer 定时器的核心原理与应用。首先介绍 Flink 的两种时间类型(事件时间和处理时间),重点讲解事件时间的水印机制及其配置方法。随后详细拆解 Timer 的工作原理,包括注册、触发和执行流程,并通过订单超时监控的完整代码示例,展示如何结合 KeyedProcessFunction 和状态管理实现延迟触发业务逻辑。文章适用于 Flink 开发者,帮助掌握
本文深入解析Apache Doris存储引擎的设计与实现,重点介绍其融合LSM-Tree、列式存储和MVCC的混合架构。文章从存储引擎定位出发,详细拆解了四级数据组织模型(Table-Partition-Tablet-Replica)、基于LSM-Tree优化的写入流程、多级缓存的读取机制,以及行列混存等核心特性。同时阐述了Compaction策略、SegmentV2列存格式、事务一致性模型和容错
本文深入解析Apache Doris基础架构,重点剖析其MPP架构设计。Doris由FE(元数据管理与查询协调)和BE(存储与计算执行)两类进程组成,通过心跳机制、任务下发和副本管理实现高效协同。文章详细阐述了FE的BDBJE高可用机制和BE的列式存储结构,并重点讲解了两级数据分布模型:分区(逻辑分片)用于数据生命周期管理,分桶(物理分片)实现并行计算与数据均衡。通过合理设计分区策略和分桶键选择,
本文深入解析Apache Doris的两层存储优化技术——编码与压缩,针对大数据开发、Doris运维等技术人员提供生产级优化方案。文章详细剖析了PLAIN、DICT_ENCODING、BIT_SHUFFLE等核心编码原理及LZ4/ZSTD压缩算法对比,给出建表配置语法和性能调优建议。通过合理应用编码压缩技术,可显著降低存储空间30%以上,提升查询吞吐15%,是实时数仓和OLAP系统必掌握的优化手段
表名:默认大小写敏感,默认表名最大长度为 64 字节;均可配置表属性:建表时可通过PROPERTIES指定,作用于分区,包括分桶数(buckets):决定数据在表中的分布存储介质(storage_medium):控制数据的存储方式,如使用 HDD、SSD 或远程共享存储副本数 (replication_num):控制数据副本的数量,以保证数据的冗余和可靠性冷热分离存储策略 (storage_pol







