logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【硬刚大数据】大数据同步工具之FlinkCDC/Canal/Debezium对比

欢迎关注博客主页:微信搜:import_bigdata,大数据领域硬核原创作者_王知无(import_bigdata)_CSDN博客欢迎点赞、收藏、留言 ,欢迎留言交流!本文由【王知无】原创,首发于 CSDN博客!本文首发CSDN论坛,未经过官方和本人允许,严禁转载!《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》前言数据准实时复制(CDC)是目前行内实时数据需求大量使用的技

文章图片
#big data#flink#大数据
数据治理体系建设与实践

全网最全大数据面试提升手册!01数据治理建设路径1.业务数字化的目的是打造一体化的业务流、信息流与数据流从企业整体经营管理的角度,战略制定及分解—领域业务目标制定—业务方案设计—业务需求识别 & 信息系统功能及数据库设计—数据汇聚及分析—业务目标监测及改善,这个过程会有层层信息耗散,全局数据治理的目的就是利用体系机制保障最大程度减少这个耗散或补足耗散的部分,让数据尽可能的还原企业的业务事.

#数据库#大数据#运维
打造大数据平台底层计算存储引擎 | Apache孵化器迎来Linkis!

点击上方蓝色字体,选择“设为星标”回复”面试“获取更多惊喜微众银行开源项目Linkis正式通过Apache软件基金会(ASF)的投票表决,全票通过进入ASF孵化器!Linkis简介Link...

#中间件#大数据#编程语言 +2
Redis8.0来袭,大数据点查询之王重磅发布!

由 Redis 的原始创建者 Salvatore Sanfilippo 开发,向量集借鉴了有序集(sorted set)的灵感,并扩展了有序集的概念,允许存储和查询高维向量嵌入,从而增强了 Redis 在涉及语义搜索和推荐系统等 AI 用例中的能力。Redis大家应该不陌生,Redis是一款高性能的内存数据库,具有丰富的数据结构和强大的功能,在整个软件开发领域,Redis在缓存、分布式锁、大数据处

#大数据
大数据调度平台分类大对比(Oozie/Azkaban/AirFlow/XXL-Job/DolphinScheduler)

点击上方蓝色字体,选择“设为星标”回复"面试"获取更多惊喜八股文交给我,你们专心刷题和面试Hi,我是王知无,一个大数据领域的原创作者。放心关注我,获取更多行业的一手消息。大数据调度系统,...

#分布式#大数据#python +2
ClickHouse使用姿势系列之分布式JOIN

点击上方蓝色字体,选择“设为星标”回复"面试"获取更多惊喜????轻戳有惊喜:八股文教给我,你们专心刷题和面试阅读本文前必读:原理部分「Clickhouse系列」分布式表&本地表详解「ClickHouse系列」ClickHouse之MergeTree原理「ClickHouse系列」Replication机制详解「ClickHouse系列」ClickHouseSQL基本语...

#分布式#java#大数据 +2
Apache Paimon毕业,湖仓架构的未来发展趋势!

北京时间 2024 年 4 月 16日,开源软件基金会 Apache Software Foundation(以下简称 ASF)正式宣布 Apache Paimon 毕业成为 Apache 顶级项目(TLP, Top Level Project)。经过社区的共同努力和持续创新,Apache Paimon 在构建实时数据湖与流批处理技术领域取得了重大突破,数据湖步入实时新篇章!恭喜Paimon进入一

#apache#架构
Doris性能优化不要慌,再看看这里!

我们在之前的《Doris性能优化不要慌,看看这里!》详细介绍了Doris Join的优化策略。今天的文章是第二部分,关于Doris导入优化。为提供快速的数据写入支持,Apache Doris 存储引擎采用了类似 LSM Tree 结构。在进行数据导入时,数据会先写入 Tablet 对应的 MemTable 中,MemTable 采用 SkipList 的数据结构。当 MemTable 写满之后,会

#性能优化
【查询优化】Doris性能优化不要慌,再看看这里!

《Doris性能优化不要慌,再看看这里!- Join优化》《Doris性能优化不要慌,再看看这里!- 导入优化》这篇是第三部分查询优化。OLAP查询对于高并发查询,其核心在于如何平衡有限的系统资源消耗与并发执行带来的高负载。换而言之,需要最大化降低单个 SQL 执行时的 CPU、内存和 IO 开销,其关键在于减少底层数据的 Scan 以及随后的数据计算。Doris能够实现高并发查询的能力主要是通过

#性能优化
B站基于Iceberg的湖仓一体架构实践

点击上方蓝色字体,选择“设为星标”回复"面试"获取更多惊喜八股文教给我,你们专心刷题和面试Hi,我是王知无,一个大数据领域的原创作者。放心关注我,获取更多行业的一手消息。背景在B站,每天都有PB级的数据注入到大数据平台,经过离线或实时的ETL建模后,提供给下游的分析、推荐及预测等场景使用。面对如此大规模的数据,如何高效低成本地满足下游数据的分析需求,一直是我们重点的工作...

#分布式#数据仓库#大数据 +2
    共 128 条
  • 1
  • 2
  • 3
  • 13
  • 请选择