logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Doris Catalog 联邦分析查询性能优化:从排查到优化的完整指南

在大数据分析中,Doris 的 Catalog 联邦分析功能为整合多源数据提供了有力支持。然而,在实际应用中,可能会遇到各种问题影响其正常运行。本文将详细剖析这些问题并提供解决方案。

文章图片
#性能优化
数据清洗(ETL)

数据清洗(ETL)概念案例需求1.需求分析2.文件案例分析1.需求分析2.输入数据3.输出数据4.规则设定代码实现1. 编写LogMapper类2. 编写LogDriver类结果截图概念在运行核心业务MapReduce程序之前,往往要先对数据进行清洗,清理掉不符合用户要求的数据。清理的过程往往只需要运行Mapper程序,不需要运行Reduce程序。案例需求1.需求分析去除日志中字段长度小于等于11

#mapreduce#hadoop
从根源到生态:Apache Doris 与 StarRocks 的深度对比 —— 论开源基因与长期价值的优越性

在 OLAP 领域,Apache Doris 与 StarRocks 常被一同提及,两者有着深厚的技术渊源 ——StarRocks 源自 Apache Doris 的代码 Fork,却在后续发展中走向了不同的路径。本文将从代码根源、架构演进、社区生态、功能特性等多维度展开对比。

#apache#开源#大数据
浩瀚深度:从 ClickHouse 到 Doris, 支撑单表 13PB、534 万亿行的超大规模数据分析场景

摘要: 浩瀚深度企业级大数据平台采用Apache Doris替换ClickHouse,成功应对超大规模数据处理挑战。其最大集群部署于117节点,单表数据量突破13PB、534万亿行,日均导入145TB,峰值158TB,稳定运行半年。测试表明,Doris在前缀索引、二级索引场景下性能达ClickHouse的2-5倍,全表扫描表现接近。迁移通过调整写入组件和SQL适配实现平滑过渡,并针对大批量写入和C

文章图片
#clickhouse#数据分析#数据挖掘 +2
易问数据与飞轮科技达成战略合作,逻辑驱动碰撞极速算力,定义“零幻觉”实时决策新生态!

当大模型的“感性”遇到实时数仓的“理性”,企业数字化转型将爆发怎样的生产力?

文章图片
#科技
Doris 用户狂喜!官网内置「Ask AI」智能问答,查文档不用翻半天了

Doris官网推出「Ask AI」智能问答工具,基于全量官方文档训练,提供即时精准的解决方案。该工具拒绝野路子配置,覆盖从入门到运维全场景问题,支持复杂问题的深度分析。用户只需在官网点击「Ask AI」按钮即可提问,所有回答均附带官方文档链接。

文章图片
#人工智能#apache#数据仓库 +1
【Apache Doris】周FAQ集锦:第 29 期

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

文章图片
#apache#数据库#大数据 +2
Doris vs Elasticsearch:全维度对比与实际成本案例解析

本文将从架构设计、数据导入、查询优化、存储管理、使用方式、运维难度、社区活跃度等多个角度进行对比,并重点加入使用成本的讨论,最后通过中信银行信用卡中心的实际案例,展示 Doris 替换 Elasticsearch 后的显著收益。

文章图片
#elasticsearch#大数据#搜索引擎 +1
Cannot identify version of git executable: no response

IDEA中Git不能运行报错截图(右下角)解决办法原因报错截图(右下角)解决办法按照以下顺序找到Git:File–>setting–>Version Control -->Git然后点下test,测试是否成功。原因Git可执行文件(git.exe)的路径选择错误。...

#git#windows
Apache Doris 数据均衡问题排查指南

当集群处于以下几种情况时,可参考本文进行问题排查。BE节点之间的数据不均单个BE节点上的多个磁盘之间的数据不均BE节点的上线和下线进度卡死(BE的tablet数量没有变化)

文章图片
#apache
    共 16 条
  • 1
  • 2
  • 请选择