logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Apache Doris性能优化全解析:慢查询定位与引擎深度调优

在海量数据与复杂查询场景下,Apache Doris 的性能有时候并不能达到预期,这时候就需要通过系统性调优匹配业务需求。本文将梳理从问题定位到引擎优化的全流程方法,帮助开发者精准挖掘系统性能潜能

文章图片
#apache#性能优化
python代码实现tcp客户端和服务端通信演示

1.TCP介绍TCP协议,传输控制协议(英语:Transmission Control Protocol,缩写为 TCP)是一种面向连接的、可靠的、基于字节流的传输层通信协议,由IETF的RFC 793定义。TCP通信需要经过创建连接、数据传送、终止连接三个步骤。2.TCP特点1. 面向连接通信双方必须先建立连接才能进行数据的传输,双方都必须为该连接分配必要的系统内核资源,以管理连...

hadoop集群常见的报错原因

1)防火墙没关闭、或者没有启动yarnINFO client.RMProxy: Connecting to ResourceManager at hadoop108/192.168.10.108:80322)主机名称配置错误3)ip地址配置错误4)ssh没有配置好5)root用户和robot两个用户启动集群不统一6)配置文件修改不细心7)未编译源码Unabl

Apache Doris 在数据仓库中的作用与应用实践

在当今数字化时代,企业数据呈爆炸式增长,数据仓库作为企业数据管理和分析的核心基础设施,其重要性不言而喻。而 Apache Doris,作为一款基于 MPP(Massively Parallel Processing,大规模并行处理)架构的高性能实时分析型数据库,在数据仓库领域正发挥着举足轻重的作用。

文章图片
#apache#数据仓库
数据治理怎么做,看完这篇你就明白了

在大数据时代,几乎所有企业都看到了数据的价值,快速开始探索数据应用场景和商业模式、建设数据中台,但是如果在大数据拼图中遗忘了数据治理,那么即使做再多的业务和技术投入也是徒劳的,因为很经典的一句话:Garbage in Garbage out,数据质量没有保证。而保证数据质量,数据治理是必须的手段。数据治理这个话题看似阳春白雪高大上,实际上是非常下里巴人接地气,或者说必须要顶天立地才能见实效。

文章图片
#数据仓库
大数据平台实践之CDH6.2.1+spark3.3.0+kyuubi-1.6.0

前言:关于kyuubi的原理和功能这里不做详细的介绍,感兴趣的同学可以直通官网:https://kyuubi.readthedocs.io/en/v1.7.1-rc0/index.html。

文章图片
#大数据#spark#cloudera
企业数据治理实战总结--数仓面试必备

本文为数仓面试必备!!!文章整理自涤生大数据老师宇哥,宇哥是历任中国电信,平安银行,微众银行,众安保险等多家公司擅长大数据求职面试,数仓开发管理,数据治理,数据质量等工作

文章图片
#面试#数据挖掘#大数据
企业大数据可视化案例专题分享-入门

本文介绍了什么是企业级的数据可视化场景,同时进行了举例。

文章图片
#大数据
spark系列18:sparksql操作hive表的使用

1.SparkSQL 整合 Hive导读开启Hive的MetaStore独立进程整合SparkSQL和Hive的MetaStore和一个文件格式不同,Hive是一个外部的数据存储和查询引擎, 所以如果Spark要访问Hive的话, 就需要先整合Hive整合什么 ?如果要讨论SparkSQL如何和Hive进行整合, 首要考虑的事应该是Hive有什么, 有什么就整合什么就可以MetaStore, 元数

#spark#大数据
    共 66 条
  • 1
  • 2
  • 3
  • 7
  • 请选择