logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【数据产品】数据产品如何选型

一、数据仓库选型数据仓库选型是整个数据中台项目的重中之重,是一切开发和应用的基础。而数据仓库的选型,其实就是Hive数仓和非Hive数仓的较量。Hive数仓以Hive为核心,搭建数据ETL流程,配合Kylin、Presto、HAWQ、Spark、ClickHouse等查询引擎完成数据的最终展现。非Hive数仓则以Greenplum、Doris、GaussDB、HANA(基于SAP BW构建的数据仓

文章图片
运维常用的脚本

1、检测两台服务器指定目录下的文件一致性#!/bin/bash######################################检测两台服务器指定目录下的文件一致性######################################通过对比两台服务器上文件的md5值,达到检测一致性的目的dir=/data/webb_ip=192.168.88.10#将指定目录下的文件全部遍历出来

文章图片
#运维#bash
如何做架构设计和评审

优化的常见手段或模式静态化:动态数据和静态数据分离。异步化:使用异步化减少主流程中的非关键业务逻辑。并行化:使用多线程并发处理,缩短响应时间。内存优化:减少对象大小,减少对象创造,数据模型优化去重复运算:业务逻辑优化,或者使用缓存减少数据库操作:数据冗余,数据缓存等缩短数据库事务:短事务,异步化,最终一致性等方式可以考虑精简代码逻辑:去除冗余代码,诸如过度设计检查等代码。精简日志操作:日志大小要关

文章图片
如何画好一张架构图

一、什么是架构图1.1 理解与解析如何画好一张架构图,要做好这件事情首先要回答的就是什么是架构图。我们日常工作中经常能看到各种各样的架构图,而且经常会发现大家对架构图的理解各有侧重。深入追究到这个问题,可能一下子还很难有一个具象的定义,如果我们把这个问题进行拆分(如下图)理解起来就会容易一点。架构图=架构+图按照这个等式,我们可以把问题转换:架构是什么?图是什么?图是什么?这个比较容易回答,图是一

文章图片
从实现原理谈谈低代码

一、低代码的理解在讨论各个低代码方案前,首先要明确「低代码」究竟是什么?这个问题不好直接回答,因为低代码是非常宽泛的概念,有很多产品都声称自己的低代码,但我们很容易反过来回答另一个问题:「什么是低代码产品唯一不可缺少的功能?」我认为这个功能是可视化编辑,因为非可视化编辑就是代码编辑,而只有代码编辑的产品不会被认为是低代码,因此可视化编辑是低代码的必要条件,低代码其实还有另一个更清晰的叫法是可视化编

#低代码
运维常用的脚本

1、检测两台服务器指定目录下的文件一致性#!/bin/bash######################################检测两台服务器指定目录下的文件一致性######################################通过对比两台服务器上文件的md5值,达到检测一致性的目的dir=/data/webb_ip=192.168.88.10#将指定目录下的文件全部遍历出来

文章图片
#运维#bash
【大数据命令合集】Hive

一、启动类功能说明命令启动hiveserver2服务bin/hiveserver2启动beelinebin/beeline连接hiveserver2beeline> !connect jdbc:hive2://hadoop102:10000metastroe服务bin/hive --service metastorehive 启动元数据服务(metastore和hiveserver2)和优雅

大数据调度系统对比

0.前言有了数据平台,有了数据仓库,那就需要一个系统来调度和管理数仓的任务,因此调度系统的地位可见之重要。没有工作流调度系统之前,公司里面的任务都是通过 crontab 来定义的,时间长了后会发现很多问题:大量的crontab任务需要管理;任务没有按时执行,各种原因失败,需要重试;多服务器环境下,crontab分散在很多集群上,日志查看不方便。于是,出现了一些管理crontab任务的调度系统。而在

大数据迁移项目的指南

每个步骤都需要严谨细致的管理与执行,确保整个迁移项目的成功。在整个过程中,充分沟通、风险控制、质量管理、变更管理都是至关重要的环节。建立数据映射规则:在不同数据模型间转换数据时,定义字段映射关系。创建并执行小规模迁移试验,验证迁移过程和结果是否符合预期。迁移完成后进行全面的数据校验,确保新旧系统间的数据一致性。设计详细的迁移流程:包括备份策略、迁移顺序、回滚计划等。执行迁移计划,在特定的时间窗口内

文章图片
大数据权限管理框架:Apache Sentry和Ranger

一、简介Apache Sentry:Sentry是由Cloudera公司内部开发而来的,初衷是为了让用户能够细粒度的控制Hadoop系统中的数据(这里主要指HDFS,Hive的数据)。所以Sentry对HDFS,Hive以及同样由Cloudera开发的Impala有着很好的支持性。Apache Ranger:Ranger则是由于另一家公司Hortonworks所主导。它同样是做细粒度的权限控制。但

文章图片
    共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择