logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据组件的WAL机制的架构设计原理对比

HBase 的 HLog 滚动清理 vs 长时间保留(增加恢复选项但占用存储)ZooKeeper 同步刷盘(强一致) vs Flink 异步刷盘(高性能)增量快照(如 Flink 的 Changelog)可能部分替代传统 WAL。:通过“日志先行”在性能与可靠性之间取得平衡,但需根据场景优化配置。:选择 ZooKeeper 或 HBase(同步 WAL)。存储硬件(如 NVMe)提升 WAL 的写

#大数据#数据库架构#架构
Hadoop历史服务器jobhistory详解

  Hadoop自带了一个历史服务器,可以通过历史服务器查看已经运行完的Mapreduce作业记录,比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下,Hadoop历史服务器是没有启动的,我们可以通过下面的命令来启动Hadoop历史服务器$ sbin/mr-jobhistory-daemon.sh start his...

hadoop集群之HDFS和YARN启动和停止命令

假如我们只有3台linux虚拟机,主机名分别为hadoop01、hadoop02和hadoop03,在这3台机器上,hadoop集群的部署情况如下:hadoop01:1个namenode,1个datanode,1个journalnode,1个zkfc,1个resourcemanager,1个nodemanager;hadoop02:1个namenode,1个datanode,1个jour...

数据仓库基础知识

数据仓库数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。——数据仓库之父--Bill Inmon数据仓库基本特性面向主题性面向主题性表

hadoop集群之HDFS和YARN启动和停止命令

假如我们只有3台linux虚拟机,主机名分别为hadoop01、hadoop02和hadoop03,在这3台机器上,hadoop集群的部署情况如下:hadoop01:1个namenode,1个datanode,1个journalnode,1个zkfc,1个resourcemanager,1个nodemanager;hadoop02:1个namenode,1个datanode,1个jour...

Linux Shell系列教程之(九)Shell判断 if else 用法

Linux Shell系列教程之(九)Shell判断 if else 用法if 语句通过关系运算符判断表达式的真假来决定执行哪个分支。Shell 有三种 if else格式:if … fi 格式if … else … fi 格式if … elif … else … fi 格式下面我就分别就这几种格式来为大家详细介绍下。一、Shell判断语法之if … else ...

/bin/bash^M: bad interpreter: No such file or directory

今天对系统的代码结构重新划分模块,通过内部部署系统进行部署,发现报了一个错误:/bin/bash^M: bad interpreter: No such file or directory看这情况应该是和编码有关,以为自己的文件编码有问题,重新设置编码再上传,还是一样报错,就想说在Linux里直接打印文件编码格式,通过以下命令打印在Vim中可以直接查看文件编码:set fileenc...

Kafka中是怎么体现消息顺序性的?

Kafka中是怎么体现消息顺序性的?Kafka只能保证分区内消息顺序有序,无法保证全局有序生产者:通过分区的leader副本负责数据顺序写入,来保证消息顺序性消费者:同一个分区内的消息只能被一个group里的一个消费者消费,保证分区内消费有序为什么做不到全局有序:因为消息会发送到不一样的分区,分区之间发送的顺序是无法保证的如何做到并发且全局有序?解题思路并发可以在发送端并发也可以在消费端并发,并发

Hive APIs 概览--官网中文翻译

目录API 类型基于操作的API基于查询的API可用的APIHCatClient (Java)HCatalog存储处理程序(Java)HiveServer2 APIHCatalog CLI(命令行)Metastore (Java)Hive (Java)Driver (Java)WebHCat (REST)Streaming Data ...

HCatalog架构分析--官网中文翻译

目录概览HCatalog 架构接口数据模型数据流实例HCatalog Web API概览HCatalog是Hadoop的表和存储管理层,允许使用不同数据处理工具(Pig和MapReduce)的用户更容易地在网格上读写数据。HCatalog的表抽象为用户提供了Hadoop分布式文件系统(HDFS)中数据的关系视图,并确保用户不必担心数据存储在何处或以何种格式存储...

    共 11 条
  • 1
  • 2
  • 请选择