
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、了解HBase1.1 HBase简介HBase是Apache的Hadoop项目的子项目HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库建立在Hadoop文件系统之上的分布式面向列的数据库属于开源项目,可以进行横向扩展适用于需要实时地随机访问超大规模数据集的场景不支持关系型数据库的SQL,是以键值对的方式按列存储1.2 HBase与Hadoop之间的关系非常紧密Hadoo

一、认识大数据1.1 大数据定义指无法在一定时间范围内用常规软件工具进行捕捉、管理 和处理的巨量数据集合需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产数据1.2 大数据特点数据体量巨大。数据量大是大数据的显著特点,按目前的发展趋势看,大数据的体量已经达到 PB 甚至 EB级。大数据的数据类型多样,以非结构化数据为主。如:网络日志、音频、视频、 图片、

Kubernetes+EFK日志分析系统部署资源列表操作系统配置主机名/IpCentOS7.32C2Gk8sinit/172.16.10.10CentOS7.32C2Gk8smaster1/172.16.10.11CentOS7.32C2Gk8snode1/172.16.10.12CentOS7.32C2Gk8snode2/172.16.10.13一、基础环境所有节点都要执行

一、了解CDH在众多 Hadoop 版本中, CDH 是 Hadoop 众多分支中比较出色的版本, 它由Cloudera 发行和维护。CDH 基于 Apache 的 Hadoop 进行重新构建,提供了基于 Web 页面的群集部署和管理操作。1.1 Hadoop属于开源软件,采用Apache 2.0许可协议官方版本称为社区版Hadoop1.2 比较流行Hadoop版本Apache Hadoop维护人
