logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hadoop集群搭建-完全分布式

Hadoop 是一个开源框架,主要用于存储和处理大规模数据集,特别是在集群环境下。它最初由 Apache Software Foundation 开发,并且已经成为大数据处理领域的重要组成部分。Hadoop 提供了一种高效、可靠的方式来存储、处理和分析大量数据,支持分布式计算模型。HDFS 是一种分布式文件系统,设计用来存储大量的数据,并且能够提供高吞吐量的数据访问能力。集群里主要角色有:Name

文章图片
#分布式#hadoop#大数据
大数据Hive安装与配置

Hive 是一个构建在 Hadoop 之上的数据仓库工具,用于数据的提取、转换和加载(ETL),并提供了一种类 SQL 的查询语言(HiveQL),使用户能够轻松查询和分析大规模数据集。

文章图片
#大数据#hive#hadoop
到底了