logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Linux网络配置

Linux网络配置二、主机名配置二、防火墙配置三、network配置1.配置network前先禁用网络管理服务2. 配置network3.在Windows下查看是否能够ping通配置的虚拟机4.查看虚拟机IP地址方法二、主机名配置#查看主机名hostname#修改主机名HOSTNAMEhostnamectl set-hostname HOSTNAME示例:默认主机名为localhost.local

#linux
Lunix下大数据相关软件安装及配置(更新至Kafka)

1.软件版本介绍软件名安装包名Mysqlmysql57-community-release-el7-9.noarch.rpmJDKjdk-8u171-linux-x64.tar.gzHadoophadoop-3.1.3.tar.gzHiveapache-hive-3.1.2-bin.tar.gzZeppelinzeppelin-0.8.2-bin-all.tgzZookeeperapache-zo

#大数据
Linux下hadoop相关配置

文章目录Linux下hadoop相关配置Linux下做免密登录hadoop 环境变量配置core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xml启动服务Linux下hadoop相关配置Linux下做免密登录ssh-keygen -t rsacd ~/.sshcat id_rsa.pub>>authorized_keyshadoop 环

#linux
大数据——环境搭建

一、Docker介绍Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从 Apache2.0 协议开源。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 app),更重要的是容器性能开销极低。Docker 从 17.03 版本

#大数据#数据仓库
HBase编程(表结构创建和删除、单条和批量插入数据)

1.创建一个Maven工程JDK版本1.8Hadoop版本3.1.3Zookeeper版本3.5.7HBase版本2.3.5导入依赖<dependency><groupId>org.apache.hbase</groupId><artifactId>hbase-client</artifactId><version>2.3.5

#hbase#大数据#java
Lunix下大数据相关软件安装及配置(更新至Kafka)

1.软件版本介绍软件名安装包名Mysqlmysql57-community-release-el7-9.noarch.rpmJDKjdk-8u171-linux-x64.tar.gzHadoophadoop-3.1.3.tar.gzHiveapache-hive-3.1.2-bin.tar.gzZeppelinzeppelin-0.8.2-bin-all.tgzZookeeperapache-zo

#大数据
大数据——kafka2.8.0介绍

2021年4月19日,Kafka 2.8.0正式发布!这次升级包括了很多重要的改动,其中最引人瞩目的就是kafka通过自我管理的仲裁来替代ZooKeeper,通俗的说,Kafka将不再需要ZooKeeper,正式分手!1. Kafka概述Kafka是一个分布式、支持分区的(partition)、多副本的(replica),多订阅者的消息发布订阅系统,常见可以用于web/nginx日志、访问日志,消

#kafka
大数据——Sqoop常用命令及应用场景

一、Sqoop概述Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。对于某些NoSQL数据库它也提供了连接器。Sqoop,类似于其他ETL工具,使

#sqoop#大数据
Log4j使用教程

日志是应用软件中不可缺少的部分,Apache的开源项目log4j是一个功能强大的日志组件,提供方便的日志记录。在apache网站:jakarta.apache.org/log4j可以免费下载到Log4j最新版本的软件包。Maven工程中依赖如下:<dependency><groupId>log4j</groupId><artifactId>log4j

#java#log4j
大数据—— Spark Core 知识点整理

1. Spark 和 Hadoop 相比有什么优势运行速度快:Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是Hadoop MapReduce的10倍以上,如果数据从内存中读取,速度可以高达100多倍。适用场景广泛:大数据分析统计,实时数据处理,图计算及机器学习易用性:编写简单,支持80种以上的高级算子,支持多种语言,数据源丰富,可部署在

文章图片
#spark#big data#大数据
    共 24 条
  • 1
  • 2
  • 3
  • 请选择