程序员 Harry 个人主页

@weixin_46376562

程序员 Harry

2022-11-24 12:45:03 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Zookeeper 完全分布式（3.5.7）部署（清爽版）

zookeeper 3.5.7 完全分布式安装小白入门

#zookeeper #分布式 #linux

Hadoop 完全分布式（3.1.3）部署（清爽版）

清爽版

#hadoop #大数据 #分布式

mybatis-plus 通过 updateById 更新部分字段数据时出现所有数据被更新（被设为默认值）

通过传入的 id 进行数据更新，默认只更新设置数据的字段。

#mybatis #java #spring boot

Spark 优化（性能优化、解决数据倾斜）

性能优化、数据倾斜名称说明–num-executorsexecutor数量–executor-memoryexecutor内存（影响不大）–executor-cores每个executor的CPU core数–driver-memoryDriver内存举个栗子：资源一共：400G内存、100 core参考分配：50个executore、每个executor8G、2 core设置合理的并行度，官方推

#spark #性能优化 #大数据

flume 无法写数据到 hdfs

问题呈现：flume启动后一直停在sink已经启动。。。控制台看不到报错信息。。。hdfs上查看不到数据。。。解决方法：检测是否为kafka问题，因为消费的是Kafka中的数据。1）使用 kafka-consumer-groups.sh 检测消费情况2）不断生成新的数据，发现数据会被 flume 消费（但没有写入 hdfs ）检测是否为 flume 问题新建一个简单的 flume 配置文件，

#大数据 #hadoop #flume

在 docker 中快速启动 Apache Hive

在伪分布式模式下，在Docker容器内运行Apache Hive，可以提供以下功能：快速启动/调试/为Hive准备测试环境。

#docker #apache #hive

Hadoop高可用集群搭建（超详细）

节点布置IP主机名描述部署软件192.168.200.201hadoop-01主节点jdk,hadoop,zookeeper192.168.200.202hadoop-02备用主节点jdk,hadoop,zookeeper192.168.200.203hadoop-03数据服务节点jdk,hadoop,zookeeper配置静态IP# 有的可能为 ifcfg-ens33vi /etc/syscon

#hadoop #大数据

zookeeper集群环境搭建（一键启动）

- 下载zookeeper安装包zookeeper-3.4.10.tar.gz- 解压安装包tar -zxvf zookeeper-3.4.10.tar.gz- 配置zoo.cfg文件修改zookeeper中conf目录下的zoo_sample.cfg为zoo_sample.cfg1. mv zoo_sample.cfgzoo.cfg2. vi zoo.cfg修改一下内容：- 配置myid文件在z

#zookeeper #linux #centos +2

hbase的HQuorumPeer和QuorumPeerMain

分布式的hbase如何启动？首先启动hadoop，然后就来问题了：zookeeper和hbase的启动顺序是什么？1,先启动hbase:hbase有内置的zookeeper，如果没有装zookeeper，启动hbase的时候会有一个HQuorumPeer进程。2.先启动zookeeper：如果用外置的zookeeper管理hbase，则先启动zookeeper，然后启动hbase，启动后会有一个Q

#hadoop #hbase #大数据

SparkStreaming消费kafka数据时出现序列化问题 org.apache.kafka.common.serialization.StringDeserializer could not b

查了好多资料，说什么类加载机制什么的，但改了依然无效，经查阅Spark官方文档和kafka官方的文档后，得以解决，不得不说，官方文档还是厉害环境，pom文件如下：IntelliJ IDEA 2022.1.2 (Ultimate Edition)官方文档kafka 官方文档SparkStreaming 官方文档报错写法（后来也是可以用的）......

#kafka #spark

共 14 条

请选择