logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Pulsar 安装完整版——pulsar2.4.1

@羲凡——只为了更好的活着Pulsar 安装完整版——pulsar2.4.1pulsar自从腾讯使用后各种火,最近查看官方文档,实操后整理了一份安装手册,贡献给大家安装分一下几步:零、前期准备一、部署ZooKeeper集群二、初始化集群元数据三、部署BookKeeper集群四、部署Pulsar brokers安装pulsar2.4.1官网要求每台机器安装至少Java1.8的环境...

Clickhouse 集群安装(完整版)

@羲凡——只为了更好的活着Clickhouse 集群安装(完整版)前期准备安装zookeeper集群步骤1.先安装四个单机的clickhouse2.在四台机器上新建 /etc/metrika.xml 文件,生成两分片两副本集群一、安装单机clickhouse(四台都操作,以Centos为例)官网Centos/Ubuntu/Docker安装1.1.在线安装yum install yum-utilsr

#clickhouse
Doris 编译安装(完整版)

@羲凡——只为了更好的活着Doris 编译安装(完整版)前期准备安装java8、mysql、docker安装java8、mysql 这个基本操作,晚上也有很多例子,我就不赘述了。安装docker,这有两个博客拿走不谢(Centos7和Ubuntu)集群规划可能有小白会问,为啥只有 FE-Follower ,却没有FE-Leader?因为Leader是从Follower中选举出来的,如果自由一个Fo

#数据库
ZooKeeper 安装完整版——ZooKeeper3.4.6

@羲凡——只为了更好的活着ZooKeeper 安装完整版——ZooKeeper3.4.61.下载地址如下:https://archive.apache.org/dist/zookeeper/zookeeper-3.4.6/2.安装第1步:在deptest3 机器的 /usr/local/package 目录下解压 zookeeper-3.4.6.tar.gztar -zxf zook...

#zookeeper
Linux 每天删除一个月前的日期文件

@羲凡——只为了更好的活着Linux 每天删除一个月前的日期文件公司中总有一些按照日期来命名的文件夹(比如日志文件等),需要定时的删除一个月以前或两个月以前的历史数据。假如 /aarontest/data/ 目录下存放在一下文件夹20181122123456201812121234562018122212345620190122123456现在要删除30天前的文件夹,执行脚本如下...

#linux
SparkStreaming 读取kafka中数据(spark2.3.2)

@羲凡——只为了更好的活着SparkStreaming 读取kafka中数据(spark2.3.2)流处理一般都会涉及到kafka,所以用SparkStreaming读取kafka中数据是流处理的必备技能之一。1.先在pom.xml文件中添加${spark.version} 即你的spark的版本,我spark是spark 2.3.2。我kafka是kafka_2.11-0.10.2.2...

#kafka
Flink 消费kafka数据写入hbase

@羲凡——只为了更好的活着Flink 消费kafka数据写入hbase一.前提准备1.创建Hbase表create 'test_20191122','info'2.pom.xml文件中要添加依赖<dependency><groupId>org.apache.hbase</groupId><artifactId>hbase-cli...

#flink#kafka#hbase
Flink 读取kafka数据写入Pulsar(含报错The implementation of the RichSinkFunction is not serializable)

@羲凡——只为了更好的活着Flink 读取kafka数据写入Pulsar(含报错The implementation of the RichSinkFunction is not serializable)开始之前务必检查自己kafka、pulsar和flink的版本,在pom中添加正确依赖本人kafka(0.11)、pulsar(2.4.1)和flink(1.7.2),切记版本不一样,代码...

#flink
Clickhouse 分布式子查询——global in/join(慎用慎用)

@羲凡——只为了更好的活着Clickhouse 分布式子查询——global in(慎用慎用)不能一味的追求查询效率,将分布式子查询都改成global in,一定要结合业务逻辑假设:有一个分布式表,字段班级、姓名、年龄,ck集群有两个分片classnameage102EEE10102GGG10103DDD8103BBB9103AAA10103CCC10103GGG111、建表语句CREATE TA

到底了