logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

zookeeper的分布式搭建

文章目录1、上传安装包到master并解压2、配置环境变量3、修改配置文件4、同步到其它节点5、创建/usr/local/soft/zookeeper-3.4.6/data目录,所有节点都要创建6、启动zk7、重置zk1、上传安装包到master并解压tar -xvf zookeeper-3.4.6.tar.gz2、配置环境变量vim /etc/profileexport ZOOKEEPER_HO

#zookeeper#分布式#云原生
pandas数据分析之数据清洗(上)

1、预备知识-python核心用法常用数据分析库(上)文章目录1、预备知识-python核心用法常用数据分析库(上)概述实验环境任务一:环境安装与配置【实验目标】【实验步骤】任务二:Pandas数据分析实战【任务目标】【任务步骤】概述Python 是当今世界最热门的编程语言,而它最大的应用领域之一就是数据分析。在python众多数据分析工具中,pandas是python中非常常用的数据分析库,在数

#数据分析#python#数据挖掘
面对百亿数据,HBase为什么查询速度依然非常快?

文章目录面对百亿数据,HBase为什么查询速度依然非常快?查询过程第1步:第2步:第3步:第4步:总结面对百亿数据,HBase为什么查询速度依然非常快?HBase适合存储PB级别的海量数据(百亿千亿量级条记录),如果根据记录主键Rowkey来查询,能在几十到百毫秒内返回数据。那么HBase是如何做到的呢?接下来,简单阐述一下数据的查询思路和过程。查询过程第1步:项目有100亿业务数据,存储在一个H

#hbase#big data#hadoop
HBase的RowKey设计

HBase的RowKey设计文章目录HBase的RowKey设计rowkey长度原则rowkey散列原则rowkey唯一原则热点问题加盐哈希反转时间戳反转其他一些建议HBase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这个三个维度可以对HBase中的数据进行快速定位。HBase中rowkey可以唯

#hbase#big data#数据库
到底了