啊帅和和。个人主页

@l_dsj

啊帅和和。

2022-09-29 18:53:39 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

分布式存储流程、介绍以及默认副本

目录分布式存储介绍分布式存储流程数据备份分布式存储介绍在分布式存储系统中，分散在不同节点中的数据可能属于同一个文件。为了组织众多的文件，把文件可以放到不同的文件夹中，文件夹可以一级一级的包含。我们把这种组织形式称为命名空间（namespace）。命名空间管理着整个服务器集群中的所有文件。集群中不同的节点承担不同的职责。负责命名空间职责的节点称为主节点（master node）负责存储真实数据职责的

#big data #hadoop

numpy中的cumsum()函数的使用

关于numpy.cumsum()在官网中官方给了一个很好的例子。cumsum的作用主要就是计算轴向的累加和。里面最重要的参数就是axis当里面的参数axis没有值时，默认是一个一维数组进行加和，即a=np.array([[1,2,3],[4,5,6]])np.cumsum()输出1,3,6,10,15,21即1,1+2,1+2+3,1+2+3+4,1+2+3+4+5,1+2+3+4+5+6np.c

#numpy #python

Hive数据仓库分层架构

目录一、为什么要进行数据分层？数据分层的好处？1、原因2、好处二、hive数仓分为哪几层？1、ODS层:数据运营层（贴源层）2、DW层：数据仓库层(1)DWD层：数据明细层(2)DWM层：数据中间层(3)DWS层：数据汇总层（服务）3、ADS层：应用层一、为什么要进行数据分层？数据分层的好处？1、原因对数据进行分层的一个主要原因就是希望在管理数据的时候，能对数据有一个更加清晰的掌控。2、好处清晰

#spark #sql #big data

Flink sql入门篇-概念、初步实现

目录Flinksql入门前的概念物化视图动态表和连续查询在流上定义表连续查询更新和追加查询查询限制表到流的转换初步实现Flinksql导入依赖实现Flinksql进一步实现Flinksql，全程sqlFlinksql入门前的概念想要搞清楚flink如何使用sql进行处理，我们首先要搞清楚动态表的概念，我们可以先进入flink官网查看，hive中的表是静态的，而这里处理的数据是流式，处理的表是动态的

#spark #big data #大数据

C语言编程题目及答案分享——持续更新

注意别丢精度int m=1;m = m+2;f = -f;printf("pi的近似值为：%f",sum*4);

深入理解MapReduce

目录MapReduce概述（是一个做计算的程序）MapReduce原理Shuffle过程MapReduce执行过程-map阶段MapReduce执行过程-reduce阶段shell端实现mapreduce准备数据实现mapreduce开始执行查看结果Java操作mapreduceMapReduce概述（是一个做计算的程序）MapReduce是一种分布式（一个计算逻辑，多个机器去实现）计算模型，由G

#hadoop #big data #python

Hive数据仓库分层架构

#spark #sql #big data

数据治理要点

数据治理。

#数据库 #大数据 #sql

云计算的三大类型

通过这个图可以很清晰的了解云计算的几大类型，首先第一个 “On Premises”不做太大考虑，这个需要所有的东西都自己完成，配置网络、配置虚拟机、配置环境、数据，程序都自己完成第二个简称IAAS,在这里，我们可以将服务器什么的从别处索取，比如购买阿里云的服务器，但是类似于jdk这类的环境需要自己搭建，数据需要自己导入，剩下的内容都需要自己玩第三个简称PAAS，在这里，环境也不需要自己考虑，自己只

#云计算 #阿里云

Linux中安装Python3和TensorFlow并做一些测试。

1.将Python压缩包解压缩到modules2.移动到指定目录usr/localsudo cp -r /opt/modules/python3 /usr/local/python3.进入目录cd /usr/local/python安装依赖包yum -y install zlib* openssl*运行 sudo ./configure 出错原因是没有c编译器，要安装gccsudo yum ins

#python #tensorflow

到底了