大数据技术原理与应用考试复习

文章目录第一章第二章第三章第四章第五章 NoSQL第一章信息科技为大数据时代提供技术支撑存储设备容量不断增加CPU处理能力大幅提升网络带宽不断增加大数据的“4V”数据量大数据种类繁多处理速度快价值密度低大数据关键技术两大核心技术：分布式存储 HDFS 和分布式处理 MapReduce大数据与云计算、物联网的关系第二章Hadoop特性高可靠性高效性高可扩展性高容错性成本低运行在Linux平台上支持

Sparky*

3668人浏览 · 2020-11-12 21:40:10

Sparky* · 2020-11-12 21:40:10 发布

文章目录

第一章概述
第二章 hadoop
第三章 hdfs
第四章 Hbase
第五章 NoSQL

第一章概述

在这里插入图片描述
信息科技为大数据时代提供技术支撑

存储设备容量不断增加
CPU处理能力大幅提升
网络带宽不断增加

大数据的“4V”

数据量大
数据种类繁多
处理速度快
价值密度低

大数据关键技术
两大核心技术：分布式存储 HDFS 和分布式处理 MapReduce

在这里插入图片描述

大数据与云计算、物联网的关系

第二章 hadoop

在这里插入图片描述
Hadoop特性

高可靠性
高效性
高可扩展性
高容错性
成本低
运行在Linux平台上
支持多种编程语言

在这里插入图片描述

第三章 hdfs

HDFS要实现以下目标：
在这里插入图片描述
HDFS默认一个块64MB

在这里插入图片描述

第四章 Hbase

在这里插入图片描述

Region的定位

HBase的三层结构中各层次的名称和作用

HBase系统架构

在这里插入图片描述
Region服务器工作原理

HLog：磁盘上的记录文件
Store：存储了表中的一个列族
MemStore：内存中的缓存，保存最近更新的数据
StoreFile：磁盘中的文件

用户读写数据过程

用户写入数据时，被分配到相应Region服务器去执行
用户数据首先被写入到MemStore和Hlog中
只有当操作写入Hlog之后，commit()调用才会将其返回给客户端
当用户读取数据时，Region服务器会首先访问MemStore缓存，如果找不到，再去磁盘上面的StoreFile中寻找

在这里插入图片描述

第五章 NoSQL

NoSQL数据库具有以下几个特点：
在这里插入图片描述

Linux

更多推荐

Linux虚拟文件系统之文件系统卸载（sys_umount())

Linux中卸载文件系统由umount系统调用实现，入口函数为sys_umount()。较于文件系统的安装较为简单，下面是具体的实现。1. /*sys_umont系统调用*/2. SYSCALL_DEFINE2(umount, char __user *, name, int, flags)3. {4.struct path path;

Linux

网卡速率和双工模式的配置

http://linux.chinaitlab.com/system/792187.html1、mii-tool 配置网络设备协商方式的工具； 1.1 mii-tool 介绍； mii-tool - view, manipulate media-independent interface status （mii-tool 是查看，管理介质的网络接口的状态）

Linux

Linux系统下超级终端Minicom的使用方法（例如：连接交换机，路由器等）转http://baike.baidu.com/view/2911642.htm?fr=ala0_1

Linux系统下超级终端Minicom的使用方法 　　Linux下的Minicom的功能与下的超级终端功能相似，适于在通过超级终端对设备的管理以及对嵌入操作系统的升级，现写出Minicom的使用手册： 　　1．启动minicom 　　以root权限登录系统 　　使用命令 　　minicom –s 则minicom启动，屏