大数据技术原理与应用考试复习
文章目录第一章第二章第三章第四章第五章 NoSQL第一章信息科技为大数据时代提供技术支撑存储设备容量不断增加CPU处理能力大幅提升网络带宽不断增加大数据的“4V”数据量大数据种类繁多处理速度快价值密度低大数据关键技术两大核心技术:分布式存储 HDFS 和 分布式处理 MapReduce大数据与云计算、物联网的关系第二章Hadoop特性高可靠性高效性高可扩展性高容错性成本低运行在Linux平台上支持
·
第一章 概述
信息科技为大数据时代提供技术支撑
- 存储设备容量不断增加
- CPU处理能力大幅提升
- 网络带宽不断增加
大数据的“4V”
- 数据量大
- 数据种类繁多
- 处理速度快
- 价值密度低
大数据关键技术
两大核心技术:分布式存储 HDFS 和 分布式处理 MapReduce
大数据与云计算、物联网的关系
第二章 hadoop
Hadoop特性
高可靠性
高效性
高可扩展性
高容错性
成本低
运行在Linux平台上
支持多种编程语言
第三章 hdfs
HDFS要实现以下目标:
HDFS默认一个块64MB
第四章 Hbase
Region的定位
HBase的三层结构中各层次的名称和作用
HBase系统架构
Region服务器工作原理
- HLog:磁盘上的记录文件
- Store:存储了表中的一个列族
- MemStore:内存中的缓存,保存最近更新的数据
- StoreFile:磁盘中的文件
用户读写数据过程
用户写入数据时,被分配到相应Region服务器去执行
用户数据首先被写入到MemStore和Hlog中
只有当操作写入Hlog之后,commit()调用才会将其返回给客户端
当用户读取数据时,Region服务器会首先访问MemStore缓存,如果找不到,再去磁盘上面的StoreFile中寻找
第五章 NoSQL
NoSQL数据库具有以下几个特点:
更多推荐
已为社区贡献1条内容
所有评论(0)