
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
第一章 计算机系统概述内容摘抄自《王道——操作系统考研复习指导》知识框架概论{特征{并发共享虚拟异步目标和功能{计算机系统资源的管理者用户与计算机系统之间的接口{命令接口程序接口GUI扩充机器发展——批处理操作系统→分时操作系统→实时操作系统→网络和分布式系统运行机制{中断和异常系统调用体系结构{大内核微内核概论\begin{cases}特征\begin{cases}并发\\共享\\虚拟\\异步\
第8章 数据仓库Hive8.1 概述8.1.1 数据仓库概述数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成 的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant )的数据集合,用于支持管理决策。8.1.2 传统数据仓库面临的挑战(1)无法满足快速增长的海量数据存储需求(2)无法有效处理不同类型
第2章 大数据处理架构Hadoop2.1 Hadoop的特性1.高可靠性:采用冗余数据存储方式。2.高效性:采用分布式处理和存储两大核心技术。3.高可扩展性:运行在廉价的计算机集群上。4.高容错性:冗余数据存储,自动保存多个副本。5.成本低:运行在廉价的计算机集群上。6.运行在Linux平台上。7.支持多种语言。2.2 Hadoop应用现状2.3 Hadoop生态系统Mahout:Mahout
3.1 分布式文件系统3.1.1 计算机集群结构3.1.2 分布式文件系统的结构两类节点:1.主节点(Master Node) 或称为名称节点(NameNode)负责文件和目录的创建、删除和重命名等,同时管理着数据节点和文件块的映射关系。保存元数据(关于数据的数据)。2.从节点(Slave Node) 或称为 数据节点(DataNode)负责数据的存储和读取。3.采用多副本存储防止计算机集群
6.1 云数据库概述6.1.1 云数据库概念云数据库是部署和虚拟化在云计算环境中的数据库。云数据库是在云计算的大背景 下发展起来的一种新兴的共享基础架构的方法,它极大地增强了数据库的存储能力 ,消除了人员、硬件、软件的重复配置,让软、硬件升级变得更加容易。云数据库 具有高可扩展性、高可用性、采用多租形式和支持资源有效分发等特点。6.1.2 云数据库特性1.动态可扩展2.高可用性3.较低的使用代价4
第5章 NoSQL数据库5.1 NoSQL简介NoSQL是一种不同于关系数据库的数据库管理系统设计方式,是对非关系型数据库的统称。通常,NoSQL数据库具有以下几个特点:(1)灵活的可扩展性(2)灵活的数据模型(3)与云计算紧密融合5.2 NoSQL兴起的原因1.关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面:(1)无法满足海量数据的管理需求 、(2)无法满足数据高并发的需求(3
DataSet API文章目录DataSet API一.DataSet API介绍二.DataSet API1.DataSources数据接入1)文件类数据2)集合类数据3)通用数据接口4)第三方文件系统2.DataSet 转换操作1)数据处理2)聚合操作3)多表关联4)集合操作5)排序操作3.DataSinks数据输出1)基于文件输出接口2)通用输出接口三.迭代计算1.全量迭代2.增量迭代四.广







