
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
优势体现在以下几点:(1)不局限于HDFS存储,可以防止HDFS存储上局限性,综合OLTP,MPP,Hadoop等各个引擎优势,将各种数据存储到最合适引擎上。(2)1个平台不仅能够处理结构化数据和非结构化数据,而且能够同时覆盖OLTP和OLAP处理。(3)完全的引擎可插拔式,不仅能够融合开源产品,也能够融合开源化产品和商用化产品。(4)对于SQL操作,MPP的综合能力优于SQL on Hadoop
在一个数据库(Database)中含有基本表、视图、索引等数据库对象。数据库的创建、选择是在 GBase 8a 中开始数据库设计、内容查找的第一步。1.创建数据库在打开一个 GBase 8a 后,我们首先要做的第一步是创建一个全新的数据库。在 GBase 8a中我们可以创建 4 种类型的数据库。(1)不记录日志,其语法结构为:CREATE DATABASE <数据库名>(2)缓冲式的记
目前不支持本地文件的加载,数据文件可以放在任意通用的ftp、http、hadoop服务器上。目前数据来源只能是文件方式存放,不支持命名管道,因为linux下命名管道不支持远程,并且不能预先获取文件大小。...
通常建议2分片采用分片数主要基于三方面因素考虑:1、性能;2、木桶效应;3、快速扩容。单分片的性能最好,单分片存在木桶效应的原因是当有1个节点离线时,该节点分片 所在的副本分片所在的节点将承担两倍的工作,因此理论上性能下降最多1倍,性能最多下降1倍的前提是在节点没有离线前,每个节点的资源使用已经比较高(cpu,io,内存都使用了80-90%)的情况下,1个节点离线时,该节点分片所在的副本分片资源已
单表查询是指仅涉及一个表的查询,它是所有查询实现的基础,其查询方法和相关语法可直接应用到多表等各种复杂的操作中。1.选择表中的若干列如果用户只对表中的一部分属性列感兴趣,则可以在 SELECT 后面的<列表达式>中指定要查询的属性列,它对应于关系代数中的投影运算,选择表中列的相关操作说明见表 1.8。表 1.8 选择表中列的相关操作说明2.选择表中的若干行通过 WHERE 子句可以选择
数据分布均匀是保证GBas8a集群高效并行处理能力的基础。因此定义表时,如何选用HASH分布策略,保证数据分布均匀是获取高性能的关键所在。选择的依据遵从四大原则:第一个就是首先保证所有节点数据存放是均匀的,避免出现节点出现数据分布过多或过少情况;第二,如果经常进行大表连接,尽量把连接字段定义成hash分布字段,这样尽量减少无效的节点间拉表操作;第三,尽量保证where条件产生的结果集的存储也尽量是
1.创建基本表或临时表在 GBase 8a 中,创建表的语法格式为:CREATE [TEMP] TABLE <表名>(<列名 1> <数据类型> [列级完整性约束],<列名 2> <数据类型> [列级完整性约束],…[表级完整性约束 1],[表级完整性约束 2],…) [IN “<表的存放路径>”];其中 TEMP 表示建的表
南大通用统一数据平台系统,简称:GBase UP,它是融合了GBase 8a MPP、GBase 8s、开源Hadoop生态系统的大数据平台产品,兼顾大规模分布式并行数据库集群系统、稳定高效的事务数据库,以及Hadoop生态系统的多种大规模结构化与非结构化数据处理技术,能够适应OLAP、OLTP和NOSQL三种计算模型的业务场景,是构建企业数据平台的重要基础设施。借助GBase UP,企业可以在实
GBase 8a保持关系型数据库特征,保证数据的完整性,但架构类似Hadoop,因此称为NewSQL;Hadoop放弃关系模型,称为NoSQL,主要面向互联网等非结构化数据的计算模型。