nsjd.net
当前位置:首页 >> GrEEnPlum和HADoop什么关系 >>

GrEEnPlum和HADoop什么关系

GreenPlum的组件分成三个部分MASTER/SEGMENT以及MASTER与SEGMENT之间的高效互联技术GNET。其中MASTER和SEGMENT本身就是独立的数据库SERVER。不同之处在于,MASTER只负责应用的连接,生成并拆分执行计划,把执行计划分配给SEGMENT节点,以及返回...

GreenPlum采取的是PostgreSql框架,是PostgreSql系的重要应用。从这个角度上可以知道GreenPlum是关系型数据库。Hadoop框架是一种分布式的平台设计理念。它本身不是数据库。其中Impala可以认为是一种非关系型的数据库, Hive相当于SQL。

主流服务器一般由多个NUMA节点组成,每个NUMA节点是一个SMP结构,一般由多个CPU组成,并且具有本地内存和IO设备。 NUMA节点可以直接访问本地内存,也可以通过NUMA互联模块访问其他NUMA节点的内存,但是访问本地内存的速度远远高于远程访问速度,...

gp的定位是mpp产品,与hadoop的定向不一样,并且处于市场竞争关系。gp大数据并行处理的时延低,主要用来做并发查询与即席查询。而hadoop从数据的安全性,数据处理吞吐已经数据量为重,处理数据时的时延较高。不过gp是采用master-slave的share no...

严格的说,GP和hadoop都是属于大数据平台。 GP属于MPP产品,master-slave的share nothing架构,数据以leader-mirror数据分布存储在磁盘上,对大量数据处理和简单实时查询比较擅长,但是缺点也比较明显,第一是不擅长数据倾斜场景,第二是数据量...

MPP是一种海量数据实时分析架构。 MPP作为一种不共享架构,每个节点运行自己的操作系统和数据库等,节点之间信息交互只能通过网络连接实现。 MPP架构目前被并行数据库广泛采用,一般通过scan、sort和merge等操作符实时返回查询结果。目前采用MPP...

gp 可以处理大量数据, hadoop 可以处理海量. gp 只能处理湖量,或者河量. 无法处理海量.

gp 可以处理大量数据, hadoop 可以处理海量. gp 只能处理湖量,或者河量. 无法处理海量.

GreenPlum采取的是PostgreSql框架,是PostgreSql系的重要应用。从这个角度上可以知道GreenPlum是关系型数据库。Hadoop框架是一种分布式的平台设计理念。它本身不是数据库。其中Impala可以认为是一种非关系型的数据库, Hive相当于SQL。

二者处理数据的思路是一样的, 分布式并行处理, 某种程度上也都能完成同样的工作. 但mpp仍是关系型数据库技术, 能较好支持SQL, 使用更方便 (举例:GreenPlum) hadoop是开源平台, 本身不是数据库, 但可处理非结构化数据, 这点关系数据库很难做到.

网站首页 | 网站地图
All rights reserved Powered by www.nsjd.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com