发布于 2018-01-17 08:17:01 | 92 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的HBase教程,程序狗速度看过来!

HBase分布式面向列的开源数据库

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。


Apache HBase 2.0.0 的首个 Beta 版已发布,Apache HBase 2.0.0-beta-1 是 2.0 版本的非生产预览版,包含之前 alpha 版本中的所有新特性 (new assignment manager, offheap read/write path, in-memory compactions 等),可点此查看 2.0 的完整新特性。

官方表示在 2 月底发布第一个 2.0.0 候选版之前,会再发布一个测试版 2.0.0-beta-2。它的重点是使用户可以尝试从 hbase-1.x 滚动升级到 hbase-2.x(以及发现运行 beta-1 的任何错误修复)。

详细内容请查看发布主页

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。

上图描述了Hadoop EcoSystem中的各层系统,其中HBase位于结构化存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。

此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。



历史版本 :
分布式数据库 Apache HBase 2.0.0 首个 Beta 版发布
分布式数据库 Apache HBase 1.4.0 带来新功能和改进
Apache HBase 1.1.13 发布,分布式数据库
Apache HBase 2.0.0-alpha-2 发布,分布式数据库
Apache HBase 1.1.11 发布,分布式数据库
Apache HBase 1.1.10 发布,分布式数据库
Apache HBase 1.2.5 发布,分布式数据库
Apache HBase v1.3 发布,分布式数据库
Apache HBase v1.2.3 发布,分布式数据库
Apache HBase 1.2.1 发布,分布式数据库
HBase 1.1.1 发布下载,分布式数据库
Apache HBase v1.0 发布,分布式数据库
最新网友评论  共有(0)条评论 发布评论 返回顶部
月排行榜

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务