Apache HBase官方版是一款非常专业的Hadoop数据库管理工具,我们可以通过这款软件来随时随地读取访问各种大数据。并且这款软件还可以用来低延迟访问数十亿条记录中的单行,非常强大。
Apache HBase是Hadoop数据库是一个分布式、可扩展的大数据存储,当你需要随机、实时地读/写访问你的大数据时,请使用Apache HBase,Apache HBase是一个开源的、分布式的、版本化的、非关系型的数据库,以Google的Bigtable为模型。正如Bigtable利用谷歌文件系统提供的分布式数据存储一样,Apache HBase在Hadoop和HDFS之上提供了类似Bigtable的功能。
线性可扩展。
一致的读写。
表的自动和可配置分片
对区域服务器的自动故障转移支持。
与Hadoop集成,作为源和目标。
易于使用的基于Java的API用于客户端访问。
低延迟访问数十亿条记录中的单行。
快速查找较大的表。
Thrift网关和支持XML,Protobuf和二进制数据编码选项的REST-ful Web服务
可扩展的基于Jruby的(JIRB)Shell
支持通过Hadoop指标子系统将指标导出到文件或Ganglia;或通过JMX
1.Native Java API,最常规和高效的访问方式,适合Hadoop MapReduce Job并行批处理HBase表数据
2.HBase Shell,HBase的命令行工具,最简单的接口,适合HBase管理使用
3.Thrift Gateway,利用Thrift序列化技术,支持C++,PHP,Python等多种语言,适合其他异构系统在线访问HBase表数据
4.REST Gateway,支持REST 风格的Http API访问HBase, 解除了语言限制
5.Pig,可以使用Pig Latin流式编程语言来操作HBase中的数据,和Hive类似,本质最终也是编译成MapReduce Job来处理HBase表数据,适合做数据统计
6.Hive,当前Hive的Release版本尚没有加入对HBase的支持,但在下一个版本Hive 0.7.0中将会支持HBase,可以使用类似SQL语言来访问HBase