第二章 大数据Hadoop生态圈之Hbase

网友投稿 260 2022-11-25

第二章 大数据Hadoop生态圈之Hbase

(一)概念与特性

hbase是建立在hdfs之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化的半结构化的松散数据。与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。

(二)hbase表结构

HBase中的表一般有这样的特点:

大:一个表可以有上10亿行,上100万列面向列:面向列(族)的存储和权限控制,列(族)独立检索。稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。hbase表中,只支持一种数据类型:byte[]hbase的表中,列族和kv都会自动排序,排序的规则是按照列族名和列名的字典顺序行也会排序,根据行健的字典顺序

(三)逻辑视图

HBase以表的形式存储数据。表有行和列组成。列划分为若干个列族(row family)

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:springboot 项目使用jasypt加密数据源的方法
下一篇:校园气象站的作用说明及其技术参数的介绍
相关文章

 发表评论

暂时没有评论,来抢沙发吧~