Hadoop学习笔记之HBase应用场景-APISpace

Hadoop学习笔记之HBase应用场景

今天的主要来分析一下HBase的特点，提出一些真实的应用场景，利用HBase去解决应用中的效率问题；

HBase特点概述HBase是google的Bigtable的开源实现，建立在HDFS上，提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统。HBase介于nosql和rdbms之间，仅能通过主键(row key)和主键的range来检索数据，仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。因为底层是Hadoop所以完全和hadoop一样，Hbase目标主要依靠横向扩展，通过不断增加廉价的商用服务器，来增加计算和存储能力。HBase中的表一般有这样的特点：分析我们的业务的时候我们不要从关系数据库表的结构去构思未来表的结构。我们主要去看我们的数据的特点是否具备我们上面提到三个特点。如果具备的话我们一般认为这种业务数据适合放到HBase上来存储。

大：一个表可以有上亿行，上百万列；数据量大，并且表很宽；面向列：面向列(族)的存储和权限控制，列(族)独立检索；稀疏：对于为空(null)的列，并不占用存储空间，因此，表可以设计的非常稀疏；

HBase应用场景分析

场景1：对变形金刚实时数据监控应用（虚拟场景）

1.场景描述：

2.业务分析

我们主要是对某个变形金刚的一段时间内状态进行分析，实时对变形金刚的状态进行监控和分析；

假如我们的每一帧数据作为一行的话，我们的表会很宽，有100个列簇，1000*100列；

我们来看我下设计图

从大这个特点上来我们这个场景是满足的。从宽的特点上来说我们这个场景也是可以满足的。

变形金刚上提供数据传输模块，对1000个零部件的状态的指标进行监控并以1秒/帧实时传输到数据中心；假如现在有100个变形金刚，数据量=1000（指标）*100个变形金刚=100000条指标；一年的数据量是31536亿条指标，那么存储十年的数据的话我就不算了，太大了。

编写测试实例

package com.hugy.hadoop.invoke; import java.io.IOException; import java.util.Date; import java.util.Iterator; import java.util.List; import java.util.Random; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.KeyValue; import org.apache.hadoop.hbase.client.Result; import com.hugy.hadoop.hbase.HBaseHelper; public class HBaseInvoke { /** * @param args * @throws IOException */ public static void main(String[] args) throws IOException { System.out.println("HBase 操作开始..."); Configuration conf = new Configuration(); conf.set("hbase.zookeeper.quorum", "hadoop"); conf.set("hbase.zookeeper.property.clientPort", "2181"); HBaseHelper hbase = new HBaseHelper(conf); // 2.1创建表 String tableName = "thransformersdata";// 变形金刚指标数据存储表 hbase.deleteTable(tableName); String colFamilies[] = { "thransformer1","thransformer2","thransformer3","thransformer4","thransformer5"}; hbase.createTable(tableName, colFamilies); Random random = new Random(); Date starttime=new Date(); long rowkey = starttime.getTime()/1000; for (int x = 1; x <=5; x++)// 5秒钟的数据 { rowkey++; //一秒钟一帧数据 for (int i = 1; i <= 5; i++)// 5个变形金刚 { for (int j = 1; j <= 100; j++)// 100个指标 { hbase.insertRecord(tableName,Long.toString(rowkey), "thransformer"+i, "quota"+j, Float.toString(0.3f)); } } } // 2.4查询整个Table List list = null; list = hbase.getAllRecord(tableName); Iterator it = list.iterator(); while (it.hasNext()) { Result rs2 = it.next(); for (KeyValue kv : rs2.raw()) { System.out.print("row key is : " + new String(kv.getRow())); System.out.print("family is : " + new String(kv.getFamily())); System.out.print("qualifier is:" + new String(kv.getQualifier())); System.out.print("timestamp is:" + kv.getTimestamp()); System.out.println("Value is : " + new String(kv.getValue())); } } } }

部分输出结果输出如下：

row key is : 1406466972 family is : thransformer3 qualifier is:quota91 timestamp is:1406495760290 Value is : 0.3

row key is : 1406466972 family is : thransformer3 qualifier is:quota92 timestamp is:1406495760314 Value is : 0.3

row key is : 1406466972 family is : thransformer3 qualifier is:quota93 timestamp is:1406495760352 Value is : 0.3

row key is : 1406466972 family is : thransformer3 qualifier is:quota94 timestamp is:1406495760366 Value is : 0.3

row key is : 1406466972 family is : thransformer3 qualifier is:quota95 timestamp is:1406495760379 Value is : 0.3

row key is : 1406466972 family is : thransformer3 qualifier is:quota96 timestamp is:1406495760437 Value is : 0.3

row key is : 1406466972 family is : thransformer3 qualifier is:quota97 timestamp is:1406495760450 Value is : 0.3

c语言sscanf函数的用法是什么

276 2022-11-25

Hadoop学习笔记之HBase应用场景

c语言sscanf函数的用法是什么

c语言一维数组怎么快速排列

linux怎么查看本机内存大小

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）