构建数仓指标体系2:指标需求收集(2/2)

网友投稿 265 2022-11-20

构建数仓指标体系2:指标需求收集(2/2)

四、业务术语收集

业务术语(Business Glossary)一般是指在工作中用到的各种词汇的解释,是元数据的一部分。业务术语的收集及制定,主要是使大家对核心业务概念和术语有共同的理解,降低由于对业务概念理解不一致而导致数据误使用的风险。

在DAMA的定义中,业务术语表(Business Glossary)的作用是记录和存储组织的业务概念、术语、定义以及这些术语之间的关系。而实际的工作中,我们会把应用系统的术语也一并进行管理(因为应用系统的开发,也通常是烟囱的模式,同样会出现不标准和不规范的问题),接下来我们看两个模板。

业务术语模板:

全局标准术语就是全企业里面标准的名称,比较重要,其余的比较简单,一看就懂,就不解释了。

应用术语模板:

应用术语表,主要是是把业务线条这个填充项,更换为应用系统及功能点,其余没有太大区别

五、数据报表及其详细定义收集

5.1 报表的形式

数据报表一般有两种形式,单表套和嵌套式多层表头,举例如下:

单表头:

(图一)

两层嵌套表头:

(图二)

多层嵌套表头:

(图三)

从上面三个图可以看得出来,多层表头,无非就是单个表头在维度层面的细化。

5.2 报表调研框架

因为多层表头,只是单表头的维度细化,因此我们在调研多层表头报表的时候,着重调研最高维度指标的定义,并核实所需要统计维度。如图三所示,我们应该重点调研“季度销售额”或是“销售额”的定义,同时确认这个指标的考核维度有哪些(如:产品分类)。

单表头调研模板:

(图四)

如上表所示,对报表的调研,核心只需要实现四行:

表头:一般由业务部门提供数据示例:一般由业务部门提供定义:由调研人员进行填写,有两种选择,“维度”和“指标”取值:由调研人员填写,注意,请勿过于技术化,否则业务部门无法确认的,技术化描述可以在整理的时候再实现管理部门:指标需求部门负责人:对指标定义负责的员工

值得注意的是,数据owner,在DAMA的定义中永远是业务部门负责,请不要把owner的权责由技术部门承担。

多层表头调研模板:

由于多层表头要进行一些转化,我们还是以图三为例,除了收集原始数据表格式外,我们还得做一些抽像:

(图五)

我相信大家看表格已经能弄懂了,就是多了一行“合并指标维度取值”。因为我们调研的时候,把所有销售指标合并为最高维度的指标“销售额”,因此,为了后续建模的需要,我们也得把该指标下派生的维度指定,否则DWS层的数据模型没有依据。

六、指标需求及其详细定义收集

有了报表做铺垫,指标就简单多了,单个指标的收集可以参考如下模板,应该不需要解释了,大家能看得懂:

(图六)

七、注意事项

在指标(报表)调研中,强调一下有几个要素一定要调研:

应用场景:所有指标都是为业务服务的,所以归属的场景必须有归属;维度:指标统计的维度,如地区、时间等统计口径:包含什么,不包含什么,如图四所示“省份下所有商品销售量,不计退款单金额”(与取值写在一块便可)生成频率:一天一次、一月一次、实时生成等;单位:元、个等;是否排重,以及排重约束条件:如会员统计按手机号码排重;计算精度:如小数点后2位;管理部门与负责人:用于确定指标归属边界,如财务和销售都有一个指标叫销售额金,但各自有可能有不同的计算方式是否在用:有些报表可能某些指标已停用,因此要进行标识

PS.维度是指是建模的概念,简单点说,不是事实(事务)数据,就是维度数据(日志等除外)。

事实数据举例:如订单、物流轨迹等;维度数据举例:如会员、地区、产品等;

要注意,维度不是主数据/参考数据的观察角度,无论是主数据还是参考数据,都有可能是维度。

若是有朋友想深入了解维度建模,分层建模的细节,可以私信我,我会考虑把建模文章的优先级提前(因为建模特复杂,可能一说就要一个月的更新了)

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:BLE/UART/USB三通芯片CH9143概述
下一篇:如何解决EMI防护问题—滤波连接器
相关文章

 发表评论

暂时没有评论,来抢沙发吧~