c语言sscanf函数的用法是什么
265
2022-11-20
构建数仓指标体系2:指标需求收集(2/2)
四、业务术语收集
业务术语(Business Glossary)一般是指在工作中用到的各种词汇的解释,是元数据的一部分。业务术语的收集及制定,主要是使大家对核心业务概念和术语有共同的理解,降低由于对业务概念理解不一致而导致数据误使用的风险。
在DAMA的定义中,业务术语表(Business Glossary)的作用是记录和存储组织的业务概念、术语、定义以及这些术语之间的关系。而实际的工作中,我们会把应用系统的术语也一并进行管理(因为应用系统的开发,也通常是烟囱的模式,同样会出现不标准和不规范的问题),接下来我们看两个模板。
业务术语模板:
全局标准术语就是全企业里面标准的名称,比较重要,其余的比较简单,一看就懂,就不解释了。
应用术语模板:
应用术语表,主要是是把业务线条这个填充项,更换为应用系统及功能点,其余没有太大区别
五、数据报表及其详细定义收集
5.1 报表的形式
数据报表一般有两种形式,单表套和嵌套式多层表头,举例如下:
单表头:
(图一)
两层嵌套表头:
(图二)
多层嵌套表头:
(图三)
从上面三个图可以看得出来,多层表头,无非就是单个表头在维度层面的细化。
5.2 报表调研框架
因为多层表头,只是单表头的维度细化,因此我们在调研多层表头报表的时候,着重调研最高维度指标的定义,并核实所需要统计维度。如图三所示,我们应该重点调研“季度销售额”或是“销售额”的定义,同时确认这个指标的考核维度有哪些(如:产品分类)。
单表头调研模板:
(图四)
如上表所示,对报表的调研,核心只需要实现四行:
表头:一般由业务部门提供数据示例:一般由业务部门提供定义:由调研人员进行填写,有两种选择,“维度”和“指标”取值:由调研人员填写,注意,请勿过于技术化,否则业务部门无法确认的,技术化描述可以在整理的时候再实现管理部门:指标需求部门负责人:对指标定义负责的员工
值得注意的是,数据owner,在DAMA的定义中永远是业务部门负责,请不要把owner的权责由技术部门承担。
多层表头调研模板:
由于多层表头要进行一些转化,我们还是以图三为例,除了收集原始数据表格式外,我们还得做一些抽像:
(图五)
我相信大家看表格已经能弄懂了,就是多了一行“合并指标维度取值”。因为我们调研的时候,把所有销售指标合并为最高维度的指标“销售额”,因此,为了后续建模的需要,我们也得把该指标下派生的维度指定,否则DWS层的数据模型没有依据。
六、指标需求及其详细定义收集
有了报表做铺垫,指标就简单多了,单个指标的收集可以参考如下模板,应该不需要解释了,大家能看得懂:
(图六)
七、注意事项
在指标(报表)调研中,强调一下有几个要素一定要调研:
应用场景:所有指标都是为业务服务的,所以归属的场景必须有归属;维度:指标统计的维度,如地区、时间等统计口径:包含什么,不包含什么,如图四所示“省份下所有商品销售量,不计退款单金额”(与取值写在一块便可)生成频率:一天一次、一月一次、实时生成等;单位:元、个等;是否排重,以及排重约束条件:如会员统计按手机号码排重;计算精度:如小数点后2位;管理部门与负责人:用于确定指标归属边界,如财务和销售都有一个指标叫销售额金,但各自有可能有不同的计算方式是否在用:有些报表可能某些指标已停用,因此要进行标识
PS.维度是指是建模的概念,简单点说,不是事实(事务)数据,就是维度数据(日志等除外)。
事实数据举例:如订单、物流轨迹等;维度数据举例:如会员、地区、产品等;
要注意,维度不是主数据/参考数据的观察角度,无论是主数据还是参考数据,都有可能是维度。
若是有朋友想深入了解维度建模,分层建模的细节,可以私信我,我会考虑把建模文章的优先级提前(因为建模特复杂,可能一说就要一个月的更新了)
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~