c语言sscanf函数的用法是什么
562
2022-11-19
构建数仓指标体系4:理解原子、派生、复合指标(3/3)
经过前面两篇文章的铺垫,相信原子、派生、复合指标的结论已经呼之欲出了。
六、再论指标分级管理
之前也稍稍提了一下,之所以实行指标的分级管理,分为原子、派生、复合指标,是因为要复用。举例:
业务部门常常会出现这种指标:一季度销售额、二季度销售额、1月销售额、半年销售额等。。。其实说的都是销售额,只是在时间维度上的统计量不一致而已,如果我们把销售额按天来记录,那是不是就能解决无数个销售额指标的问题呢?答案肯定是一定的。其实这些指标,都属于一个叫“销售额”原子指标,按时间进行派生,这样管理起来,其实会更便捷,而且技术人员在建模的时候,会更顺畅。
借用一本书的图,把三者的关系做个展示:
七、抽象原子指标
把指标去除所有维度后,便是原子指标,如:
指标名称 | 维度 | 原子指标 |
广东省销售量 | 区域(省市区...) | 销售量 |
VIP会员数 | 会员等级(VIP/普通) | 会员数 |
有效门店数 | 状态(有效/无效) | 门店数 |
线上注册会员数 | 注册渠道(线上/线下) | 注册会员数 |
广东省VIP销售量 | 区域、会员等级 | 销售量 |
PS.注册会员数是整一个名词,请不要拆开,除非业务上定义了注册/注销是两个维度,所以指标跟业务调研是很重要滴...
需要注意维度的粒度、排重以及重新组织,因为很多业务系统可能没有把维度单独抽离为实体数据表。在梳理维度的过程中,要注意以下几点:
粒度:呈父子粒度的,请重新编码及重组为同一维度表排重:当维度没有单独抽出时,可能多套系统会有重复的维度,或者需要合并的维度重新组织:站在企业的视角,把维度作为主数据对待,重新组织企业级的维度。若是大家要搞数据治理,这块数据是治理的重灾区。
八、生成派生指标
看到上面的原子指标抽象过程,派生指标也就呼之欲出了,就是把维度反加持在原子指标上,就是派生指标了。一般我们管理上,会用下图表格记录:
九、生成复合指标
所谓的复合指标,就是两个原子指标通过运算,生成出来的新指标,一般复合指标都是两个原子指标相除的形式,加减乘其实没有太多的必要,如:
进店购买率=购买人数/进店人数
十、指标分级的好处
其实指标分级的好处,除了复用和管理方便外,最大的好处还是建模的时候有依据。
10.1 指标报表合并
之前也讨论过,维度一致的时候(粒度也一致),不同的指标可以合并在同一报表中,也就是同一张实体表中,这样可以减少一些管理及资源成本,如:
10.2 作为DWS模型的依据
DWS是轻度汇总层,由于这只是举例,就不提细节了,可以看下面的DWS示例:
我把汇总数量的维度确定为时间,粒度是月,那以后业务做分析,我既可以按月来分析,也可以按季度来分析,由于就只有几条数据,所以整体运算速度有非常大的提升。而这些DWS的维度,也是通过抽象原子指标与维度出来的。
十一、本章小结
实话说,指标并不是什么有技术难度的工作,原子、派生、复合指标也只是因为现有的材料写得不够仔细所以显得神秘而已。如果指标数量少(300以下),拆原子指标等的其实作用不大,因为管理也需要工作量的。
如果大家还有什么不明白的,也可直接私信我。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~