Session 分析的妙用

网友投稿 241 2022-11-22

Session 分析的妙用

作者介绍

@Albert

就职于某知名大数据服务公司;

专注于数据产品、数据埋点和用户行为数据分析;

“数据人创作者联盟”成员。

00 导语

最近在工作过程中,发现有不少业务同事对于用户行为分析中的 Session 分析非常感兴趣,但是对于这个分析方法的定义和运用场景存在很多误解。

于是笔者打算写一篇针对 Session 分析的专题讲解,希望能给各位小伙伴带来思考和收获。

如果是对于用户行为分析这个话题感兴趣的小伙伴,可以移步我之前写的文章(​​用户行为数据入门理论与实例​​),里面有对用户行为分析的整体介绍。

01 定义

用户启动 APP 后在 APP 上的一系列操作和互动,也可以看作是用户和 APP 的 “会话”,即使是用户短暂放下手机去做别的事,只要在后面又重新打开 APP 进行操作,此次 “会话” 就没有结束,除非用户离开的时间超过了阈值,“会话” 就会自动结束。

02 Session存在的意义

有的小伙伴可能会问,既然要分析用户的行为序列,为什么不直接对用户从打开到退出 APP 的行为链条整体和链条中的各个事件进行分析,而是要创造出 Session 这个概念呢?下面给出一个例子。

在上图中,这个用户在上班路上打开了 APP,逛了一会后就退出了 APP;在下班回家后打开了 APP,逛了一会后放下手机,用一分钟倒了一杯水,接着回来又打开了 APP 继续浏览,直到最后退出了 APP。

如果简单使用 “打开-退出 APP” 作为行为序列的切割标准,该用户在上班路上使用 APP 的深度比回家后高(可以计算图中从打开 APP 到退出 APP 中出现的 “圆圈” 的个数计算用户从打开到退出过程中与 APP 的互动深度);但是实际上并不是如此,用户在第一次退出 APP 后只是起身倒了一杯水,并没有结束与 APP 的互动。

如果轻易得出了 “上班时段的使用深度高于回家之后” 的错误结论,将会误导业务同事,严重的话可能会导致作出错误的决策。反之,Session 可以将回家后的两段貌似 “割裂的” 行为序列进行合并,从而揭开用户在一段时间内所做的行为和背后的动机。

03 Session的“切割”原理

回到刚才的例子,既然不是粗暴地以 “打开 - 退出 APP” 作为用户行为序列的切割标准,那应该以什么标准切割用户在 APP 上的行为链条呢?

这就要引入一个 “切割时间” 的概念。

在第一部分的时候笔者提到 “除非用户离开 APP 的时间超过了阈值,‘会话’ 就会自动结束”,这个 “阈值” 便是 “切割时间”。

再举个简单的例子,假设我们设定切割时间为 5 分钟,那么就代表着如果用户在做了某个行为 5 分钟后没有任何其他动作,前面的 “会话” 便会被 “切割” 并结束。

另外,在某些情况下,我们也可以设置特定的 “会话” 开始和结束事件,一旦用户做了某个操作就会自动开始/结束 “会话”。

04 Session中可以分析的指标

(1)“会话” 的个数

还是回到刚才的例子,在上述场景中,这个用户该天有 2 个会话,代表着这个用户该天在 APP 上有 2 段 “访问” 记录。当然,我们希望 “会话” 的个数越多越好,这个指标越高代表用户对 APP 粘性越高。

(2)“会话” 的深度

上图是某个用户的某次 “会话”(假设该 “会话” 中只记录了 APP 的页面浏览以及打开和退出),想要计算 “会话” 的深度,只需要数该行为序列中 “圆圈”(发生的事件)的个数。

上图的会话中 “圆圈” 有 6 个,代表这个 “会话” 的深度是 6。这个指标的使用场景一般是计算用户的每次 “会话” 或人均浏览深度,我们把用户的浏览行为单独挑出来,重新根据时间排序串成新的行为序列,并根据切割规则切割成一个个 “会话”,即可计算每个 “会话” 的深度(用户每次访问的页面浏览数),并进行每次 “会话” 或每个用户的平均数计算。

(3)“会话” 的跳出率

上图中,该用户共有 4 次 “会话”,其中有两次 “会话” 只启动了 APP,后续就没有做任何动作,这两个 “会话” 的深度就是 1。

跳出率的计算方法就是拿深度为 1 的 “会话” 个数除以总的 “会话” 个数,由此可得,上图的 “会话” 跳出率便是 2 除以 4 等于二分之一。

该指标为负向指标,越高就说明用户对于 APP 不是很感兴趣,启动了之后就不会再做任何后续的操作。

(4)“会话” 内部各事件的属性

以上指标都是对 “会话” 本身的分析。实际上,我们还可以对会话中的每个事件进行分析,例如最常见的页面平均浏览时长,就可以通过 “会话” 中每个事件发生的时间进行计算。

05 案例:渠道投放效果分析

我们平时在分析渠道效果时,会分不同渠道看渠道落地页 PV、UV 等常规指标。

但是,前面所说的页面跳出率也可以用于评估渠道效果,即用户看到渠道落地页就 “跳出” 没有做接下来的操作的比例。

假如下图是统计出来的分渠道的落地页 PV、UV 和跳出率数据(全部为模拟数据,仅供讲解使用)。

在上图中,我们发现 xxx 渠道来的 PV、UV 很高,但是跳出率很高,很多从 xxx 渠道进来的用户看到此落地页就直接离开了,可能是因为该渠道带来的用户质量太差,抑或是落地页本身有问题。

虽然 yyy 渠道 PV、UV 不如 xxx 渠道,但是跳出率很低,大多数从 yyy 渠道进来的用户都会被落地页吸引并做接下来的操作。

那如何确定到底是渠道本身带来的流量问题,还是落地页设计的问题呢?

我们可以拿自然流量带来的渠道落地页 PV、UV 和跳出率做比较,因为自然流量往往质量较好(愿意通过各种方式主动点进来看的用户肯定是意向度较高的)。

如果连自然流量的跳出率都很高,说明该落地页的设计本身就有问题,如果自然流量的落地页跳出率很低,说明是 xxx 渠道带来的流量质量有问题。

06 小结

以上是笔者基于过往工作经验所总结的方法论,受制于个人经验可能有不完善的地方,欢迎大家批评指正,也欢迎感兴趣的小伙伴与我作进一步交流。

想了解更多数据知识也欢迎看,7 位大厂产品联合写的《大数据实践之路:数据中台+数据分析+产品应用》这本书。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:嵌入式系统的实时数据接口扩展
下一篇:Java JVM类加载机制解读
相关文章

 发表评论

暂时没有评论,来抢沙发吧~