网站内容分析报告( 流量分析中常用的路径分析,如何在BI系统中产品化)
优采云 发布时间: 2022-01-13 14:22网站内容分析报告(
流量分析中常用的路径分析,如何在BI系统中产品化)
“路径分析是了解用户交通行为特征最直观、最有效的分析方法之一。”
关于BI分析系统中的各种特殊分析项目,很久以前分享过《用户归因分析》和《用户行为漏斗分析》。今天给大家讲讲流量分析中常用的用户路径分析,以及如何在BI系统中使用。中国产品化。
01 什么是路径分析
首先,什么是用户路径分析?
1. 路径分析的概念
从表达上看,这似乎很容易理解。其实就是分析网站或app中不同页面、不同模块、不同操作事件之间的用户流向。
通过路径分析,我们可以很好地发现用户的流量特征,找出用户流失的链接和页面,或者有障碍,从而有针对性地优化产品和提高性能。
例如,我们发现许多用户在购买附加组件后没有付款。我们可以通过分析路径来了解用户去哪里以及附加购买后发生了什么。通过这种方式,可以找到支付率低的原因。
2. 和漏斗分析的区别
既然之前分享过《漏斗分析》,那么路径分析和漏斗分析有什么区别呢?
上图左侧是漏斗分析,右侧是典型的路径分析。你看得到差别吗?
是的,漏斗分析固化了具体的分析流程或者业务环节,然后分析这些主要业务环节的转化;而路径分析则固化了用户的路径序列,在每一个路径序列中,都收录着各种主要的业务环节,所以在每一步,出现的业务环节很可能是相似的。
总而言之,漏斗分析关注的是业务环节之间的留存关系,路径分析关注的是用户在不同业务环节的订单和流失关系。
从理论上讲,漏斗分析可以看作是路径分析的概述。
02 路径分析的可视化呈现
在用户的路径分析中,比较常见的可视化是桑基图。
这里有几句话是关于桑基图的。事实上,它以马修·亨利·菲尼亚斯·里亚尔·桑基在 1898 年绘制的《蒸汽机能效图》而闻名,此后被命名为《桑基图》。
桑基图主要用于显示流向和数量。最大的特点是开始和结束都是完全守恒的。
例如,下面的例子是一个桑基图:
从这张图片中,我们可以清楚地看到所有用户从哪里来,经过一步一步的链接后他们去了哪里。
另一种更类似于桑基图的图是和弦图。下面的例子:
和弦图主要呈现的是从一个内容转移到所有其他内容的情况,不能呈现桑基图的多层链接的内容,只能呈现一个链接。
03 路径分析产品设计
如上所述,路径分析的主要可视化是桑基图。事实上,对于分析报告来说,一张合适的桑基图可以呈现很多信息。
但产品化不等于做分析报告。产品化需要满足更丰富的应用场景,实现灵活的交互分析。这是BI系统中路径分析的基本要求。
那么关于BI分析系统中的路径分析模块,如何设计产品呢?我们关注行业中的产品设计。
(1)谷歌分析路径分析
下图是GA的路径分析模块:
首先,GA支持节点类型的选择。用户可以选择事件或页面,并自定义详细程度和聚合程度。
其次,单击一个节点进行更深入的分析。
(2)神策数据路径分析
下图是Sensors Data的路径分析模块:
其实大逻辑和GA的桑基图没有本质区别。细节方面,相比GA还是会有一些减少。但从体验来看,不得不说还是相当不错的。至少它更容易上手。遗传算法在翻译或文化上可能仍然不同,它总是需要一个适应的过程。
在Sensor的路径分析中,支持多种过滤操作。
这包括以下内容:
这些筛选实际上可以满足普通分析师的大部分分析需求。尤其是session的间隔设置,我觉得挺神奇的。回过头来仔细看看技术的实现。毕竟session间隔的随机设置,个人感觉对计算的要求还是很高的。
04 路径分析的数据逻辑
上面提到了很多关于产品设计方面的内容。非常方便的交互操作背后是大量的数据处理逻辑,这里可以简单介绍一下。
1. 良好的序列数据和会话切割
想象一下,要实现路径分析,数据应该如何处理?
首先,所有的行为日志都被划分为会话。划分的目的是区分独立的行为。通常的划分方式是,如果 30 分钟或更长时间没有任何操作,则会话结束。
其次,数据处理和汇总分析是基于分段的会话进行的。
根据笔者以往的经验,每个会话中的事件记录按时间顺序标有序号。这样就可以实现对序列的分析。但是我真的没有想到 Sensors 分析中会话间隔的自由设置是如何实现的。因为一般情况下,会话的划分逻辑是固定的。
2. 对数据计算的更高要求
通过刚才的例子,我们也看到,在分析过程中,可以过滤各种条件,细分各种人群,设置各种逻辑,这无疑需要很高的计算量。
具体内容背后的技术架构层的设计非常重要。
3. 涉及的主要算法
路径分析的主要算法包括:
社交网络分析法:又称链接分析。在社交网络分析方法中,最普遍和成熟的方法是中心性分析方法。中心性是衡量社交网络参与者的名气成都的标准。网页搜索和超链接分析密切相关
基于序列的关联分析:又称序列分析,这种分析方法在关联分析的基础上进一步考虑相关项的序列,即只分析序列的关联关系。
最简单的遍历方法:因为最直观、最直接、最容易理解,所以整理出一个页面的所有来源和对应的流量大小,同时整理出下一页的所有目的地和对应的流量的页面被整理出来。梳理出来
关于路径分析,今天就到这里吧。
本文由@ChiefDataScientist原创发布,人人都是产品经理。禁止任何未经许可的复制。
标题图片来自 Unsplash,基于 CC0 协议。