阿里制定指标的规范,建立数据指标体系做一些参考
优采云 发布时间: 2021-03-27 00:40阿里制定指标的规范,建立数据指标体系做一些参考
随着业务规模的扩大,各种相关数据的数量增加,数据指标也在增加。缺乏指标体系将导致问题,例如难以衡量产品/活动的效果以及判断整体业务发展状况。在本文中,我们将分解阿里指标的规范,为我们建立数据指标体系提供参考。
在建立OneData之前,Alidata有30,000多个指标,其中,即使具有相同的名称,其定义也是不一致的。即使对于中型公司也是如此。随着数据量的增加,将出现越来越多的数据指标,而缺乏指标体系管理的问题将会很多。
一、非标准指标引起的问题1.当数据指标的概念= 0时,业务方根据“我认为”采取行动,很难衡量效果
产品设计和操作的同学通常是:我认为用户会喜欢我们新推出的功能,并且我认为新活动将产生良好的效果...
领导者将要问,这种“感觉”有什么依据吗?如何衡量用户喜欢这项新功能?如何判断活动的效果,参加人数或转化次数?
这样的问题,实际上,设计师也很困惑和困惑,不要问设计的原因,问题是要回答其他竞争产品也具有此功能,所以我们也做...
您认为您已经被录用了吗?
但是,许多产品人员已经意识到传统的盲目设计和抄袭设计时代已经过去,数字产品时代已经到来,他们开始尝试使用数据指标来辅助业务决策。于是开始进入下一个阶段...
2.这时,数据索引的概念= 0. 5,有一个单点数据索引,但是很难看到整个业务问题
在这种情况下,通常会想到业务索引,并使用业务索引。
例如,当您发现诸如Shence和Youmeng之类的数据分析供应商通常使用诸如GMV,每日活跃用户,每月活跃用户,PV,UV,页面停留时间等数据时,产品设计师首先将其复制,然后将它们结合起来。使用它时,您会想到一些指标,然后将它们一个接一个地添加。
以在线汽车租赁为例。今天的GMV减少了50%。是什么原因造成的?
分析员回答:受这一流行病的影响,乘客订单数量下降了20%。
这是平台的当前指标,大约30%?是什么原因引起的?
因此,分析师检查了这些数字,发现在线驾驶员的数量和接受订单的驾驶员的数量减少了30%,因此他们匆忙描述了暂时考虑的两个指标,并简要描述了业务的含义经过一系列沟通和协调,让R&D暂时添加。
此方法有什么问题?
索引修改的成本很高。研发团队需要重做数据采集,清理和存储。该值的定义不清楚,并且数据不准确。指标缺乏定义和标准,各部门难以理解。会有一些重复的指示符,例如相同的指示符名称但含义不同。例如,它们都被称为注册驱动程序。一个定义为,如果注册的手机号码成功,则注册的驾驶员是注册的驾驶员;否则,将其定义为注册的驾驶员。另一个定义为,如果加入成功,则注册驱动程序是注册驱动程序。存储,计算和研发成本很高:没有统一的标准化管理,导致浪费资源进行重复计算;数据的级别和粒度不清楚,使得重复存储变得很严重。 二、了解OneData指标规格
由于如果不事先设计索引系统会出现很多问题,那么索引主体的设计过程是什么?如何确保指标体系的标准设计?
首先让我们看看Ali如何制定指标规范:
基于维度建模,构建总线矩阵以定义业务域,数据域,业务流程,度量/原子指标,维度,维属性,修饰符,修饰符类型,时间段,派生指标等。
1.业务领域
具有比数据域更高维度的业务划分方法适用于特别大的业务系统,并且业务部门之间的指标或业务重叠很小。例如,汽车业务部门包括乘客和驾驶员终端,而电子商务业务部门包括购物中心和折扣模块。
2.业务流程
业务流程可以概括为不可分割的行为事件,例如订购,付款,评估和其他业务流程/事件。
看到这一系列术语,许多人可能会开始感到困惑,但是业务领域仍然可以简单地理解它是不同业务的分类;业务流程也很容易理解,等效于绘制业务流程图。
数据字段在哪里?
3.数据字段
是紧密相关的数据主题的集合,是概念级别的分类,具有高度的业务对象泛化性,目的是促进数据管理和应用。
简而言之,数据域类似于在我们的计算机桌面上创建用于存储数据的不同文件夹,而这些文件夹的名称就是数据域。
您如何理解尺寸,尺寸属性和装饰?目的是什么?
4.尺寸
是度量环境,用于反映一种业务属性。这些属性的集合构成一个维度,可以从“谁在哪里”,“什么时候在”什么层次上进行查看。
5.维度属性
维度属性属于维度,它等效于维度的特定描述。例如,用户维度中的性别是男性或女性。
6.修饰符
有关统计维度以外的指标,请参考业务场景。
7.修改类型
修饰符的抽象划分。
简而言之,尺寸和修改可以理解为原子指标的某些限定条件。那些了解sql的人会更好地理解它们。通常,在编写sql时将它们放在where语句之后。
8.度量/原子指数
原子指示器和测量具有相同的含义。在某种业务行为事件下的度量是业务定义中不可分割的指标,例如注册数量。
9.时间段
用于阐明数据统计信息的时间范围或时间点,例如最近30天,日历周,当天的时间等。
1 0.指标类型
包括原子指标和派生指标。
例如:原子指数=过去一周内iOS乘客的已完成订单数量,衍生指数=上周的iOS乘客已完成订单数量,包括时间段=过去一周,修饰符= iOS,尺寸=乘客,原子指数=已完成订单数量。
三、制定自己的索引系统规范
接下来,请参考Ali的onedata数据标准在在线汽车叫车系统中建立数据指标。
1.研究业务需求并分析业务流程
1)研究业务需求
充分的商业研究是建立指标体系的基础。在数据指示器系统构建项目开始之前,有必要与每个业务方详细了解特定的业务,并整理出关键的业务流程。
需求采集可以分为两种:定量和定性采集。调查问卷的形式是定量发布的,业务需求广泛采集;对用户进行定性访问,并深入探讨业务应用方案和核心需求。详细的需求采集和分析方法已写在先前的“需求采集和需求分析”文章文章中,此处将不对其进行扩展,但可以用作参考。
2)分析业务流程
根据阿里巴巴onedata的最佳实践,业务流程可以概括为一个不可分割的行为事件。为了理清逻辑关系和数据流,首先必须了解用户的业务流程,并了解业务流程中涉及的数据系统。
以下以在线汽车叫车系统为例,对驾驶员和乘客终端的业务流程和数据指标进行分类。
旅客航站楼流程可以分为:注册/登录,下订单,服务,付款,评估/客户服务投诉。
在核心过程中生成的业务指标:
注册/登录阶段:新用户数量,用户数量,来自不同渠道的用户数量订单阶段:订单数量,新用户数量,旧用户数量,不同城市下达的订单数量,不同型号数量数据,成功下订单的用户数。决策阶段:协商订单数量,未协商订单数量,决策阶段主动取消订单的用户数量,决策阶段超时取消的数量,提价后完成的订单数量,订单数量通过降价完成服务阶段:订单下达成功用户数,订单持续时间,订单成功率,订单数量,订单完成率,订单用户数。付款阶段:订单金额,平均订单金额,订单折扣金额,账单差额评估阶段:有利率,负面评论率
驾驶员侧业务流程可以分为:
在业务流程中生成的核心业务指标:
注册/登录阶段:注册用户数,新用户数。加入阶段:提交审查的用户数,通过审查的用户数,新注册的驱动程序,累积注册,旧驱动程序和新驱动程序的数量。订单阶段:在线驱动程序数量,驱动程序数量,有效驱动程序数量,中标者数量,中标率,中标者平均每日数量。决策阶段:驾驶员在决策阶段取消的订单数量。服务:平均服务距离,平均时间长度,空车平均距离,空车平均长度评估:驾驶员的好评,驾驶员的负面评价,平均星级提款:驾驶员余额,提款次数,*敏*感*词*提款金额
在澄清了用户的业务流程之后,有必要根据分析和决策业务划分数据域,并在相应的数据域下分解特定的业务流程。
2.划分数据域
数据域:它是密切相关的数据主题的集合,并且是高度概括业务对象的概念级别分类。目的是方便数据管理和应用。
这等效于对数据进行分类,这类似于在我们的计算机桌面上创建不同的文件夹来存储数据。我们的数据用于不同的业务人员,例如市场营销,运营,客户服务,风险控制等,并且他们关注的业务模块非常不同。
我们的技术人员还需要为他们提供各种不同的数据指标。发现它效率低下,并且服务器计算成本很高(当您在计算机搜索框中查找文件名时,会考虑它的速度是否很慢),因此业务人员也难以及时获取数据。没办法,那么我将对数据进行分类,以便我们可以快速找到数据并在将来将其水平扩展。
因此在划分数据域时,我们还应注意:
这等效于在计算机上命名文件夹。它应该收录所有当前文件(数据)。生成新文件后,可以将其放置在现有文件中,也可以方便地创建新文件。
可以根据对每个模块的业务需求和业务流程的分析来划分数据域。通常,数据域可以根据公司部门进行划分,例如客户服务,运营和营销。也可以根据业务流程或业务部门的功能模块进行划分。
例如,可以将汽车叫车系统中的汽车业务域划分为下表所示的数据域,并可以根据实际业务流程对数据域进行汇总和抽象。
3.定义索引规范-总线矩阵构造
我们整理了业务域,数据域和业务流程的总体框架,然后设计了指标规范。
简单的理解等同于我们为文件夹设计了第一,第二和第三级目录结构规范,现在我们需要设计文件命名结构规范。
常用的指标基本上是根据个人理解来命名的,没有特殊的规定,例如每日/每月的活跃用户,过去一个月下的订单数量以及已完成的订单数量。但是,随着数据指标的增加,出现了许多在有限条件下的指标,例如过去7天在北京快运上下的订单数量。这个指标是如何设计的?是否有一套用于标准化设计的指标?
如上图所示,在设计指标时,必须明确定义业务领域=汽车业务,数据领域=服务领域,业务流程=订单,维度=城市,属性=北京,时间段= 7天,修饰符= Express,指标/基本指标=订单数量。通过增加对原子指标的约束,该标准生成派生指标=北京快运在过去7天下的订单数量,并提供了一套通用的指标定义标准,以方便不同业务部门的人们理解指标的含义。
以在线汽车叫车系统中的服务域为例,并制定以下总线矩阵,将业务流程划分为下订单,下订单,决策,启动行程和下订单完成。
数据仓库架构师经常使用总线矩阵,产品人员更难以理解。实际上,它类似于数学数学和排列组合。原子指标的维数限制条件组合是不同的,您可以获得成千上万的派生指标。
摘要
本文主要从数据产品的角度介绍如何构建基于Ali OneData的在线汽车叫车系统。通过业务分析,数据域划分和总线矩阵构建,建立一套索引设计规范。通过建立索引规范,可以提高研发和业务方获取索引的效率,为后续的自助服务分析奠定基础。
在设计指标和规格的过程中,发现将生成数千个指标。以下哪项指标确实可以为业务方面提供指导?
下一篇文章将解释如何基于GSM模型和AARRR模型确定核心业务指标,以及如何设计指标字典。
#专栏作家#
大鹏,公共帐户:数据人的私人土地。每个人都是产品经理专栏作家“数据产品经理培训手册”的作者。
本文原创发表在《每个人都是产品经理》中。禁止擅自转载
标题图片来自Unsplash,基于CC0协议
奖励作者并鼓励他努力工作!
赞赏