admin 管理员组文章数量: 1086019
2024年4月15日发(作者:sql2008数据库安装心得)
数据指标波动分析
每天打开数据监控看板,观察当日业务KPI的情况,已经是互联
网人的日常工作内容之一,数据指标波动对于一个非稳定期的业务是
常态。波动分析的本质是通过统计和比较来表达波动背后的规律和问
题。业务的数据指标都具有固定的波动周期,而且每个周期内数据的
变化应该趋于稳定,但在数据监控体系里的日报、周报、月报中某数
据指标突然不再符合预期的稳定变化,这就是我们所说的数据出现异
常波动。本文将从围绕以下思路向大家介绍:
数据准确性
面对波动首先判断数据是否准确。准确性是数据指导决策的基础,
日常难免会遇到服务器异常、上游依赖表变动等问题,以致于在数据
监控平台上出现异常值。指标准确性的排查方法也各不相同:
•绝对值指标:如果是数据中间层或者明细层,通常追溯到日志
上报是否异常,上报逻辑是否发生变化,或者端接口是否稳定;如果
属于应用层数据,通常排查上游依赖是否发生变化,数据口径未对齐
等情况。
•率值指标:如下矩阵,按照分子分母单独排查,参考绝对值指
标。
数据指标波动分析
数据异常性
然后,在准确性的基础上判断数据波动的幅度如何以及幅度是否
异常。波动幅度的衡量通常是根据同比、环比得到的,周期性是影响
数据波动的重要因素,周同比、月同比、年同比以及日环比等能刨除
周期性的影响看到数据波动的本质。波动是否异常,最常用的判断方
法是3西格玛原则,统计学认为在正态分布中,有99.7%的数据落在
3倍标准差的区间中,95%落在2倍标准差区间,68%的数据落在1
倍标准差之中,但在具体业务中也会通过数据趋势和经验进行判断。
数据指标波动分析
归因分析
在准确性和异常问题确定之后,进行归因分析和影响度衡量,最
终运用分析结果驱动业务决策。对于大部分已经产生的数据波动,大
概可以从两个维度来分类:
•范围维度:包括自己的产品、竞对方面以及产品业务的大环境,
这样分类的原因是因为相互竞争的产品都处于大的产品业务环境之
中,任何一方的变动都会造成自家产品的数据变化;
•内容维度:包括产品、技术、用户和运营,这几个维度基本囊
括了互联网产品的重要构成。日常波动大多数都是自己模块的原因所
致。具体归因时,又可以从人货场的角度进行下钻:技术维度通常是
数据准确性的问题,产品和运营维度影响场,用户因素拆解成买家、
卖家和供给。
数据指标波动分析
外部原因通常是难以验证的,因为我们难以获取到竞手的数据,
所谓的第三方报告也并不准确,如果竞对是上市公司,那可以查看披
露的财报数据,但针对某一时刻或者时间段的波动,洞察竞对财报往
往有些迟延。抛开外部因素,从内部因素进行归因,又可以拆解成绝
对值指标、率值指标的归因。
数据指标波动分析
•针对绝对值指标,归因方法总结为:横向分析、纵向分析、交
叉分析
横向分析:人货场模型是典型的横向分析,以MECE为拆分原则。
从人的角度拆解,买家用户即流量,即有来访的用户,可以从基本画
像信息、来源渠道、活跃度、购买等级、购买意愿等角度进行拆解,
确定各层级的用户是否有明显波动;从货的角度拆解,判断新发、库
存、分发侧是否发生变化;场反映的是产品或者运营的策略影响。
数据指标波动分析
纵向分析:漏斗模型是典型的纵向分析,它是一套流程式波动分
析方法,能够科学反映用户行为状态以及从起点到终点各阶段用户转
化率、跳失率等情况。
数据指标波动分析
交叉分析:交叉分析是横向分析和纵向分析的交叉,业务中的波
动归因往往是横向、纵向的不断交叉。
以订单波动为例
横向分析:
人:订单量=自然+外投+push+二方+短信 =低活+低中活+中活+
中高活+高活 =购买力L1+L2+L3+L4+L5 =.......
货: 订单量=新发订单+老品订单 =女装+3c+手机+卡券+... =不同
卖家价值的订单之和
纵向分析:
订单量=dau*曝光转化率*点击to曝光转化率*询单to点击转化
率*询单to支付转化率
交叉分析:
订单量=(自然+外投+push+二方+短信)*(各分组下的漏斗转化率)
•针对率值指标,最终转化成绝对值指标的线性组合。
数据指标波动分析
影响度衡量
在确定了影响因素之后,就是影响程度的衡量。如果影响指标单
一,影响度就显而易见,但当多个因素同时作用,且业务没有进行
ab实验时,各因素的影响程度就无法统一了。在具体业务中,通常
会有行业、大促、节日、拉新、促活等各种因素交叉影响,且没有完
全进行ab实验,这时候影响度口径的统一便比较困难。常用方法如
下:
•控制变量法
此计算方法是选择多个时间维度,分别和某一个固定的日期进行
对比,然后进行影响因素的叠加。以人均ipv为例,影响因素为活动
pop、运营坑位和外投,假设日常的影响为0,以上因素皆是影响增
量,然后求解方程组,得出各因素影响权重。
•坑位分析法
坑位分析法主要用于分析feeds上各坑位运营活动的影响。运用
排除的原理,聚焦到运营坑的影响度,然后其他因素为1-影响度。以
人均ipv为例:坑位人均ipv=坑位的曝光PV ×PCTR➗当日曝光UV=
坑位的点击pv/当日曝光uv,坑位贡献率=坑位变化值/总变化值
*100%。
•先验判断法
先验判断是依据之前活动的投放效果来评估的,将之前的影响效
果作为此次活动的影响度。
•边际效果归因
如果策略对kpi有影响,加大或减小策略的力度能够看到观测指
标发生相应变化。此方法的成本就是时间,通常长时间的加大或者减
小力度来判断指标的增减,但注意要同期对比,避免周期性影响。
•双重差分法
采用构造一个“对照组”的思路,需要两个人群满足“共同趋势
假设”的条件,即当受到外接影响时,策略人群和对照组有同样的变
化趋势。策略人群受策略和其他因素影响:策略效果 = a1 – b1,
对照组受其他因素影响:变化值=a2-b2,则策略效果=(a1 –
b1)-(a2-b2),但缺点是要求“对照组”和实验组样本尽可能相似。
版权声明:本文标题:指标数据变动概括 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1713189813a623158.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论