1、分布分析概述
1.1 什么是分布分析
分布分析,是将特定用户行为事件的参数经聚合计算得到的数值按照分组(区间化)呈现,从而了解统计指标的整体结构分布。
分布分析的计算逻辑,是计算在某事件X的某指标A的聚合函数数值进行区间分组作为一个维度下的某事件(可以是相同事件X,也可以是不同事件Y)另一个指标B的某个聚合函数数值(且高级配置可按另一个维度进行细分下钻)。
为形象化理解分布分析模型,简单示例如下:
1.2 可以用在哪些需求场景
哪些场景可能会用到分布模型?分布模型解决了怎样的需求,回答了什么问题?
举例如下:
(以下示例的统计指标都是“用户数”)
2、选择数据来源
3、选择统计指标
选择统计指标,就是选择某事件的某参数的某种统计量下的统计值。
可以选择该事件的PV,UV,PV/UV,也可以选择该事件下所带参数的聚合指标,对于数值类的参数(例如付款金额、照片数量、曝光长度等)可以选择计数、去重计数、最大值、最小值、求和、平均值作为聚合指标。对于非数值类参数,只能选择计数、去重计数作为统计指标。
4、选择分布维度
选定一个事件参数的数值分布区间作为维度,以及一个事件参数的计数数值作为统计指标,即可考察在不同区间下的指标分布情况。
例如下图,选择了搜索点击事件的总人数作为统计指标,以搜索点击次数作为维度,考察了搜索点击的用户人数分布。
5、区间分组策略设置
5.1 默认策略
默认区间分组策略采用平均分组策略,即根据所设置的组数n,将该参数整个区间平均分为n组,每组区间等长。如果参数数值全部相等,则默认分组组数自动统一为2。
您可以调整默认区间的组数,默认组数为20。
5.2 自定义策略
您可以可以自定义分布的区间范围。自定义区间,可以设置区间的间隔点,区间左侧除含负无穷时为开区间外,其余统一为左闭右开。
6、选择时间范围
支持相对时间/绝对时间/自然时间三种方式选择时间窗口。
7、分组查看
选择分组查看,选择某个属性后,则将其作为group by分组呈现数据。
特殊的是,在选择按照时间分组时,可以选择时间的颗粒度。
8、全局过滤
全局过滤功能可对将一个或多个事件属性、用户属性,或者某个用户分群、标签作为本次分析的数据过滤条件。当有多个全局过滤条件时,支持设置取 且/或 逻辑。
9、图表结果
可视化柱状图
柱状图只适用于没有按照属性细分的情况。
显示占比选项无法在柱状图中体现。
表格
呈现指标在各个分布区间的数值和占比。勾选了显示占比后,会显示同一维度下各区间的占比,并按照占比对表格进行染色。
数据下载
图表信息支持以CSV格式导出。