分布分析

1、分布分析概述

1.1 什么是分布分析

分布分析,是将特定用户行为事件的参数经聚合计算得到的数值按照分组(区间化)呈现,从而了解统计指标的整体结构分布。

分布分析的计算逻辑,是计算在某事件X的某指标A的聚合函数数值进行区间分组作为一个维度下的某事件(可以是相同事件X,也可以是不同事件Y)另一个指标B的某个聚合函数数值(且高级配置可按另一个维度进行细分下钻)。

为形象化理解分布分析模型,简单示例如下:

image520.png

1.2 可以用在哪些需求场景

哪些场景可能会用到分布模型?分布模型解决了怎样的需求,回答了什么问题?

举例如下:

   (以下示例的统计指标都是“用户数”)

2、选择数据来源

image522.png

3、选择统计指标

选择统计指标,就是选择某事件的某参数的某种统计量下的统计值。

可以选择该事件的PV,UV,PV/UV,也可以选择该事件下所带参数的聚合指标,对于数值类的参数(例如付款金额、照片数量、曝光长度等)可以选择计数、去重计数、最大值、最小值、求和、平均值作为聚合指标。对于非数值类参数,只能选择计数、去重计数作为统计指标。

image524.pngimage526.pngimage528.png

4、选择分布维度

选定一个事件参数的数值分布区间作为维度,以及一个事件参数的计数数值作为统计指标,即可考察在不同区间下的指标分布情况。

例如下图,选择了搜索点击事件的总人数作为统计指标,以搜索点击次数作为维度,考察了搜索点击的用户人数分布。

image530.png

5、区间分组策略设置

5.1 默认策略

默认区间分组策略采用平均分组策略,即根据所设置的组数n,将该参数整个区间平均分为n组,每组区间等长。如果参数数值全部相等,则默认分组组数自动统一为2。

您可以调整默认区间的组数,默认组数为20。

image532.png

5.2 自定义策略

您可以可以自定义分布的区间范围。自定义区间,可以设置区间的间隔点,区间左侧除含负无穷时为开区间外,其余统一为左闭右开。

image534.png

6、选择时间范围

image536.png

支持相对时间/绝对时间/自然时间三种方式选择时间窗口。

7、分组查看

选择分组查看,选择某个属性后,则将其作为group by分组呈现数据。

image538.png

特殊的是,在选择按照时间分组时,可以选择时间的颗粒度。

image540.png

8、全局过滤

image542.png

全局过滤功能可对将一个或多个事件属性、用户属性,或者某个用户分群、标签作为本次分析的数据过滤条件。当有多个全局过滤条件时,支持设置取 且/或 逻辑。

9、图表结果

     可视化柱状图

柱状图只适用于没有按照属性细分的情况。

显示占比选项无法在柱状图中体现。

image544.png

      表格

呈现指标在各个分布区间的数值和占比。勾选了显示占比后,会显示同一维度下各区间的占比,并按照占比对表格进行染色。

image546.png

      数据下载

图表信息支持以CSV格式导出。