1、归因分析概述
在进行行为埋点分析的工作中,我们通常会在以下场景需要用到归因分析模型来量化不同用户行为对最终转化目标的贡献大小:
1)用户先从渠道A的广告链接来访小程序,又从渠道B的广告链接来访小程序,最终完成了小程序的用户注册,想知道不同渠道广告对注册的贡献度。
2)用户从 APP 中不同的推广位入口进入了活动页面,最终完成了活动的参与,想知道不同推广位入口对活动的目标贡献度。
3)用户在 APP 中会触发多个位置的内容推荐曝光,最终完成了内容账号的订阅,想了解不同曝光位置对订阅转化的贡献度。
想要对以上场景进行贡献度的分析,首先就要对整个流程中的行为进行分类。我们将最关注的,代表完成了转化或是业务目的事件,叫做「目标事件」。例如会员开通、商品购买、活动通关等都是常见的「目标事件」。而需要观测分析的前置行为,则是「待归因事件」。例如首页推荐广告点击、消息中心推送点击、相似内容推荐点击、广告落地页访问等。
在此之外,还有一种特殊的事件,我们叫做「过程事件」。过程事件不参与贡献度的计算,只用作对「待归因事件」的筛选排除。例如设定「浏览商品详情页」为「过程事件」,那么就算客户点击了首页中的广告点击事件,只要在「目标事件」前没有发生过过程事件,我们都视作未完成转化。
为了方便理解,接下来我们以日常生活中最常见的电商场景为例,通过甲乙丙丁的行为序列来对归因中的名词概念有一个更直观的了解。
在这个例子中,我们想要分析不同的广告推荐位对订单转化的贡献,因此「首页推荐广告点击」、「相关商品广告点击」、「首页直播广告点击」都是待归因事件,「购买订单提交」则是目标事件。
而有时由于订单转化还有别的途径,比如以旧换新、赠品附送等,为了聚焦于我们的分析目标,我们还可以将「浏览商品详情页」定义为过程事件,这样通过其他途径完成目标事件的使用链路不会被视为完成转化,例如丁。
这种在对事件进行分类定义后,通过行为事件数据的前后关联表现来衡量某些待归因事件对一个目标事件贡献的模型,就叫做归因分析模型。
2、选择数据来源
在数据来源下拉框选择需要分析的数据集。
3、选择窗口时间
窗口时间支持切换『自定义』时间与『当天』,选择自定义1天,我们就只会对目标事件发生时间的前1天内的数据进行追溯计算。例如用户 A的『购买』 事件作为目标事件发生在8月8日的23:31,那么系统只会将用户 A 从8月7日23:31到8月8日23:31之间触发的待归因事件纳入统计范围。
而如果选择当天,则追溯用户待归因事件的时间范围起点变为当天00:00。
4、选择事件
4.1 目标事件
可从事件的下拉列表中,选择一个代表本次分析中转化目标的事件。
4.2 待归因事件
可从事件的下拉列表中,选择一个或多个代表本次分析中的待归因事件。此外,待归因事件还支持根据事件属性字段分组,其含义为:将单个事件按分组属性字段的枚举拆分为多个值,各自独立参与归因分析的计算。例如,商品在曝光时可能使用了不同的广告内容素材,我们想要验证是否某些素材会带来更高的目标转化贡献,此时就可以在商品曝光事件中设置 广告系列内容 作为分组字段,最终我们就可以分别看到内容素材1、2、3、4…各自的贡献度。
4.3 过程事件
可从事件的下拉列表中,选择一个代表本次分析中用户转化前必须经历的过程事件。非必选项。
4.4 关联参数
在使用流程中,可能出现这样的情形。用户在首页点击了 A 商品的广告,查看完后没有购买,之后在 APP 内进行了一系列操作,又从新品上市的推送中点击查看了 B 商品,最终购买了 B 商品。这其中,「首页广告点击」和「新品上市推送点击」都是待归因事件,而「商品购买」是目标事件。
假如我们认为,构成目标贡献的待归因事件发生时一定是对应同一个商品,那么就引入了「关联参数」这一新的概念。在上面的例子里,商品 ID 就可以是我们的关联参数,我们设定待归因事件所携带的商品 ID 值要与目标事件的商品 ID 值相同,于是由于A ≠ B,「首页广告点击」没有获得归因的贡献度,「新品上市推送点击」获得了贡献度。
以乙为例,设置关联参数后,「首页推荐广告点击」同样没有贡献度。
以乙为例,并非所有待归因事件中都需要关联参数,因为有的待归因事件天然不携带所指定的参数。
5、选择时间范围
支持相对时间/绝对时间/自然时间三种方式选择时间窗口。
6、选择归因方式
通过上述设置,归因模型已经能够判断某个行为链路中某个待归因事件『有没有作出贡献』。但如果一次完整的归因转化中,多个事件都作出了贡献,模型又是如何评判贡献大小的呢?
「归因方式」,正是用于指定多个事件为一个目标事件作出贡献后,指定贡献度分配比例的选项。「归因方式」一共分为五种:
1)首次触点模型:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个「待归因事件」贡献度为 100% 。
2)末次触点归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为最后一个「待归因事件」贡献度为 100% 。
3)线性归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为每个「待归因事件」平均分配此次贡献度。
4)位置归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个和最后一个「待归因事件」各占 40% 贡献度,其余「待归因事件」平分剩余的 20% 贡献度。
5)时间衰减归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为越靠近「目标转化事件」做出的贡献越大。
最终在分析时,根据业务实际口径需要,选择适合的归因方式即可。
7、其他转化
其他转化指那些没有加入待归因事件,但仍然发生在目标事件发生前窗口时间内的事件。例如用户在购买产品前5分钟修改了个人头像,我们显然不会将修改头像事件加入待归因事件,因此这一事件的转化就被当做其他转化。
产品支持切换计入或不计入,但默认选项为『不计入』,以避免其他无关事件对归因计算的干扰。
8、全局过滤
全局过滤功能可对将一个或多个事件属性、用户属性,或者某个用户分群、标签作为本次分析的数据过滤条件。当有多个全局过滤条件时,支持设置取 且/或 逻辑。
9、结果展现
归因分析结果最终将以表格的形式进行呈现。触发规模指待归因事件被用户触发的规模,其中『触发次数』指标等于所在行待归因事件在设置时间范围的 pv,『有效转化的触发』指标等于 pv 中在窗口期内最终完成目标转化且满足关联参数、过程事件条件的次数,两者相除就得到了『有效转化率』。而目标转化则是指待归因事件所带来的『目标事件的触发次数』,以及结合所有条件过滤和归因方式加权后得到的『贡献度』占比。