用户生命周期

1、用户生命周期模型概述

1.1 应用场景

用户生命周期模型常用于这样的场景:期望了解产品应用在某个日期或是某段日期的用户中,新用户、留存用户、回流用户和流失用户的比例,以求科学地了解当前用户的生命周期阶段分布,从而获知产品的运营阶段,针对性地制定当前阶段下最有效的运营举措(如拉新、促活、召回)

1.2 分类原理

将用户从第一次访问产品到流失的整个过程中进行阶段划分,可分别定义新增、留存、回流和流失四个阶段,用户生命周期模型正是用此方式对客户进行分类分析的模型。将用户按照生命周期进行划分,有助于企业分析产品运营走势和可能流失的用户,从而制定针对性的运营策略。

基本定义如下:

活跃用户:周期内触发指定事件的用户称为活跃用户。

新增用户:历史上从未访问过产品,在本周期访问产品且活跃的用户(系统实际根据『是否首日访问』字段判定)

留存用户:上个周期活跃,本周期也活跃的用户。

回流用户:历史周期访问过,上个周期未活跃,本周期活跃的用户。

流失用户:上个周期活跃,本周期未活跃的用户

为了更好的理解,我们假设今天是5月30日,以「天」为时间间隔粒度,对假定的5月29日这一天的用户进行分类,得到如下图示

image602.png

2、选择数据来源

image604.png

在数据来源下拉框选择需要分析的数据集。

3、选择活跃事件

image606.png

选择事件后,当用户在周期内触发了这一事件后,我们就定义为该用户在这一周期内『活跃』了。如果选择的事件是 APP 启动、小程序启动这类用户必经事件,等效果等同于后续图表是对应用的所有活跃用户进行分类;如果选择的只是某个功能事件,则后续图表中的流失、回流、留存的定义均只针对此功能。

但无论如何选择,都不影响新用户的定义,新用户的口径恒定根据『是否首日启动』字段值是否为 Y 来判定,即只考虑应用的新用户,而不判定功能的新用户。

4、选择时间范围

image608.png

支持相对时间/绝对时间两种方式选择时间窗口。

5、选择事件间隔

image610.png

支持指定时间间隔,即结果展现的柱形图中一根柱图或是表格中一行数据所包含的时间跨度。

image612.png

6、选择指标

image614.png

支持切换分析活跃用户与流失用户指标,切换流失用户指标后,是对活跃用户中『流失用户』这一群体进行更细分的分析。其定义如下图:

image616.png

7、选择全局过滤

image618.png

全局过滤功能可对将一个或多个事件属性、用户属性,或者某个用户分群、标签作为本次分析的数据过滤条件。当有多个全局过滤条件时,支持设置取 且/或 逻辑。

8、结果展现

结果展现分为柱形图与表格两种形式。用于展现在当前的时间范围和间隔设置下,各个周期内的不同类型用户分布。

image620.png

其中柱形图展现形式支持在用户人数与占比之间进行切换,以查看不同类型的用户绝对人数或是相对占比比例。

9、另存为结果表

      此联动功能将在同时采购了企点增强分析(AA) 产品的条件下开启。

      支持每日自动根据配置的模型信息计算出结果数据,并将数据同步至增强分析(AA)产品可查询的普通表数据集中。配置过程如下:

      1. 有结果数据且已保存的分析模型,可在右上角更多中启用此功能。

      2. 在模型结果环节,在此确认查询口径以及下方的结果表数据预览。留存率将从百分数格式改为四位小数格式(超出部分四舍五入)。

      3. 点击下一步,确认表结构(字段)配置信息,对于从已保存的模型中生成的结果表,系统将自动读取模型中配置的字段别名作为字段显示名,并读取默认字段类型。如果此环节系统赋予的字段类型不符合您后续的分析诉求(尤其是时间维度),请在此环节进行更改。

      4. 点击下一步,进入最终的信息与更新设置环节。基础信息中,数据集名称代表了未来在数据管家中列表页查看到的名称,数据表名称则代表了未来使用 SQL 查询这张结果表时的唯一表名。

      

       更新设置中,手动更新代表仅希望将当前的数据同步至数据集中,后续无需更新。而周期性更新则代表希望系统在设置的频率下自动查询最新的数据,例如每天、每周或每月。频率中的具体执行时间推荐凌晨01:00-07:00,避免挤占日常分析、查询、使用产品的计算资源。

      更新有效期:默认为180天,即产品将在180后自动停止更新。可修改为7天-永久的有效期,除长期、确定的核心指标内容,建议最长使用365天的有效期,以避免大量历史任务积累,影响平台性能。

      数据覆盖策略:周期性更新任务将有多次更新,因此涉及多次更新中『同一维度的同一指标结果值不同』的场景,需要指定更新策略。比如模型配置为每次查询最近7日数据,经过100天后,第101日将查询到94-100日这七天的数据。除了100日的数据是本次新增的,94-99这六天都已经有了历史数据。如覆盖策略配置为『覆盖相同维度数据』,则最终结果为第100天数据新增,94-99日数据更新为最新查询到的结果,1-93日数据保持不变。

      如果设置为『替换全部数据』,则1-99日的历史数据全部都会被删除,再使用最新查询到的94-100日这七天的数据替换新增,最终只有库中只会有这7天的数据。

       如果设置『仅新增数据』,则不会将新增数据与历史数据进行比对,总是将新数据进行插入,可能出现重复数据。

      如果担心覆盖策略较为复杂,影响同步结果。建议模型配置时将时间设置的范围与更新频率保持完全一致,例如每日更新的数据,模型里查询的数据时间范围只查询最近1天,这样将不存在维度数据重合的问题,数据覆盖策略选择覆盖相同维度或仅新增数据均可。

       5. 在增强分析(AA) 系统进行可视化组件配置时,选择数据集时搜索自己设置的数据集名称,即可使用这张结果表。