如何预测用户流失率,提前做好策略?

用户流失率直接反映了产品的市场接受程度如何,以及运营工作的好坏。预测流失率的目标在于预测用户将会在哪个时间点离开,从而提前准备好策略,留住他们。
什么是用户流失率?我们为什么需要关注用户流失率?
简单来说:用户流失率是指用户的流失数量与全部使用/消费产品(或服务)用户的数量的比例,是用户流失的定量表述,以及判断用户流失的主要指标,直接反映了产品的市场接受程度如何,以及运营工作的好坏。
一般来说,这个指标用在“订阅型产品”的情形居多,如信息订阅类App“锤子阅读”、绝大多数的在线SaaS产品,甚至传统的牛奶订购。
由于留住当前的用户要比获取新用户来的划算,所以预测流失率的目标在于:
预测用户将会在哪个时间点离开(在订阅期结束前),在合适的时间点对这些用户施加影响,挽留他们,如通过短信、邮件或APP,利用超低价商品吸引回访或者专属优惠券等,这些策略对于一些流失用户是很有效的!
接下来,笔者将利用简单的统计学知识,介绍一种基于用户不活跃记录的用户流失预测模型。
该模型在不使用机器学习算法的情况下,可以给出一个容易理解的用户流失预测,以便我们对将要离开的用户有一个相当准确的洞察。
废话不多说,进入正题吧~
一、用户活跃的操作性定义在我们正式开始预测用户流失率之前,我们需要记录用户的历史活跃情况。做这个的目的在于:了解用户是否在使用我们的产品或服务。
那么,问题就来了,用户的“活跃”该做怎样的操作性定义(即根据可观察、可测量、可操作的特征来界定变量含义的方法)?
实际上,“用户活跃”的定义取决于你的业务背景,跟产品或者服务场景密切相关,不同类型的产品对“用户活跃”有不同的定义。以新浪微舆情的“信息监测”为例,它是一款订阅型的大数据产品,用户通过各种关键词的组合检索到信息后,然后选择邮件或者客户端订阅,按照自定义的接收频次来收取订阅信息。
对于这款数据产品来说,用户的活跃可以这样定义:如果一个用户是活跃的,那么在指定时间段内(分析单位取决于分析者,可以是天、周、月、季度或年),应该包含如下付费、使用或者互动行为:
该用户对“信息监测”的订阅尚未过期;该用户在web端或者移动端登录产品页面;该用户使用了产品的部分或全部功能,如基于信息源或者地域的定向监测功能;该用户在此期间产生了一些消费,如文本数据下载、订阅续费等;该用户在此期间对该产品有各种反馈,包括投诉。…对于这款产品来说,以月份为单位来分析用户行为是很有意义的,因为该产品最短的订阅期是一个月,最长的订阅期是一年。
一旦清晰的界定了“用户活跃”的定义,我们就可以用这些操作性定义来对每个月份的用户(不)活跃情况进行编码,利用二进制值(0,1)—假如在X月份,用户是活跃的,将ta的活跃值设定为1,否则设定为0。
二、建立“用户不活跃档案”现在,对于每位用户,我们有了一个以月为单位的“活跃标记”,接下来我们以此为基础,建立起“用户不活跃档案”。这意味着,对于每个用户,笔者想对他们连续不活跃的月份数进行计数统计。
在这里,笔者选择了一年的“分析窗口”(也就是把12个月作为分析的时间范围),将“活跃档案”和“不活跃档案”以表格的形式呈现—蓝色表单显示每位用户在各个月份上的活跃记录,绿色表单则显示用户的不活跃记录。
根据用户在此时间段内可能出现的活跃情形,笔者枚举出3种典型用户,如下表所示:
1.用户A:该用户在刚进入“分析窗口”时是活跃的,然而在5月变得不活跃(也就是说,5月份是第一个不活跃的月份)。接下来,这个用户的不活跃状态持续到了12月,也就一直持续到了“分析窗口”的末尾
因此,从5月到12月,“用户不活跃档案”对用户连续不活跃的月份进行逐月累加的计数统计。
2.用户B:跟用户A一样,该用户刚开始也是活跃的。不同的是,该用户在3~6月期间是不活跃的,在7月仅维持了一个月的活跃状态, 接着在8月和9月又进入不活跃状态,最后在“分析窗口”的10月、11月和12月又回到活跃状态。
在这种情况下,每当用户由不活跃状态返回活跃状态时,前面的不活跃月份计数需要重置。也就是说:当我们再次对该用户的连续不活跃月份进行计数时,需要重新从1开始计数,前面的不活跃月份计数不再累加。
3.用户C:与上述提及的两类用户不同,该用户刚进入“分析窗口”时,是不活跃的状态。这种情形的发生,可能是用户的订阅早已过期(最好在正式分析前排除这种情形,因为很难处理),或者该用户在“分析窗口”开始前就是不活跃的。
因为我们看不到“分析窗口”前的用户活跃情况,所以用户在此之前的活跃状态,我们是不了解的。鉴于此状况,我们对这些月份进行特殊的标记—使用-1标记用户C头几个不活跃的月份。该用户其他的不活跃情形,可以参照前面两类用户方式进行计数。
Note:后面绿色的表单,也就是“用户不活跃档案”,才是我们接下来建立用户流失模型所需要关注的数据。
三、构建用户流失模型有了上述的关于用户不活跃的操作性定义,我们就可以在“分析窗口”内(1月份到12月份)以月份为单位,对从0到12的连续不活跃月份数上的用户数量进行计数统计。
这个步骤可以通过数据透视表实现—通过聚合每个月、每个不活跃级别的用户数量。 如下表所示:
上表中,从列的方向上来看,每个单元格的数值表示每个月的连续不活跃X个月的用户的数量。
举个例子来说:上表中第一个高亮数值(574),代表1月份已经不活跃1个月的用户数量,该数值来自于前面12月份的4815个活跃用户;第二个高亮数值(425)表示在2月份已经连续不活跃2个月的用户数量—425来自于574(1月份不活跃1个月的用户数,它是2月份不活跃2个月的用户数的基数)。值得注意的是:第一行的0个连续不活跃月份数,其实表示的是基数中活跃用户的数量。
使用这些数据,我们可以计算出在“分析窗口”内,每个月连续不活跃月份数的用户占比情况。如下面的绿色表格所示:
上表中,高亮的数值(74%)表示2月份已经连续2个月不活跃的用户占比。
该百分比是这样计算得到的:
笔者想获得最具代表性的数值,由此可以对分析窗口的最末4个月(9月,10月,11月和12月)取平均值。我们可能没有足够的数据去计算这些平均值(比如10月份、11月份和12月份)—在这种情况下,我们取所有可用数值的平均值(用于计算平均值的数值区域以红色线框标记):
四、计算用户流失概率哈哈,如果你还在看这篇文章,那么恭喜你!我们将要探讨最激动人心的部分。在这部分,我们将用上一点统计学的小知识。
让我们回顾一下本文的终极目标—计算各个连续不活跃月份数(0-12)下的用户流失概率。
也就是说,如果某个用户已经连续X个月不活跃,那么这个用户接下来将要流失的可能性有多大?
从数学上来说,我们可以使出贝叶斯公式这个大杀器来计算用户流失率。贝叶斯公式尽管是一个数学公式,但它的原理不要数字也能明了。如果,你看到一个人总是做一些好事,则那个人多半会是一个好人。这就是说,当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。
用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。
它的数学形式如下:
在这里,A和B都代表事件(event),同时P(B)≠0。P(A)和P(B) 分别代表A和B的先验概率或边缘概率。之所以称为”先验”是因为它不考虑任何A(B)方面的因素。P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。
在本案例中,对应的公式如下所示:
然并卵,上面公式里有一项是没啥意义的—P(连续X个月不活跃|流失),它的含义是“在已经流失的情况下,连续X个月不活跃的概率“。试想一下,假如你已经流失掉了,你不可能是一个不活跃的状态,这个概率值是么有啥业务意义的。
鉴于此种情形,笔者果断抛弃这一项(谨记!)。由此,我们得到了一个终极版的流失率计算公式:
接下来,让我们看看公式右端的两项(分子和分母),然后计算它们在每个不活跃月份上的数值,进而得到我们想要的用户流失概率值(注意,它是一个条件概率值,也就是在连续不活跃X个月的情况下的用户流失概率)。
先说说分母,P(连续X个月不活跃)是笔者之前计算过的数值—最后4个月的用户占比平均值:
P(1) = 19%P(2) = 81%P(3) = 89%P(4) = 92%P(5) = 93%P(6) = 95%P(7) = 96%P(8) = 97%…接下来,我们再来通过例子求解分子P(流失)。
首先,1个月不活跃的用户的流失概率P(C1)是多少呢?对于这些将要流失的用户,他们将要连续性的不活跃的月份数已经在我们所考虑的集合之内了,换言之,这些用户将要不活跃的月份数为1个月,2个月,3个月,…,。因而,我们这样定义已经不活跃1个月的用户的流失概率P(C1):
现在, 以同样的方式, 持续2个月不活跃的用户的 P(流失) ,也就是P(C2)是多少呢?对于这些将要流失的用户,他们将要持续性的不活跃2个月,3个月,4个月,…,12个月。因而,我们这样定义已经连续不活跃2个月的用户的流失概率P(C2):
通过归纳和演绎,我们以同样的方式来计算每个不活跃月份的用户流失概率:
在这里,n是连续不活跃月份数的极限值,而我们发现,这个概率是稳定的。从上面的表单里可以到:这个发生在第7个连续的月份,这里的概率值维持在95~96%。
简化起见,我们假设,在连续月份上不活跃是相互独立的事件,此时:
P(A ∩ B )= P(A)* P(B)
因而,我们可以采用如下的公式:
现在,我们已经算出了每个不活跃月份概率对应的分子和分母,那我们就可以启动最后一步—算出每个各个连续不活跃月份数的用户流失概率。先前我们已经讨论过了,n的值为7。
最终的计算结果如下表所示:
请注意,活跃用户(也就是第一行连续0个月不活跃的情形)的流失率由P(1) Ⅹ P(2) Ⅹ P(3) Ⅹ P(4) Ⅹ … Ⅹ P(7)计算得出。这里我们并没有除以任何值,这是因为当用户处于活跃状态时, P(连续0个月不活跃)为1。
最后,我们还可用一条流失率曲线来直观的反映流失率的变化情况,由此决定对非活跃用户进行挽留操作的最佳时机,该曲线所下图所示:
五、 结语在本文中,笔者并没有提供该模型批量化使用的具体执行细节,假若你理解了这个模型建立的逻辑,那么你可以使用SQL、Python,甚至是Excel来实现它。
此外,在实践中,这个模型最好是分不同的用户群进行运行。在本文中,笔者仅仅在某一类用户上运行,然而,根据不同的标准来划分用户群体会对实际业务更有意义。比如,你可以根据用户价值进行划分,然后对每个用户子群体进行用户流失预测。
当然,笔者只是在月份的尺度上进行用户流失分析,但是,对于很多业务场景,更细粒度的分析视角可能更有意义,比如按周和按天。
本文作者@苏格兰折耳喵 由(青瓜传媒)整理发布,转载请注明作者信息及出处!
产品推广服务:APP推广服务 广告投放平台 龙游游戏
本文地址:http://j4d.55jiaoyu.com/show-778885.html
本文由合作方发布,不代表展全思梦立场,转载联系作者并注明出处:展全思梦
推荐文档
- 11.PDD现在为什么不直播了?
- 12.任尔东西南北风前一句是什么(任尔东西南北风的前一句是啥来)
- 13.广东的一本大学有哪些学校?广东省一本大学名单排名(2023参考)
- 14.江苏南通职业大学(江苏南通职业大学有哪些专业)
- 15.天津高考作文(天津高考作文跑题了能给多少分)
- 16.上海财大录取分数线预测(上海财大录取分数线预测2022是多少分)
- 17.四级成绩什么时候出(四级成绩什么时候出2023年三月份的)
- 18.表达思念爱人的诗成语(表达思念爱人的诗成语有哪些)
- 19.2013会考成绩查询(2013会考成绩查询入口网站官网)
- 20.五年级牛郎织女缩写作文
- 21.简单一点的辞职信5篇
- 22.干警观看交通安全事故警示教育心得五篇
- 23.护理专升本难吗通过率有多大
- 24.图字行书图字书法图片大全(行书七字春联书法欣赏)
- 25.国家税务局山西省电子税务局网上申报系统怎么报税-牛求...(国家税务总局山西省电子税务局报税方法)
- 26.宝玉石鉴定与加工(宝玉石鉴定与加工毕业设计和任务书)
- 27.温情脉脉
- 28.淮北卫校(淮北卫校2023年招生计划)
- 29.cute是什么意思—mule是什么意思
- 30.新产品发布会开幕式致辞范文
- 31.学籍卡有什么用,学籍卡和学生证的区别是什么
- 32.中考体育没考好,可以申请重考吗?如何申请?
- 33.叫我如何不想她,叫我如何不想她赵元任唱
- 34.requires(requirespermissions注解)
- 35.动物医学就业前景(中国农业大学动物医学就业前景)
- 36.39所985大学排名2022最新排名-全国985大学最新排名2022
- 37.遵守教师职业道德情况总结
- 38.财务预算怎么做、财务预算怎么做模板
- 39.OPPO是什么意思OPPO是什么英文的缩写(oppo是什么意思oppo是什么英文的缩写)
- 40.袋鼠简笔画袋鼠简笔画简单又好看(qq红包袋鼠怎么画简笔画)
- 41.广东省教育局官网
- 42.送给兄弟的歌(送给兄弟的歌应该唱什么)
- 43.hd4000相当于什么显卡(笔记本hd4000相当于什么显卡)
- 44.初中毕业想学音乐去哪个学校(没考上高中可以上音乐学校吗)
- 45.985和211通俗易懂的解释
- 46.本科二批是什么意思,本科一批是什么意思
- 47.解放军第四军医大学(解放军第四军医大学录取分数线预测预测)
- 48.黑龙江工程学院邮编_黑龙江工程学院邮政编码查询_附地址和介绍
- 49.瞻仰是什么意思—瞻仰,是什么意思
- 50.现在学什么技术***(现在学什么技术***写不限学历,简单方便)
- 51.形容一个人城府很深的成语(形容一个人城府很深用什么成语)
- 52.傲然挺立的意思是什么(傲然挺立是什么意思解释)
- 53.色厉内荏是什么意思;色厉内荏是什么意思解释词语
- 54.词语解释:避世的意思是什么
- 55.busy是什么意思、bus是什么意思
- 56.天津师范大学是双一流大学吗?有哪些学科入选?
- 57.记一次游戏作文400字四年级上册13篇
- 58.往年安徽阜阳师范大学专升本招生专业汇总!建议收藏
- 59.租房协议书怎么写(租房协议书怎么写才有法律效力)
- 60.拉萨师范高等专科学校(拉萨师范高等专科学校往年录取分数线预测预测)
- 51.京雄高速设智慧车道测试无人驾驶
- 52.做活动烧了几十万老板肯罢休?如何做好一次活动复盘?
- 53.鲍威尔展露“鹰派”面目应对高通胀 其他经济体央行会否仿效?
- 54.证监会:抓紧制定出台个人养老金投资公募基金配套规则制度
- 55.如何确保我国粮食安全稳定供应?国家发改委回应
- 56.5步解决信息流推广3大痛点!收藏了~
- 57.中欧资本市场互联互通再突破 三公司拟境外发行GDR并上市
- 58.健身APP运营:让用户变成粘你的小妖精
- 59.湛江市化工技工学校怎么样?好吗?
- 60.APP获取用户的4个误区,你中招了吗?
- 61.2023年四川省宜宾县高场职业中学校招生指南
- 62.内江广播电视大学有哪些专业?有汽车维修专业吗?
- 63.乐山东风电机技工学校助学金资助政策
- 64.2023四川有汽车驾驶专业的中专中职学校有哪些,好不好
- 65.乐山2023年中考300多分读宝玉石加工与检测专业好不好
- 66.2023年广元读中专选择船舶电气装置安装与调试专业前景怎么样
- 67.乐山市医药科技学校医学影像专业都有哪些就业方向
- 68.南充川北护士学院食堂寝室怎么样
- 69.乐山市中区振兴中等职业学校校园环境介绍[图片]
- 70.内江2023年中考300多分读读社会福利事业管理专业有前途吗

