退出

用户流失分析的两大误区:“辛普森悖论”和“幸存者偏差”

游戏公司为了解用户的喜好,并提供他们想要的内容,需要经常对用户的行为进行分析。不过,韩国用户分析AI服务商在一次演讲中表示,由于游戏开发者们会认为“这是我制作的游戏,所以我比谁都了解这个游戏”,所以在分析用户行为时,常常会产生两个错误——“辛普森悖论”和“幸存者偏差”。

因为,即使是在同一款游戏中,既有比其他人更重视游戏内排名的用户,也有比起竞争、认为用包装角色更有价值的用户,情况多样。因此,详细的数据分析是很重要的。

第一个错误“辛普森悖论”:在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

假设有一款名字为A的游戏,为把握游戏A今后的发展方向,分析留存率图表是非常重要的事情。但在这里,如果只分析下图中两类用户的流失曲线,就很容易发生辛普森悖论。

如下图,随着时间的推移,两类用户在慢慢流失,呈现出了不同的曲线。如果只根据这两类玩家的流失数据制定对策,就会显得缺乏针对性。

因为,如果按照消费习惯对用户进行细分,可以看出每个分类下用户的流失曲线都有着明显的差异。因此,如果开发者能更全面一些,对用户进行更细化的划分,可以更容易地了解不同类型的用户不喜欢什么,以及为防止流失应该采取什么方法。

第二个错误是“幸存者偏差”:经过某种筛选而产生的结果,但没有意识到筛选的过程,因此忽略了被筛选掉的关键信息,进而得出错误的结论。

最具代表性的案例就是二战时,安全返回的战斗机的机翼和机尾处有很多弹痕,英美军方决定哪里弹痕多就加固哪里。然而,一个统计学家力排众议,指出应该注意弹痕少的部位,因为要把在战斗中未能存活下来的飞机也包含在内。

分析游戏时也很容易产生“幸存者偏差”的错误。很多人认为“把水平一般高的用户喜欢使用的角色推荐给新手是不是更好”,但实际上并不全是这样。因为,他们收集游戏上线第一天流失玩家的资料,以及游戏上线一段时间后流失的“水平一般高的玩家”的资料,对比后发现,这两类玩家对角色的取向显示出了完全相反的结果。

因此,分析用户数据,尤其是留存玩家的数据时,不仅要从时间的角度,还要从其他角度分析留存玩家的取向和流失玩家的取向,以对游戏进行更好的调整。