退出

谈谈游戏数据分析的那点事

前言

因为我实习的工作是游戏后端开发,所以难免会遇到游戏领域的一些专业知识,就比如游戏数据分析。因为之前从未接触过游戏这一块,所以很多东西得去学,在之前老大给我一个任务:统计一下XX款游戏近三个月的留存情况、Guide分布、付费情况,当时接到任务脑袋里是蒙的,留存??Guide分布??付费的指标有哪些??这些我都不知道,这些都属于游戏数据分析的内容,本文就记录一下我近期学习的游戏数据分析吧。

游戏数据分析的概念

在PC互联网时代,我们所熟悉的地啊你商务平台、门户网站等都需要做好数据分析,以提升转化率和转化收益。而在移动互联网时代,数据价值更加的被人们重视,通过数据分析发挥产品更多价值的思考。

就游戏领域来说,在多数游戏设计者来看,游戏是一件艺术品,是艺术灵感的最终产物,呈现的是人对于欲望的满足,是与用户心理和需求的博弈。几乎每一个游戏开发者,都会建立自己的基础统计分析系统来收集和统计游戏的数据,并进行分析。其目的是希望能够挖掘和转化更多的用户,转化更多的收入。

游戏数据分析就是重点聚焦于渠道运营、流量分析、游戏运营以及部分产品的设计分析,侧重于实践和效果检验,以经验模型和业务驱动为先导,注重归纳、指标分析、方案演进以及最终方案的实施和评估。

游戏数据分析的意义

对于一款游戏产品来讲,游戏数据分析是非常必要的。分析用户是否长期留存,并很好地享受和体验产品,成为能否获取更多稳定活跃用户和收益的关键,还有分析设备的适配、用户的分辨率、哪些用户付费最多、哪些关卡或设备流失率最高、哪些区域注册转化率最低等等,分析出的结果就是让设计者思考,游戏策略、关卡难度、活动设计、区域导量等方面的合理性,根据分析出的结果来适当的调整游戏的策略以及游戏对不同用户或设备的优化。对于任何一款游戏来说,游戏数据分析都是非常重要的,只有从分析的数据中得知这款游戏的下一步该怎么发展。

游戏数据分析的流程

对于游戏数据分析系统及数据的利用,分为了五个阶段:方法论、数据加工、统计分析、提炼演绎、建议方案。



方法论

方法论是数据分析的灵魂,是解决问题的普遍原则,贯穿分析始终的思想指导。这个阶段决定了我们如何埋点数据,如何设计分析指标,如何采集,如何组织数据。就游戏业务来说,从游戏数据分析角度,目前已经存在几套方法论,比如游戏早期市场提及的是PRARA,在进入移动游戏领域,以TalkingData的AARRR模型则提及得最多,这套方法论综合了PRARA、网站分析、社交网络分析等诸多分析的特色,结合移动游戏市场的情况,加以整理并提出的。方法论存在的意义就是要去解决问题,是对于问题、目标、方法和工具的概述。一方面解决业务问题,另一方面则是分析思维的指导,方法论的确立,决定了我们在游戏数据分析方向上要解决的问题、采取的方法和使用的工具等。

(1) 业务需求

方法论是对业务需求的最高层级的抽象,涉及具体业务时,在方法论的指导下,我们需要对业务需求进行拆解,而这个阶段,从数据分析的角度来看,就是该如何进行数据埋点。

数据埋点就是通过客户端或者服务端,通过在某些游戏位置追踪玩家游戏行为而得到的相关数据。这些位置则是未来对特定业务分析的基础数据支撑。比如,我们在进行用户注册分析时,需要在用户注册的相关代码和逻辑位置进行数据采集点的设计,这样当游戏有玩家参与时,我们就可以通过采集到的数据,进行整理,形成可计算的指标。

(2) 指标体系
当我们形成了基本的数据指标后,我们要形成完整的指标体系,并且要建立在方法论的指导基础之上。在多数情况下,指标具有很强的业务导向性和监测作用。比如在我们进行数据日报的制作过程中,我们就需要按照一定的逻辑组织我们的数据,用户类数据,收益类数据,渠道数据等等。与此同时,在这些指标基础之上,数据分析人员可根据需要,进一步加工和变换指标,从而完成深度分析,比如我们对于新增付费用户的研究,用户生命周期价值的探讨等,就需要在基础数据的指引下,进一步建立新的数据规划和指标拆解。

数据加工

对数据进行处理使其最终变成信息,这个阶段统称为数据加工.在数据加工阶段,我们重点要去解决的问题有两点:业务理解、技术开发。



(1) 业务理解

系统最终是需要技术开发的,在选定技术和工具之前,最重要的是要充分理解需求和标准定义。在开发人员完成开发后,如果发现其数据处理的结果并非是分析师或者业务人员所需要的,那么就浪费了很多的时间和资源,因此是否形成一直的指标定义认识,是否明确统一需求,需要分析师、业务人员与开发团队共同商议,形成统一的认识,否则将面临重复开发,需求更改等等一系列的问题。在所有人员在这些问题达成一致后,接下来就要解决的是技术开发问题。

(2) 技术开发

确立使用什么技术和架构来完成整体的数据分析平台的建设,这是需要技术人员去评估的,而评估的一个重要参考就是前一个阶段所确立的内容,技术人员对于业务分析需要的理解,决定了未来构建的数据平台的很多因素,比如高安全性、高效性、高可靠性、高可用性、高可扩展性和可管理性,等等。

在数据采集层级,我们需要解决数据的发送机制、采集内容和存储方式等。就目前的移动互联网游戏来说,主要采取在游戏客户端植入统计分析SDK的方式来完成数据的采集,当然,在部分公司中,也采取了游戏服务器端完成数据的采集。两种方式各自具备优势,通过SDK植入游戏客户端的采集方式,在有关游戏用户终端设备的信息,用户会话时间等方面具备优势,而通过服务器端的数据采集,则在游戏内诸如等级分析、关卡任务分析方面具备优势,但是对于游戏用户在客户端设备上一些行为则无法做到采集和分析。比如,在移动游戏客户端的错误日志中,多数情况下无法通过服务器端获得的宝贵数据。

统计分析

统计分析包含了统计和分析。统计分析是商业智能的一方面,商业智能应用还包括决策支持系统(DSS)、查询和报告、在线分析处理(OLAP)、预测和数据挖掘,统计分析则是整理数据和分析数据的综合。

此前我们需要收集数据,但是目的都是整理数据且最终要进行分析数据,数据向信息转化的过程。为此需要描述数据的性质和研究数据关系,并通过一定的模型来变换角度解析数据内在的联系,而如果整体系统的开发度更高,则可以就模型本身进行有效性的验证。在部分公司提供的统计分析系统上,我们已经能够看到部分的预测分析,这也是向下个阶段提炼演绎的重要过渡。

提炼演绎

可以预见的是,当数据分析由系统来实现时,我们需要对关键业务具备数据的归纳和业务分析的模型组织。在很多情况下,经过积累,需要将一些重要业务和分析进行归纳,总结出长期可以使用的分析模块和数据采集体系,如此当我们每一次面临新游戏需要数据统计分析时,则不需要更多的额外开发成本。

以移动游戏统计分析为例,在经过不断的业务提炼和模型演绎后,从分析角度来看,如图所示的几个模块是最为关心的。



在如今移动游戏市场,服务于第三方游戏统计分析服务的平台提供了标准的数据接口,从数据采集的角度,我们可以确立一些标准统计接口。



游戏数据指标



在游戏数据分析中,有非常多的指标需要去分析,从这些指标中能发现有价值的问题,它是游戏行业的“基本沟通语言”。下面总结一些常见游戏数据指标。

运营数据


平均同时在线人数(ACU: Average concurrent users):在一定时间段抓取一次数据,以一定周期为期限;周期内的ACU可取时间段的平均数据。
最高同时在线人数(PCUeak concurrent users):在一定时间内,抓取最高在线数据。
充值金额:在一定周期内充值总金额。
元宝消费金额:在一定周期内,玩家在游戏商城中的消费总金额(充值金额与元宝消费金额有着明显区别,上者受活动影响,下者受商城道具需求影响。)
每付费用户平均收益(ARPPU: Average Revenue Per Paying User):相似于下载游戏的消费比率,此类数据主要衡量付费用户收益(公式:月总收入/月付费用户数)
平均每活跃用户收益(ARPU: Average Revenue Per User):主要衡量游戏整体贡献收益(公式:月总收入/月活跃用户)
平均生命周期:有新增账户在首次进入游戏到最后一次参与游戏的时间天数。比如记录某一个月,这个月里,每个新增用户的生命周期之和/MAU=平均生命周期。
LTV生命周期价值(LTV: Life Time Value):约定一个计算的生命周期值(比如上个月的平均生命周期,或者约定为15日,即这个月有15日登陆记录的账户数),符合这个生命周期条件的账户数中,充值金额的和/条件账户数。
每日注册并登陆的用户数(DNU: Daily New Users)
新登用户中只有一次会话的用户(DOSU: Daily One Session Users):主要衡量新用户的质量,买量的可以参考一下。
每日登陆过游戏的用户数(DAU: Daily Active Users)
七天内登陆过游戏的用户数(WAU: Weekly Active Users):主要衡量周变化。
30天内登陆过游戏的用户数(MAU: Monthly Active Users):主要衡量产量的粘性以及用户的稳定性。
月流失率:(公式:30天前登陆过游戏,30天内未登陆游戏的用户数/MAU)
周流失率:(公式:7天前登陆过游戏,之后7天内未登陆游戏的用户数/WAU)
日流失率:(公式:统计日登陆过游戏,次日未登陆游戏的用户数/统计日DAU)
30日留存率:新用户在首次登陆后的第30天再次登陆游戏的比例
7日留存率:新用户在首次登陆后的第7天再次登陆游戏的比例
3日留存率:新用户在首次登陆后的第3天再次登陆游戏的比例
次日留存率:新用户在首次登陆后的次日再次登陆游戏的比例

用户状态数据监控


活跃用户数:对于活跃用户,每家定义各有不同.7天内有3天登陆过账号的便可成为活跃用户。
新增活跃用户数:首次上线游戏的用户数
流失活跃用户数:上期(7-14天)有过登陆,在本期(最近14天)未登陆的用户数。
回流活跃用户数:上期(7-14天)未登陆,在本期(最近7天)有登陆的用户数。
活跃用户流失率:(公式:(本月流失用户/上月活跃用户)100%)
活跃用户充值率:(公式:(本月活跃付费用户/本月活跃用户)100%)
活跃用户在线时长(单位/小时):(公式:当期(7天)所有活跃用户在线时长总和/当期(7天)活跃用户数)
付费用户在线时长(单位/小时):(公式:当期(7天)所有付费用户在线时长总和/当期(7天)付费用户数)
新增活跃用户充值率:(公式:(本月内有充值的新增登录用户/本月总新增登录用户)100%)
新增活跃用户高活跃率:(公式:(本月新增登陆用户中的高活跃用户数/本月新增登陆用户数)100%)
用户Guide分布:新手引导点用户比例(公式:当前Guide点用户数/上一个Guide点用户数)

付费用户状态


付费用户数:截止到统计日,所以曾经有过充值的用户总数。
新增付费用户数:当期付费用户数减去上期付费用户数。
活跃付费用户数(APC):当期(周/月)有过充值行为的用户数。
流失付费用户数:上期有登陆行为,当期没有登陆的付费用户数。
回流付费用户数:上期未登陆,在当期有登陆的付费用户数。
付费用户流失率:当期流失付费用户数/上期活跃付费数。
付费用户月平均充值次数:当期所有充值次数/当期付费用户数。
付费用户月平均充值金额(RMB):当期充值总额/当期付费用户数。
忠实付费用户数:当期统计结束,后续2-3期之内,每期都有充值行为的用户数。

上文的“当期”即现在周期的意思,例如3天、7天、30天都是一周期。

运营成本


投入/运营成本(RMB):本月为推广游戏而投入的营销及市场费用金额
产出/元宝消费金额(RMB):玩家周期内(日/周/月)在游戏中的消费总金额
投入产出比(ROI):简而言之,就是说付出与回报是否成正比。(公式:本月的产出/本月的投入)
单个活跃用户推广成本(RMB):(公式:本月投入/本月新增活跃用户数)
单个付费用户推广成本(RMB):(公式:本月投入/本月新增付费用户数)