【蜘蛛智链】包装供应链公司_包装盒批发定做厂家

分析如烹饪:我们一起做数据大厨吧!

马苏 880657

编辑导语:数据分析是有组织、有目的地收集和分析数据,并将其转化为信息的过程。整个过程复杂繁琐。作者巧妙地将数据分析的步骤与烹饪的每一步进行了对比,以烹饪的形式讲解了一份数据分析报告。感兴趣的朋友,过来看看。

还记得那本指导我入门数据分析的书吗,那本书把数据分析的步骤和做菜的每一个步骤进行了对比,很生动,印象深刻。

数据分析的选择是基于自己的行业和与职业发展的契合程度。一路走来踩过很多坑,也收获了很多成功。感谢我遇到的每一个天使!

下面我带大家以做菜的形式做一个数据分析报告。

一、分析背景&数据来源(备料)

阿里作为国内电商巨头之一,在快速发展的同时,也面临着诸多残酷的竞争。

电商平台作为一个复杂的生态系统,有不断入驻的品牌商家,其下有庞大的消费群体。平台作为连接器,肩负重任,勇往直前。

母婴品类是平台的重点品类,特点是消费者和用户分离,购买决策周期长。本次分析主要基于阿里母婴类目的数据,通过SWOT分析确定本次分析的背景,如下图:

基于以上SWOT分析,我们需要进一步用数据来论证平台母婴发展的现状和机遇,以及洞察后如何抓住机遇。

来源:阿里巴巴天池

https://tianchi.aliyun.com/dataset/dataDetail?数据标识=45

它包含两个报表:产品信息表和消费者信息表。

该报告的具体字段如下图所示:

了解每一列的含义数据分类,分为3大类:用户、行为和产品

用户数据:用户id、出生日期和性别;

行为数据:用户id、购买数量、购买时间;

数据:项目编号、一级分类、二级分类、商品属性。

二、分析目的

通过分析2012年7月至2015年2月母婴类产品的用户数据,可以洞察母婴类的发展现状,找出现状背后的原因,为2015年平台的进一步发展提出有效的建议。

三、分析思路

首先,分析手头的两份报告:

根据报表的字段含义和记录行数可以看出”产品信息表”是主表,”用户信息表”是副表;从整体与部分来看,”用户信息表”中的用户ID是”产品信息表”中用户ID的部分,侧面说明用户信息表是一个小的样本集。

因此,本文的分析重点是“产品信息表”,“用户信息表”可以起到辅助作用。

其次,观察“产品信息表”的统计周期是从2012年7月到2015年2月,以自然年为筛选条件。因为12、15年数据信息不全,所以重点分析年份为13、14年。

再次,进一步看产品信息表中的字段,可以发现核心字段是采购数量,从中可以衍生出一系列指标:年营业额和年营业额增长率。

综上所述,在分析时间段和核心指标确立后,可以对【采购量】提出以下问题:

2013年和2014年的年成交量是多少?对比2013年,2014年的年成交量增速是多少?

通过初步数据验证,得到如下图:

最后,澄清问题:

通过观察商品信息表中2012年7月至2015年2月母婴品类的销售数据可以发现,2014年相比2013年全年营业额增长了49%,那么14年增长的原因是什么?

如果要在15年继续增长,应该在哪些方面进一步提高?

这样一来,分析思维的脑图就形成了,如下图:

四、分析内容(切配+烹饪+打荷)

根据年成交额=交易用户数*人均成交额的公式,将公式的组成部分逐级拆解。

假设一:14年人均成交额增长带动整体成交额。

证据收集:下图是13年和14年人均营业额随时间变化的折线图。

结论:从图表中可以看出,13年和14年人均营业额的减法差为0.05,几乎可以忽略不计,所以人均营业额的增加带动全年营业额的假设不成立。

假设二:14年用户数量的增加会带动整体营业额。

证据收集:下图是13年和14年客户数量柱形图。

结论:从图表中可以看出,14年客户数量的增长趋势与14年年营业额的增长趋势相似。由此可以得出结论,14年全年营业额的增加来源于客户数量的增加,这个假设成立。

紧接着得出结论,进一步分析【完成交易用户数】的组成部分,即完成单笔交易用户数和完成复购用户数。

由于数据的统计周期并不完整,为了严谨起见,本文并没有简单的将单个用户的数量定义为新增客户。通过数据整理,得到如下图:

综上所述,14年总成交额的增长是因为单笔交易用户数的贡献。

由此,单个用户数量增加的原因是什么?

假设一:平台提供的活动推广,吸引了大量具有打折心态的用户,促进了他们的转化。

取证:可以通过月度交易用户数的波动趋势来挖掘活动日程,从而进一步锁定5月和11月,对比分析两年内同月同类活动的交易用户数差异是否明显。

结论:活动确实对用户有吸引力。比如14年双十一当天的用户量是13年的近两倍。也可以从侧面说明,心智活跃的人在活动中更容易被平台转化。

如果2013年和2014年有具体的活动时间表,可以进一步论证假设。

假设二:平台提供的产品更加丰富,持续创新可以吸引大量用户,促进其转化。

证据收集:下图2根据产品信息表中产品ID的字段进行分类统计对比,判断平台对产品品类的拓展或迭代更新是否能吸引到有此需求的用户。

14年交易类型数= 13年和14年产品类型总数+14种新交易类型

结论:丰富的产品类型才能体现平台的运营能力,满足更多用户的需求是用户多池蓄水的必要条件。通过数据验证,假设成立。由于数据分析的时间段集中在13年和14年,结论需要更多后续数据集验证。

根据产品丰富度的结论,下图是产品丰富度的进一步细分,如下图所示:

如何提高产品的丰富性将被拆解成以下两个问题:

如何将产品系列做精?如何将产品带做宽?

无论是二类品类数量的不断扩大,还是同一品类内细分产品数量的增加,都有利于扩大平台产品的丰富度。那么如果平台在现有资源下只能先选择一个方向,哪个方向效果会更好呢?使用相关性分析,见下文:

1. 产品水平方向扩充(一级类目下二级类目数量增加)

2. 产品垂直体系扩充(同一类别下产品数量增多)

综上所述,相关系数对比表明,拓展产品的垂直体系,对于吸引更多用户,促进其转化更为有效。

另外,从上面的散点图观察,可以发现有一些异常值,如下图所示:

分析可以发现,异常值与总成交额中的批发订单有关,即有少量单笔订单采购量超过10件,具体比例如下:

根据以上分析,显然“人”是一个关键因素。那么,作为一个平台,2015年持续增长的动力是什么?

接下来,我开始重点分析开头提到的子表:用户信息表。把如何获取更精准人群的问题拆解一下,可以产生以下子问题:

谁是主要消费者?

消费能力怎么样?

不同性别和年龄段对一等品类的倾向如何?

五、结论

通过分析产品信息表,我们可以得出以下结论:

14年,年营业额增长49%,其指数的增长是因为用户数量的增加。对用户数量的进一步分析表明,该平台具有创新能力强、复购率低的显著特点。

因为现有的数据报告很少,不足以论证回购率低的原因。根据人均销售额可以猜测复购率与平台上销售的产品有关,比如产品非常耐用,或者在使用中倾向于一次性;

拉新能力强,体现在单笔交易用户数占99%+。通过分析单笔交易用户数的购买行为数据,可以发现其受到活动吸引力和产品丰富度的有效影响。

通过具体分析13年和14年具有显著活动特征的月份,以5月和11月两个活动高峰为佐证,发现14年活动当天用户的交易笔数远高于13年同期,甚至达到翻倍的效果。可见,具有聚划算等活动心智的用户更容易被平台转化。

产品丰富度是一个平台持续扩张和运营的核心指标。通过相关性分析,平台可以通过招募更多的商家或者开发更多的产品系列来促进用户订单的转化。相关性分析表明,该平台可以在一个细分品类中提供更多的产品,降低用户的脱落率。

六、建议

根据以上结论,在AARRR模型和回归分析的基础上,分别提出以下建议:

1. AARRR模型

找到人,留住更多人,提高收入,扩大规模。

获得准确的客户群:

低成本获得的大量人群画像有:

0-3岁之间的男孩女孩,女孩优先。精准的人群获取,可以通过推送高相关品类的Top3产品来吸引。比如针对0-3岁之间的女孩,推送Top3产品的“50014815”广告图来吸引她们。

激活并保留:

活动是吸引新、刺激复购的有效措施,平台可以增加活动日程和活动的互动玩法。

推荐:

平台可以鼓励商家采用会员制或者带来新的措施来增强用户粘性。

2. 回归分析

可以预测2015年的销量,从而调整和优化各部门的KPI指标。

图片来自互联网

如上图所示,可以根据2015年总营业额目标分解成各个一级品类的目标,从产品角度可以开发迭代多少产品。

以上是我的数据分析报告,欢迎交流讨论!

作者:鲸歌,电商行业数据分析师,为头部品牌提供数据咨询服务,热衷于学习和分析,是“数据创造者联盟”成员。

本文由@某数据人自留地原创发布于蜘蛛智慧链,未经允许禁止转载。

图片来自PEPEPEELS,基于CC0协议。