【蜘蛛智链】包装供应链公司_包装盒批发定做厂家

构建数据中心“逻辑框架”,让业务从零开始

贡米 435786

要调到一个新的商业公司数据团队,需要从零开始搭建数据中心,往往让人无从下手。本文作者根据自己转岗的经历,按照实践中的逻辑思维给出了详细的例子,帮助数据分析师新手进一步学习数据库的应用,推荐有困惑的数据分析师阅读学习~

数据中心的整体思路是基于现有的业务系统。在访问数据之后,模型被部署在前端以支持业务分析场景。

1. 项目目标

这个项目希望和大家分享一个可以赋能商业的数据中心是如何从零开始构思和设计的,但这不是技术开发中的数据仓库,而是数据分析的数据库。

这个机会也是给刚接触SQL的朋友一个更贴近业务现实的实际案例。

2. 业务场景

为了简化业务逻辑,本案例以电商企业为背景,涉及的业务部门包括用户运营部和产品部。

我常说,数据分析师的价值在于解决业务问题。那么这个数据中心项目解决的是什么样的问题,又是如何解决的呢?我们按照“始于终”的思维逻辑来梳理一下吧。

一、从业务层面思考,需要解决哪些业务问题

数据分析师的价值在于为业务赋能,所以“数据中心”建设的起点应该从终点开始:业务需求。

1. 用户运营部门

随着电子商务市场的饱和,电子商务现已进入存量经营时期,要求品牌对存量用户进行精细化管理,实现业务增长。所以用户运营部门的需求是一个用户价值的分层模型,可以帮助业务聚焦收入最高的人群。与用户运营部门沟通,明确建立RFM模型对人群进行分层,形成针对不同人群的营销策略。

2. 产品部门

产品部的职能大致可以分为两个方面:一是需要前瞻市场的产品开发,二是“保证子弹的供应和可用性”的库存管理。和产品部沟通后,明确需求是做“新产品分析”,根据新产品的性能调整生产和库存计划。简单来说,性能好的新产品就多生产/采购,否则就清仓。

二、从数据层面思考,需要解决哪样的数据问题

在这个阶段,已经明确了业务需求,接下来要建立能够支撑业务发展的数据中心。

根据数据处理流程,数据中心可分为落地层、建模层和数据层。

开篇:从零建立赋能业务的数据中心「逻辑框架」

1. 落地层

离业务最近的是业务看得见摸得着的数据应用,比如在线BI系统,业务可以直接登录看到需要的报表;也可以是数据分析报告,业务可以从中获得直接的洞察分析和建议;也可以是专门的数据分析项目,通过分析形成的战略规划在业务场景中执行,直接实现增长。也就是说,在这个层面,我们需要考虑数据分析价值落地的具体形式。

2. 建模层

建模层和数据层对于业务部门来说都是不可感知的。建模层是支持价值落地的数据模型,比如在线BI系统中的报表,由于背后复杂的表间关系,需要业务逻辑和表模型的支持。数据分析报告背后的洞察分析需要帕累托分析、关联算法等数据模型的支持。

3. 数据层

在这个层面,我们需要关注最小粒度的数据,即数据库层面的表和字段,它们是建模层面具体操作的元素。通俗地说,就是要从不同的数据源接入业务数据,通过同步更新、数据清洗等过程,保证数据的完整性和准确性。

三、如何把业务需求转为数据问题

了解了数据赋能的三个层次后,再回头看看如何将业务需求转化为数据问题。

1. 用户运营

(1)着陆层

每个部门都有KPI指标。在运营中,需要定期回顾运营结果,实施下一阶段的运营策略。对于业务来说,运营策略的落地需要借助触控工具:发送短信。因此,“RFM模型”的落地不仅可以给出算法模型的报告,还可以将现有用户以报告的形式进行分组,同时匹配政策分析工具,为用户提供信息下载。

根据业务场景,确定可以以PowerBI在线报告的形式为用户运营部门提供在线人群分层报告,并使用零售行业常用的“人码模型”和“指数拆解”作为策略分析工具。

(2)建模层

定义了落地的形式之后,还需要定义数据层面的RFM模型、人码模型和指数拆解。

对于「RFM模型」来说,需要明确分层逻辑,具体包括行为周期、R/F/M的阈值计算。对于「人货场模型」来说,在RFM模型已解决「人」层面的分析,需要进一步补充:「货」通过「产品结构分析」解决,「场」通过「活动周期分析」解决。对于「指标拆解」来说,因为最终是交付给用户运营部门,所以需要尽量从用户的角度来拆解销售额,比如销售额 = 新客销售 + 老客销售,这样就符合业务关注的新客指标及老客指标。

(3)数据层

很明显,要开发的数据模型需要为更细粒度的数据库表和字段而设计。

模型围绕着用户订单数据进行,所以至少需要订单表,包括下单时间、购买商品、购买金额、商品件数等字段。另外,落地层提到用户运营侧的落地需要结合触达工具,所以还需要用户表,提供会员昵称、手机号、地址等字段。2. 产品部门

(1)着陆层

对于企业来说,产品策略的背后有很多复杂的影响因素,比如市场培育、公司策略等等。也就是说,对于数据部门来说,新产品分析可能更多的是产品部门参考新产品性能的辅助工作。另外,在和产品部沟通业务流程时,他们也提到会每天使用数据部提供的表格进行二次分析。

根据这个业务场景,确定了可以以元数据库平台的形式做在线报表,业务部门可以在平台上下载数据,在线做透视分析。

这个场景其实就是为了引入元数据库平台而设计的,在解决自助数据检索和简单BI报表的问题上非常实用。我们可以先从官网了解一下:www.metabase.com。后面会有具体的教程。

(2)建模层

明确了以报表形式提供新品分析后,需要考虑新品分析背后的表格模型,可以结合“库存分析”来实现,即分析新品销售和库存前的相关指标,以反映新品的表现。

(3)数据层

对于销售和库存相关指标的分析,需要订单表和库存表。除了用户操作中提到的订单字段,还需要货物的批号、数量等库存字段。

至此,我们完成了从业务需求到落地层、建模层、数据层的后推,形成了数据赋能业务的整体框架:

开篇:从零建立赋能业务的数据中心「逻辑框架」

(这个框架后面会丰富)

四、从执行层面思考,把框架落地

接下来需要对照第二步的思维逻辑,形成实施方案。

1. 数据层建立数据库模型:从业务模型、概念模型到物理模型。新建数据库,并从数据源(业务系统)接入存量数据。通过存储过程同步增量数据,实现数据动态更新。SQL SERVER代理完成定时任务:执行ETL、定期备份。2. 建模层RFM模型在用户运营中的落地。如何进行新品分析。3. 落地层RFM模型在PowerBI的部署落地Metabase的安装及应用案例:存销分析

接下来,我们将按照上述规划逐步实现数据中心的落地。

本文由@饼干哥原创发表于蜘蛛智慧链。未经作者允许,禁止转载。

图片来自Unsplash,基于CC0协议。

上一篇:电子商务商业数据分析实践指南

下一篇:没有了