电商用户数据分析电商平台用户数据分析电商平台用户数据

4747 658 2023-02-21

本文转载自网络公开信息

本文讲述了电商用户数据分析|电商平台用户数据分析,电商平台用户数据。

目录

一、项目背景及项目分析目的

  1. 项目背景介绍

UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,该数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。

推荐系统中用户对物品的反馈分为显式和隐式反馈,显式反馈 (如评分、评级) 或单一的隐式反馈 (如浏览、点击、加入购物车)。 隐式反馈推荐是推荐系统通过对内容和用户行为的分析,建立适当的模型,帮助用户从海量的数据中找到自己感兴趣的内容。推荐系统中用户的行为反馈包括显式反馈和隐式反馈,隐式反馈信息在推荐系统算法中被广泛应用。隐式反馈体现着用户的兴趣爱好,对隐式反馈信息的挖掘有助于提高推荐系统的效果,以更好地设计推荐系统。

2. 项目分析目的

通过对该数据集的分析,给用户推荐精准的隐式反馈推荐。从用户维度来讲,我们能快速满足用户需求,提高用户忠诚度。从平台角度来看,能给平台带来大量忠实用户,平且提高平台知名度,以及帮助平台实现长久盈利。

二、理解数据

  1. 数据来源:

  2. 理解字段

数据集介绍,且该数据集是2017年11月25日至2017年12月3日之间的数据

3. 字段介绍

其中行为类型,分为共有四种,分别是

4. 数据集大小说明

三、数据清洗

  1. 修改列名

我们将数据集导入Navicat以后发现,我们没有列名,数据集的第一行就是我们的数据,因此我们要手动为数据集添加列名,以便后来更好的处理数据。

列名修改结果如下

2. 缺失值处理

首先,我们先来确认,数据中是否存在缺失值

select count(*), count(UserID), count(Product_ID), count(Product_Category_ID), count(Behavior),
count(Timestamp)
from Userbehavior;

我们在当初定义表的时候,选择了not null选项,现在在用count计算时,会发现,我们时没有缺失值的。

可是如果我们在未来工作中,碰到需要处理缺失值的时候,我们应该怎么做呢?

一般有两种处理方式,第一种,是删除缺失值,即,删除缺失值所在行,code如下

delete from 表名 where 列名 is null;

第二种,是填充缺失值

select coalesce(列名, 要填充的值) from 表名;

3. 将时间戳转换和拆分为日期和时间

首先,从时间戳中抽取日期

alter table Userbehavior add 日期 varchar(255);update Userbehaviorset 日期=from_unixtime(时间戳,'%Y-%m-%d');

修改后结果如图

然后,从时间戳中抽取时间

alter table Userbehavior add Time varchar(255);
update Userbehavior
set Time =from_unixtime(时间戳,'%H:%i:%s')

修改结果如图

这样就能更好,更直观的帮助我们理解数据啦。

4. 异常值处理

我们在描述数据集时提到过,该数据时2017年11月25日至2017年12月3日之间的数据,因此,若是在此时间段外的数据,应该就是我们需要删除的异常值了。

DELETE FROM userbehavior
WHERE 日期 not BETWEEN '2017-11-25' AND '2017-12-03';

这样就删除了,不在我们需要的日期范围内的数据啦

我们再一次检查的时候,就会发现比之前少了三行数据

四、业务分析思路

我们将从四个方面对数据集进行分析

产品,业务流程,用户以及促销四个方面来对数据集进行分析

  1. 分析思路:

产品方面分析:热销产品和滞销产品分别有哪些,导致热销或滞销的的原因可能是哪些原因?

分析方法: 群组分析法 ,假设检验分析法

业务流程转化率分析:通过用户的购买流程,确定各个环节的流失率,留存率

分析方法:漏斗分析法

用户的行为习惯分析:以PV、UV等指标,找出用户最活跃的日期以及每天活跃时间段。

分析方法: 群组分析法 ,假设检验分析法

产品方面分析

我们将数据清洗整理后,我们先来看看我们的热销产品有哪些

SELECT product_category_ID,COUNT(product_category_ID)AS Num FROM userbehavior
GROUP BY product_category_ID
ORDER BY Num DESC
LIMIT 10;

我们选取了热销产品的TOP10来看,但是这里有一个问题,这个榜是包含了用户所有行为的表格,包括加购,收藏,点击和购买,我们拆开来看看,每个环节的情况。

select Product_Category_ID,COUNT(product_category_id)AS Num,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buy
From userbehavior u1
Group by u1.product_category_id
Order By Num Desc
LIMIT 10;

我们可以看到,毫不意外,用户主要的行为还是在点击量上。

我们来看这个分析结果,可以发现,针对不同类别的产品,我们可以使用不同的策略。鉴于,商家最后追求的都是成交量,因此,我们将转化率列出来,用户的点击量和购买量之间的比。方便我们更直观的观察数据。

select Product_Category_ID,COUNT(product_category_id)AS Sum,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buy,
CONCAT(ROUND(((Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy')/
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv')*100),2),'%') AS changes
From userbehavior u1
Group by u1.product_category_id
Order By sum Desc
LIMIT 10;

我们发现,行为总数最多的商品种类3607361,成交率是0.那么很显然,产品的高点击量本质上毫无意义,因为不能给店铺带来收益。在高点击量的情况下,我们能够看出,该产品的获客能力是很强的,证明公司的推广策略本身很有效,但是用户点击进来后的,加购,收藏,和购买行为都在我们上面展示的10条数据里面,并不算是偏高的。由此说明,用户点击进来后,没有找到自己想要的,或者说,用户点击来发现产品不是自己期望的。该产品就需要在这种方面进行改善。

我们再来看看购买量排名前十的产品品类的状况。

由上面数据可以看出,转化率最高的能达到150%的890050,就说明,用户点击进入店铺后,还浏览的店铺的其他商品,并且促成了成交。这个种类的策略偏向也很明显了,pv只有两个,后期产品的策略选择上,应该着重放在获客情况上面。


业务流程转化率分析

通过用户的购买流程,确定各个环节的流失率,留存率

用户达成购买行为可能存在以下几种路径

  1. 点击 - 购买

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 加购流失率FROM userbehavior;

我们看到这个用户流失率高达88.07%,我们先来看看剩下几个路径,再来一起对比。

2. 点击 - 加购 - 购买

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加购流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率
FROM userbehavior;

加购流失率:84.48% 加购后购买流失率 - 3.58%

3. 点击 - 收藏 - 购买

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率
FROM userbehavior;

收藏流失率: 86.87%, 购买流失率: 1.19%

4. 点击 - 收藏 - 加购 - 购买

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加购流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率
FROM userbehavior;

加购流失率: 84.48%, 收藏流失率: 2.39%, 购买流失率 : 1.19%

流失率

其实,我们可以看出,用户点击进入页面后,流失率其实比较大。我们就要分析可能有哪些方面的原因,比如加购流失率高达84.88%,用户点击我们的产品,侧面反映出来,用户对我们的产品主图以及标题是感兴趣的。那么我就需要弄明白,在用户进入页面后,是产品详情页或者是副图不符合客户预期,导致加购和收藏流失率极度攀升。


用户分析

用户的行为习惯分析

我们来看看用户分析,首先来看看用户的行为习惯分析,首先来看,每日点击量pv,以及独立点击量uv

SELECT date, COUNT(behavior) as pv, COUNT(DISTINCT UserID) AS uv
FROM userbehavior
WHERE Behavior = 'pv'
GROUP BY Date
ORDER BY Date;

我们从上述数据可以看出,在1202和1203这两天,用户无论是点击量还是独立用户访问数,都略高于平时。我们对这两天访问量高做假设检验的分析

提问:1202和1203访问量高的原因是什么?

假设:1202和1203有特殊的节日

而后,我们通过查询历史数据发现,1202和1203两天,是那周的周末。由此,我们确认,假设成立。

用户价值分析

  • 概念: recency, frequency,monetary

    • R值:用户最近一次购买行为距今时长,R值越小,用户价值越高

    • F值:用户一段时间内消费了多少次,F值越大,用户价值越高

    • M值:用户一段时间内消费了多少钱,M值越大,用户价值越高


对于本次数据,我们缺乏相关的M值的数据,因此我们主要关注,R值,和F值。

由于我们拿到的是历史数据,因此我们定义适合本次数据的R值和F值

R值:用户最近一次购买行为12月3日时长。

F值:用户2017年11月27日至2017年12月3日的消费了次数,F值越大,用户价值越高

SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R
      ,count(Behavior) as F
from userbehavior
where Behavior ='buy'
group by UserID
ORDER BY R DESC,F DESC;

随后,我们指定自己的打分规则

随后,我们根据我们的打分规则,对用户进行分组,确认用户价值

SELECT a.*,
(case when R<=2 then 4
when R between 3 and 4 then 3
when R between 5 and 6 then 2
when R between 7 and 8 then 1 end) as Rscore,
(case when F between 1 and 3 then 1
when F between 4 and 6 then 2
when F between 7 and 9 then 3
when F>=10 then 4 end)  as Fscore
from (SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R
      ,count(Behavior) as F
from userbehavior
where Behavior ='buy'
group by UserID)a;


总结与建议

产品方面,我们可以看到,在我们看到,各类的产品的销售状况很不一样,有的产品种类获客很容易,但是转化率很低,但是有的产品,获客能力不足,但是转化率却极高。因此,对于不同类型的产品,应该因地制宜选择不同的销售策略。

业务流程方面,我们对各种不同类型的业务流程分别进行了分析,然后我们就会发现,普遍情况,客户的流失都是在点击后,这就意味着,大家的重点都集中在引流,但是客户点击进来之后,很快就会走,这样的引流毫无意义,关于这方面,商家应该更侧重在客户点进来之后,如何留住客户。

用户行为方面,我们可以看到,在周六日这种特殊的日子,用户的访问时间明显变长,如果考虑做活动的话,应该主动集中在这些日子,能带来不少自然流量的同时,也能更好的提高转化率。


电商用户数据如何收集?

电商都有自己的CRM,那么收集的方法和维度都有哪些?

可以尝试一下利用RPA机器人技术来收集电商用户数据,自动获取商品信息。云扩RPA可以自动抓取各电商平台商品信息,快速帮助品牌获取爆款信息,提高店铺运营效率,还有针对电商数据采集的针对性解决方案,很专业。自动化的操作确实很能提升效率,代替人工。

上文就是小编为大家整理的电商用户数据分析|电商平台用户数据分析,电商平台用户数据。

国内(北京、上海、广州、深圳、成都、重庆、杭州、西安、武汉、苏州、郑州、南京、天津、长沙、东莞、宁波、佛山、合肥、青岛)班牛客服系统分析、比较及推荐。



本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表班牛的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。
上一篇:八大模块!物业客服培训资料,客服人员培训内容
下一篇:天猫商品主图规则(天猫商品主图尺寸大小)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~