掘金日本电商市场 促销择时很重要
666
2023-02-21
本文讲述了电商用户数据分析|电商平台用户数据分析,电商平台用户数据。
目录
一、项目背景及项目分析目的
项目背景介绍
UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,该数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。
推荐系统中用户对物品的反馈分为显式和隐式反馈,显式反馈 (如评分、评级) 或单一的隐式反馈 (如浏览、点击、加入购物车)。 隐式反馈推荐是推荐系统通过对内容和用户行为的分析,建立适当的模型,帮助用户从海量的数据中找到自己感兴趣的内容。推荐系统中用户的行为反馈包括显式反馈和隐式反馈,隐式反馈信息在推荐系统算法中被广泛应用。隐式反馈体现着用户的兴趣爱好,对隐式反馈信息的挖掘有助于提高推荐系统的效果,以更好地设计推荐系统。
2. 项目分析目的
通过对该数据集的分析,给用户推荐精准的隐式反馈推荐。从用户维度来讲,我们能快速满足用户需求,提高用户忠诚度。从平台角度来看,能给平台带来大量忠实用户,平且提高平台知名度,以及帮助平台实现长久盈利。
二、理解数据
数据来源:
理解字段
数据集介绍,且该数据集是2017年11月25日至2017年12月3日之间的数据
3. 字段介绍
其中行为类型,分为共有四种,分别是
4. 数据集大小说明
三、数据清洗
修改列名
我们将数据集导入Navicat以后发现,我们没有列名,数据集的第一行就是我们的数据,因此我们要手动为数据集添加列名,以便后来更好的处理数据。
列名修改结果如下
2. 缺失值处理
首先,我们先来确认,数据中是否存在缺失值
select count(*), count(UserID), count(Product_ID), count(Product_Category_ID), count(Behavior),
count(Timestamp)
from Userbehavior;
我们在当初定义表的时候,选择了not null选项,现在在用count计算时,会发现,我们时没有缺失值的。
可是如果我们在未来工作中,碰到需要处理缺失值的时候,我们应该怎么做呢?
一般有两种处理方式,第一种,是删除缺失值,即,删除缺失值所在行,code如下
delete from 表名 where 列名 is null;
第二种,是填充缺失值
select coalesce(列名, 要填充的值) from 表名;
3. 将时间戳转换和拆分为日期和时间
首先,从时间戳中抽取日期
alter table Userbehavior add 日期 varchar(255);update Userbehaviorset 日期=from_unixtime(时间戳,'%Y-%m-%d');
修改后结果如图
然后,从时间戳中抽取时间
alter table Userbehavior add Time varchar(255);
update Userbehavior
set Time =from_unixtime(时间戳,'%H:%i:%s')
修改结果如图
这样就能更好,更直观的帮助我们理解数据啦。
4. 异常值处理
我们在描述数据集时提到过,该数据时2017年11月25日至2017年12月3日之间的数据,因此,若是在此时间段外的数据,应该就是我们需要删除的异常值了。
DELETE FROM userbehavior
WHERE 日期 not BETWEEN '2017-11-25' AND '2017-12-03';
这样就删除了,不在我们需要的日期范围内的数据啦
我们再一次检查的时候,就会发现比之前少了三行数据
四、业务分析思路
我们将从四个方面对数据集进行分析
产品,业务流程,用户以及促销四个方面来对数据集进行分析
分析思路:
产品方面分析:热销产品和滞销产品分别有哪些,导致热销或滞销的的原因可能是哪些原因?
分析方法: 群组分析法 ,假设检验分析法
业务流程转化率分析:通过用户的购买流程,确定各个环节的流失率,留存率
分析方法:漏斗分析法
用户的行为习惯分析:以PV、UV等指标,找出用户最活跃的日期以及每天活跃时间段。
分析方法: 群组分析法 ,假设检验分析法
产品方面分析
我们将数据清洗整理后,我们先来看看我们的热销产品有哪些
SELECT product_category_ID,COUNT(product_category_ID)AS Num FROM userbehavior
GROUP BY product_category_ID
ORDER BY Num DESC
LIMIT 10;
我们选取了热销产品的TOP10来看,但是这里有一个问题,这个榜是包含了用户所有行为的表格,包括加购,收藏,点击和购买,我们拆开来看看,每个环节的情况。
select Product_Category_ID,COUNT(product_category_id)AS Num,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buy
From userbehavior u1
Group by u1.product_category_id
Order By Num Desc
LIMIT 10;
我们可以看到,毫不意外,用户主要的行为还是在点击量上。
我们来看这个分析结果,可以发现,针对不同类别的产品,我们可以使用不同的策略。鉴于,商家最后追求的都是成交量,因此,我们将转化率列出来,用户的点击量和购买量之间的比。方便我们更直观的观察数据。
select Product_Category_ID,COUNT(product_category_id)AS Sum,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buy,
CONCAT(ROUND(((Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy')/
(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv')*100),2),'%') AS changes
From userbehavior u1
Group by u1.product_category_id
Order By sum Desc
LIMIT 10;
我们发现,行为总数最多的商品种类3607361,成交率是0.那么很显然,产品的高点击量本质上毫无意义,因为不能给店铺带来收益。在高点击量的情况下,我们能够看出,该产品的获客能力是很强的,证明公司的推广策略本身很有效,但是用户点击进来后的,加购,收藏,和购买行为都在我们上面展示的10条数据里面,并不算是偏高的。由此说明,用户点击进来后,没有找到自己想要的,或者说,用户点击来发现产品不是自己期望的。该产品就需要在这种方面进行改善。
我们再来看看购买量排名前十的产品品类的状况。
由上面数据可以看出,转化率最高的能达到150%的890050,就说明,用户点击进入店铺后,还浏览的店铺的其他商品,并且促成了成交。这个种类的策略偏向也很明显了,pv只有两个,后期产品的策略选择上,应该着重放在获客情况上面。
业务流程转化率分析
通过用户的购买流程,确定各个环节的流失率,留存率
用户达成购买行为可能存在以下几种路径
点击 - 购买
SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 加购流失率FROM userbehavior;
我们看到这个用户流失率高达88.07%,我们先来看看剩下几个路径,再来一起对比。
2. 点击 - 加购 - 购买
SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加购流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率
FROM userbehavior;
加购流失率:84.48% 加购后购买流失率 - 3.58%
3. 点击 - 收藏 - 购买
SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率
FROM userbehavior;
收藏流失率: 86.87%, 购买流失率: 1.19%
4. 点击 - 收藏 - 加购 - 购买
SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加购流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,
CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')
-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率
FROM userbehavior;
加购流失率: 84.48%, 收藏流失率: 2.39%, 购买流失率 : 1.19%
其实,我们可以看出,用户点击进入页面后,流失率其实比较大。我们就要分析可能有哪些方面的原因,比如加购流失率高达84.88%,用户点击我们的产品,侧面反映出来,用户对我们的产品主图以及标题是感兴趣的。那么我就需要弄明白,在用户进入页面后,是产品详情页或者是副图不符合客户预期,导致加购和收藏流失率极度攀升。
用户分析
用户的行为习惯分析
我们来看看用户分析,首先来看看用户的行为习惯分析,首先来看,每日点击量pv,以及独立点击量uv
SELECT date, COUNT(behavior) as pv, COUNT(DISTINCT UserID) AS uv
FROM userbehavior
WHERE Behavior = 'pv'
GROUP BY Date
ORDER BY Date;
我们从上述数据可以看出,在1202和1203这两天,用户无论是点击量还是独立用户访问数,都略高于平时。我们对这两天访问量高做假设检验的分析
提问:1202和1203访问量高的原因是什么?
假设:1202和1203有特殊的节日
而后,我们通过查询历史数据发现,1202和1203两天,是那周的周末。由此,我们确认,假设成立。
用户价值分析
概念: recency, frequency,monetary
R值:用户最近一次购买行为距今时长,R值越小,用户价值越高
F值:用户一段时间内消费了多少次,F值越大,用户价值越高
M值:用户一段时间内消费了多少钱,M值越大,用户价值越高
对于本次数据,我们缺乏相关的M值的数据,因此我们主要关注,R值,和F值。
由于我们拿到的是历史数据,因此我们定义适合本次数据的R值和F值
R值:用户最近一次购买行为12月3日时长。
F值:用户2017年11月27日至2017年12月3日的消费了次数,F值越大,用户价值越高
SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R
,count(Behavior) as F
from userbehavior
where Behavior ='buy'
group by UserID
ORDER BY R DESC,F DESC;
随后,我们指定自己的打分规则
随后,我们根据我们的打分规则,对用户进行分组,确认用户价值
SELECT a.*,
(case when R<=2 then 4
when R between 3 and 4 then 3
when R between 5 and 6 then 2
when R between 7 and 8 then 1 end) as Rscore,
(case when F between 1 and 3 then 1
when F between 4 and 6 then 2
when F between 7 and 9 then 3
when F>=10 then 4 end) as Fscore
from (SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R
,count(Behavior) as F
from userbehavior
where Behavior ='buy'
group by UserID)a;
总结与建议
产品方面,我们可以看到,在我们看到,各类的产品的销售状况很不一样,有的产品种类获客很容易,但是转化率很低,但是有的产品,获客能力不足,但是转化率却极高。因此,对于不同类型的产品,应该因地制宜选择不同的销售策略。
业务流程方面,我们对各种不同类型的业务流程分别进行了分析,然后我们就会发现,普遍情况,客户的流失都是在点击后,这就意味着,大家的重点都集中在引流,但是客户点击进来之后,很快就会走,这样的引流毫无意义,关于这方面,商家应该更侧重在客户点进来之后,如何留住客户。
用户行为方面,我们可以看到,在周六日这种特殊的日子,用户的访问时间明显变长,如果考虑做活动的话,应该主动集中在这些日子,能带来不少自然流量的同时,也能更好的提高转化率。
电商用户数据如何收集?
电商都有自己的CRM,那么收集的方法和维度都有哪些?
可以尝试一下利用RPA机器人技术来收集电商用户数据,自动获取商品信息。云扩RPA可以自动抓取各电商平台商品信息,快速帮助品牌获取爆款信息,提高店铺运营效率,还有针对电商数据采集的针对性解决方案,很专业。自动化的操作确实很能提升效率,代替人工。
上文就是小编为大家整理的电商用户数据分析|电商平台用户数据分析,电商平台用户数据。
国内(北京、上海、广州、深圳、成都、重庆、杭州、西安、武汉、苏州、郑州、南京、天津、长沙、东莞、宁波、佛山、合肥、青岛)班牛客服系统分析、比较及推荐。
发表评论
暂时没有评论,来抢沙发吧~