京东数据
一,项目背景和目的
1,项目背景
京东多年来在保持高速发展的同时,沉淀了数亿的忠实用户,积累了海量的真实数据。如何从历史数据中找出规律,高效解决客户实际问题、提升客户购物体验,是大数据应用在精准营销中的关键问题,也是所有电商平台在做智能化升级时所需要的核心技术。未来,京东将更多的应用先进算法技术,秉承开放、赋能战略构想,为无界零售提供零售基础设施。
京东零售集团坚持“以信赖为基础、以客户为中心的价值创造”这一经营理念,在不同的消费场景和连接终端上,在正确的时间、正确的地点为3亿多活跃用户提供最适合的产品和服务。目前,京东零售集团第三方平台签约商家超过21万个,实现了全品类覆盖,京东提供来自用户、商家、商品等多方面数据信息,包括商家和商品自身的内容信息、评论信息以及用户与之丰富的互动行为。
2,项目目的
(1)使用Excel工具,整合数据,找到用户购买的趋势和影响因素
(2)现在需要预测用户购买的倾向性,请给出所需的分析方法以及实施方案
二,数据字段
1,数据类型及名称
字段名
通过vlookup函数,将英文的字段名转化成汉字
并对单元格格式进行转化可以建立透视表
2,数据分类
发现数据共有20个,通过分析可以将数据分为4类
分别是客户类型,行为类型,店铺类型,产品类型
客户信息
产品信息
行为信息
行为类别又分为:
Comment:评论
Order:购买
PageView:浏览
SavedCart:收藏
Follow:下单
店铺信息三,数据清理
1,性别
性别
可以发现性别的占比不到1%,可以将其数据删除
2,店铺分数
店铺分数区间[-1,9]分,得分为-1不符合业务逻辑,需要观察-1分的店铺数据
店铺分数占比
可以对店铺得分为-1分的数据进行删除
3,行为编码
一般一个顾客会有一个或多个行为
一种行为也可能是多个顾客产生
行为编码
通过分析发现多个客户产生的行为,在行为编码10439703内
需要分析其他行为编码是否有这三类的数据
评论
加入购物车
收藏
可以发现,行为类别分别是收藏,评论,加入购物车时,行为编码却只有这一种
四,业务分析
1,找到用户购买的趋势和影响因素
通过数据字段可以发现没有销售字段,如:销售金额,销售数量等
(1)购买趋势
分析发现:
可以利用行为类别中的行为时间,表示购买时间
可以利用行为类别中的当行为类别为购买时的行为编码,表示购买数量
a,通过时间对比分析每天的用户数量
3月每天对比分析
横坐标:3个月每天的日期
纵坐标:对行为编码进行计数,表示这天共有多少顾客进入京东产生行为
2月,7日到15日,明显数据下降,需要分析原因,前几天是否在做活动,这几天活动停止所以导致用户流矢?被竞争者抢夺用户?15日开始有回升趋势,可以总结经验
3月,在25日-29日,数据有明显有下降趋势,需要分析原因
4月,几乎趋于平衡
每月行为趋势
环比每月的浏览趋势,可以发现2月用户吸引进来,每月都会有流失用户
每月浏览量
每月下单趋势
每月下单数
2月和4月的下单符合业务逻辑,3月27日到29日数据明显有问题,需要分析
2月前一周顾客数最多,在15日是用户数突然直线下降
2月趋势
2月整体趋势符合业务逻辑,筛选出6日到15日数据分析
a,会员等级
用户行为
通过对比可以发现会员等级为4和3的数据有问题
会员等级为4和3
可以发现只有分别只有3天的数据,需要了解等级为3和4的用户,为什么没有来购买
b,年龄分组
年龄分组
可以发现年龄分组为3的用户数据需要分析
年龄分组
同样只有3天的数据,而且个数都为1
c,性别
符合业务逻辑
会员等级为3和4的用户流矢,年龄分组为3的用户流失
需要推送活动增加用户粘性
3月基本趋于平缓,但在25日-29日之间,人数突然下降,需要分析是浏览还是购买?
3月数据
3月27日到29日的浏览量竟然小于下单量,说明数据有问题,需要分析是原始数据有问题?,摘抄过程数据出现错误?有刷单行为出现?
4月只有15天数据,可以发现数据几乎直线上升趋势,13日后开始下降
4月对比分析
4月符合业务逻辑
结论:
同比发现,2月比3月的客户数多1000人左右,3月和4月用户基本持平,说明这些用户已经流失,需要重视
分行为类别发现,2月7日-28日,人数下降,需要分析原因;3月26日-29日浏览量比下单量少,不符合逻辑
(2)用户购买的影响因素
产品类别
在京东浏览排名前三分别是苹果手机,项链,茶叶
浏览
在京东购买排名前三的分别是外套,茶叶,项链
下单
通过产品类别可以发现
浏览最多的苹果手机却不在购买排名前10中
购买排名第3的却不在浏览前10中
为什么浏览多,购买少?产品价钱太贵?只是看看?在推荐位,顾客一进入节可以看到?
可以考虑将项链放入推荐位,带来更多的转化
a,客户类别
性别
京东顾客男性多于女性
性别
虽然女性顾客浏览人数小于男性,但购买的转化率大于男性
产品类别和性别
男性浏览
男性下单
对比发现,男性下单第1是浏览排名第2的项链
女性浏览
女性下单
对比发现女性购买第1是浏览排名第6的茶叶,确是男性购买第2,浏览第3
购买第2位的是化妆品,第3的是面霜
男性和女性浏览量最多的都是苹果手机
说明在京东上趋向于
男性给女性购买项链,女性给男性购买茶叶
女性喜欢购买化妆品,可以多多推荐,或推送关健位,或推送优惠券
年龄分组
浏览
下单
分组为5的顾客更多,可以向这个年龄段的用户多多推荐
分组为3的用户浏览和下单都很少,需要多多关注,推荐产品,有可能是流失用户
因为不知道分组依据,没有办法解释
年龄分段和产品类别
年龄分组为4的下单排名前5的产品
下单
年龄分组为5的下单排名前5的产品
下单
通过对比发现年龄分组4和5都喜欢购买茶叶,项链,外套
和性别分组的购买产品差不多
会员等级
可以发现浏览量最多的会员等级为7级
浏览
下单最多的会员等级为1级
下单
转化率
会员等级为1的转化率高于会员等级为7的用户
会员等级为3的顾客转化率最高,可以进行分析,喜欢购买的的产品分类
会员等级为6的比会员等级为7的转化率高
需要对会员等级为7的顾客进行推荐处理,浏览后的购买力度小,需要注意
会员级别为3的下单产品
会员等级
这个等级的用户没有浏览就下单,有理由相信就是3月17日-19日之间不正常数据就是由此引起
有可能是刷单用户,值得注意
会员等级为3时,只有3月13日有一个用户浏览
浏览
会员等级为3时,每天都有用户购买
下单
不符合业务逻辑,需要分析原因
会员等级
浏览最多下单转化率排名倒数第2,需要重点关注,多多推荐感兴趣的产品
性别与产品
女性推荐足球,面霜,茶叶,外套
男性推荐糖果,茶叶,外套
可以提高转化率,可以看看会员等级为1的优点,取经
b,店铺评分
评分区间在0-1之间的浏览量高于区间8-9
浏览
区间0-1之间的浏览量最高的是苹果手机
产品
顾客喜欢在评分高的店铺购买商品
下单
评分区间9-10之间购买产品
下单
顾客喜欢在评分在9-10分之间的店铺购买,购买的产品就是销量最高的产品类别
说明评分越高,购买的转化率越高
可以将评分为8-9区间的店铺进行分析,最好可以提高评分,增加顾客的信任
总结:
通过对比发现性别,年龄分组,会员等级,店铺评分都对购买行为会发生变化
2,需要预测用户购买的倾向性
通过问题1找出影响因素分别是性别,年龄分组,会员等级,店铺评分
预测用户的购买行为需要使用线性回归分析
X:3个月的日期
y:用户数量
浏览的线性回归
回归方程
线性回归方程
可以发现随着天数增长,浏览的人数逐渐下降,每增加一天就会流失14个用户
下单的线性回归
可以发现回归方程
线性回归方程
可以发现随着天数增长,购买人数逐渐上升,每增加一天,不到1人下单
通过拟合系数可以发现,线性回归的拟合度不是很好,还是需要销售数据
五,业务结论
1,环比发现每个月都会流失用户
2月份流矢用户最多,通过分析发现会员等级为3和4的用户,年龄分组为3的用户,在本月都没有行为发生,需要多多刺激消费,减少用户的流矢,增加客户粘性;
3月用户等级为3的用户数据需要检查,是因为原始数据在手机的时候有问题?用户有刷单行为?
4月可以发现用户趋于平稳,可以推送优惠券之类,刺激用户消费
2,影响用户消费
性别,在过节日的时候,女性多多推送茶叶,化妆品,护肤品;男性多多推动项链,茶叶之类
年龄分组,分组为5的用户多推送排名靠前的产品,分组为3的用户需要推送活动,优惠券之类
会员等级,1忠实粉丝,2,3,7重点关注用户,4,6潜在客户,可以将他们转化成忠实粉丝
店铺评分,将区间在8-9之间店铺提升为9-10区间,需要了解差评的原因,评分高的用户可以推送苹果手机,提升购买转化率
3,预测分析
浏览人数逐月下降,,几乎每天都会流失2000多名客户,需要注意,减少流矢率
下单人数逐渐上升,但是上升幅度不大
工商数据属于什么数据
工商数据属于政府的业务数据,工商数据是工商局的数据。工商行政管理局是政府主管市场监管和行政执法的工作部门。根据《国务院关于机构设置的通知》,设立国家工商行政管理总局(正部级),为国务院直属机构。
工商局负责市场监督管理和行政执法的有关工作,起草有关法律法规草案,制定工商行政管理规章和政策。负责各类企业、农民专业合作社和从事经营活动的单位、个人以及外国(地区)企业常驻代表机构等市场主体的登记注册并监督管理,承担依法查处取缔无照经营的责任。
定量数据又叫什么数据
定量数据是:指以数量形式存在着的属性,并因此可以对其进行测量。例如以物理量为例,距离、质量、时间等都是定量数据。定量分析法是对社会现象的数量特征、数量关系与数量变化进行分析的方法。
而定性数据是是一组表示事物性质、规定事物类别的文字表述型数据。
|京东数据
京东会员 京东数据 大数据 定量数据又叫什么数据 工商数据属于什么数据 用户行为分析 电子商务 顾客价值