基于电商用户行为数据的可视分析研究

2022-04-27 20:24费千笑
商场现代化 2022年4期
关键词:电商

摘 要:随着互联网发展,在线交易成为了一种新兴的电子商务模式,在我国也有越来越多企业认识到这一新型商业模式所带来的巨大经济效益。在线交易行为产生了大量交易数据,其中包括的一种比较典型的数据类型就是用户购买行为数据。用户购买行为数据中包含了众多人在购物时的行为规模和购买偏好等信息,对相关研究乃至商业的个性化推荐等方面都具有一定的推动作用。本文基于阿里天池的淘宝用户行为数据,采用可视化分析的手段,从时间维度、用户行为、商品分析方面对数据进行了多维度的分析,从中发现了一些有价值的用户消费行为模式和偏好,比如淘宝用户在购物时的消费习惯、消费偏好习惯等,对行为研究、个性化推荐等方面的研究与应用具有一定的意义。

关键词:电商;行为数据;可视分析

一、引言

人类在日常的行为和生产活动中产生了大量的行为数据。这类数据中包含了用户在网络平台进行各项操作的行为偏好和规律等。在行为数据中,一种很典型的数据就是用户在电商平台购买物品过程产生的行为数据,也可以称之为电商用户行为数据,它反映了网络用户的购物倾向,以及商品的销售规律等信息,对电商用户行为数据进行分析有很大的价值。

对这种行为数据进行分析与可视化,可以挖掘数据背后潜在的人类的行为模式,从而推动行为研究、行为分析等领域的研究与发展。目前针对于电商行为数据的可视分析研究中很多是针对销售数据进行研究和处理,如刘珊运用B2B交易平台的交易数据对商品进行分析;ZorattiS在社会化媒体时代企业传播实战宝典中利用数据挖掘事物间的关联性到精准营销中;陈烨等人运用社会网络分析构建不同类型用户社交网络有效挖掘用户行为特征;KennedyDS从移动互联网的角度提出用户行为画像的具体实施方法;Mueller等人基于Twitter 会员的相关数据集,创立了NamChar名称分类器,通过预测用户性别构建用户画像。但是,针对此类数据的分析研究中,大多数都是从单一的角度入手进行分析,这就会导致分析结果存在一定的局限性。尤其针对行为数据时,从单一的视角很难观察到人类复杂的行为特征。

基于上述研究现状,在本文中采用阿里天池的淘宝用户行为数据,应用可视分析的手段,从多维度对数据进行分析,主要包括时间维度、用户操作行为维度、商品分析。从而从多个视角了解用户在不同维度下的各类操作的规模、模式,还能综合多维度的分析结果,还原人类复杂的购物行为。经过分析,本文提出的方法能够挖掘时间段内用户的时间行为偏好、购买商品偏好、购买习惯偏好,有助于发掘行为规律,推动相关研究发展。

二、数据与可视分析任务描述

1.数据描述与预处理

本文的样本数据来源于天池阿里云提供的淘宝用户行为数据集。该数据集描述了淘宝用户在2014年11月-2014年12月内在淘宝App中的一系列操作行为数据。该数据集的原始规模有8.90MB,包含用户编号、商品编号、行为类型、用户地理位置、商品种类、行为发生时间六个字段。对数据进行处理后,共包括1048575条记录,时间跨度48天,涉及到8477位用户和701610件商品,7095类商品。

2.可视分析任务

本文总结了在电商用户行为中行为用户操作类型与具体操作行为数据中应当核心关注的内容,从而指导本文中可视分析任务的设计,主要有以下内容。

T1:分析群体与个体操作行为的时间偏好规律。即不同时间粒度下不同用户的操作行为。

T2:分析群体与个体进行购买行為的数量偏好。即用户短期内购买商品的频次分析。

T3:分析群体在线上购物的总体行为偏好。如各项操作的频率与购买偏好。

T4:分析商品的浏览、销售等规律。各操作与商品之间的分析。

三、电商数据的用户行为可视分析

基于处理后的数据集以及分析任务,本文设计用户行为可视分析方法,从不同时间粒度进行用户活跃度分析、用户操作行为分析、商品分析等。

1.不同时间粒度的用户活跃度分析

本节分别选取了2014年11月-12月,一天中所有用户的操作行为数量的总和,并按照天进行统计与展示;选取了整个时间段中,一天内所有用户的操作行为数量的总和,并按照小时进行统计与展示。本文将上述不同时间粒度下用户的操作行为定义为“用户活跃度”。

2014年11月-12月,用户的总体活跃度如图1(a)所示。基于图可得,折线整体趋于平缓,且明显存在两个峰值,峰值一是每月11日-13日,峰值二是一月中的17日-19日,此二峰值均处于“双十一”前后,故认为由于“双十一”优惠活动使得用户在该时间段操作频繁。

一天中用户活跃度如图1(b)所示。在图中可以发现,从0点至24点,整体呈先减少后增加再减少的趋势,并存在2个谷值和1个峰值。谷值一是每天凌晨2点-5点,谷值二为每天16点-18点,两个时间段中,大部分用户处于工作或睡眠状态,因而活跃度较低。峰值是21点-22点,该时间大部分用户处于非工作时间,网购的活跃度普遍较高。这在一定程度上也反映了大部分用户网购的时间规律。

2.用户操作行为分析

(1) 用户购买数量分析

本节对11月-12月之间,用户购买商品的数量进行了分析。据初步统计,大部分购买者购买物品都是在9件以内,为便于更深入的理解与分析,也为了解大多数用户购买商品的差异性,本文将购买细分为购买1件、购买2-4件、购买5-8件、购买9-100件四个数量级。结果如图2所示。

根据图2(a)的漏斗图可以发现,用户整体购买商品的数量呈现递减的趋势。其中,购买1件商品的人数极多,购买2-4件商品的人数与之类似,即大部分人属于消费数量较少的少数需求,谨慎消费的状态。在8477人中,只有82人购买了9件以上的商品,说明大量消费人数占极少比例,该类用户可能存在大量需求,也可能为具有冲动。

把用户购买商品的数量绘制成折线图如图2(b)所示。其中,横轴代表购买商品的数量,纵轴代表购买该数量商品的用户数量。从图中可发现,整体呈现递增趋势。在购买商品数量在9-82件时,整体呈现平缓状态,这从另一个角度反映了极大部分用户在短时间内均为单次小数目购买。

(2) 用户操作行为分析

本节对用户在11月-12月时间跨度下的付款、加购、浏览、支付四种操作行为进行了可视化分析。用户操作行为分析从用户五种操作的结合、用户的“收藏-加购-支付”行为和用户的“浏览-支付”三个方面来做。

一方面结合了用户的五种操作,并通过折线图来展示用户行为间的关系,并对用户的付款、加购、浏览、支付的行为进行数量大小比较。结果如图3(a)所示。其中,用户操作次数和用户浏览次数整体呈现先减少再增长又减少趋势,与人本身作息规律相符。而另外三种操作,即用户付款、用户收藏、用户加购的次数,整体呈现平缓趋势,且与用户浏览次数差距较大。综上可得,用户大部分操作都是浏览,支付的操作是远小于浏览。

二方面是结合了用于收藏-加购-付款三种操作间的关系。通过形成折线图与柱状图对其进行趋势分析,如图3(c)可以得到,收藏-加购-付款数额整体呈现相同趋势,付款数额远小于收藏数额,用户的消费冲动不足以支撑每件商品的购买,而收藏数额远小于加购数额,其原因为用户更喜欢用加购习惯来对商品进行标记。局部来看,收藏数额波动更大,受个体差异习惯影响较大。

三方面是针对于浏览-支付分时转化率间用户分析。通过形成折线图3(d)对其進行趋势分析。总体来看,浏览-支付比率整体呈现平缓趋势,即用户消费习惯在一天中基本处于稳定状态。局部而言,在每天10时-15时情况下,转化率突增,推测用户此时购买为刚需产品,从而增高转化率。

(3) 转化率分析

本文对11月-12月时间跨度下,用户购买商品的转化率进行了分析,即用户进行其他操作至最终支付的情况。本文将转化率分为以下四个路径。路径一:从用户浏览商品至收藏商品,再到加购商品,最终支付该商品。路径二:从用户浏览商品至加购商品到最终支付该商品。路径三:从用户浏览商品至收藏商品到最终支付该商品。路径四:从用户浏览商品后至直接支付该商品。在本节中,计算了上述四种路径的支付转化率,即并绘制了频率分布直方图展示各路径下支付的转化率,如图4所示。

图4(a)是路径1的转化率,图中绝大部分转化率集中在0-0.2区间,即处于一种低转化率状态,这种路径较复杂,涉及到较多的操作,故极少有用户在购买物品时全部完成这些所有操作后最终支付商品。图4(b)为路径2的转化率,其转化率数值区间集中于0-0.45之间,其转化率相较于其他类型转化率较高,该操作步骤符合消费者一般操作习惯。图4(c)是路径3的转化率,图4(d)是路径4的转化率,均处于极低状态,转化率集中于0-0.1之间,究其原因为用户对收藏商品的偏好远低于加购商品,且用户极少直接通过浏览对商品进行支付。

3.商品分析

本节对11月-12月时间跨度下,对商品销量、用户浏览量、加购量、收藏量进行分析,从而了解各个商品及商品类型对客户浏览、加购、收藏等操作的影响。结果如图5所示。

图5(a)为商品加购量前20,图5(b)为商品浏览量前20,图5(c)为商品收藏量前20,图5(d)为商品购买量前20,经过对比,并不存在商品同时处于浏览、加购、收藏、购买前20中,浏览量第一与收藏量第一商品重合但该商品并未进入销量前20,加购量第一也未能进入销量前20商品中,局部而言,浏览商品前20中仅一件商品进入销量前20商品列表中,收藏图中无商品进入销量前20商品列表中,加购商品共有五件商品进入销量前20。

122338823商品共计销售出82件、123842164共计销售出49件等可得,浏览会导致和收藏商品受用户体验感影响较强,但用户热衷于浏览和收藏的并不能代表用户更愿意加购或支付该商品,即浏览量的高低与销量的高低并无直接的强关联。用户存在大量上商品的购买并未进行大量操作,可见用户直接购买商品占绝大多数,多数用户生活存在刚需,该类商品具有支付时间短、浏览次数少、支付时间多的特点。

四、总结

人类日常生活生产活动产生了大量行为数据。随着信息化的发展与普及,越来越多的人在网上购物,产生了大量电商行为数据。这些数据中包含了人类在购物时的行为模式、购物规律等,在行为研究、模式挖掘等领域有很大的研究价值。基于阿里云天池的淘宝用户行为数据集,本文中通过三个维度分析数据,分别通过时间维度分析发现用户高活跃状态时间,通过分析用户行为发现用户对偏好商品的标记习惯与购买习惯间的关系,通过商品维度分析各操作下商品之间关系发现高销产品特点,从而总结出了一系列淘宝用户的行为模式与规律,对于相关研究具有一定的推动作用。然而,本文仍然存在一定的局限性,比如尚未对用户购买商品间隔进行分析,我们在未来的工作会解决这些问题。

参考文献:

[1]刘珊,蔡明月,刘兴.淘宝文化产业数据的可视化研究[J].科教文汇,2018(19):183-185.DOI:10.16871/j.cnki.kjwha.2018.07.079.

[2]Zoratti S,Gallagher L.Precision Marketing:Maximizing Revenue Through Relevance[M].Kogan Page,2012.

[3]陈烨,王乐,陈天雨,等.基于社会网络分析的社会化问答平台用户画像研究[J].情报学报,2021,40(4):414-423.DOI:10.3772/j.issn.1000-0135.2021.04.008.

[4]Kennedy D S.The Ultimate Marketing Plan:Target Your Audience!Get Out Your Message!Build Your Brand![M].Adams Media,2014.

[5]MUELLER J,STUMME G.Gender inference using statistical name characteristics in twitter[EB/OL].(2016-6-17)[2018-3-01].https://arxiv.org/abs/1606.05467.

[6]阿里云天池-淘宝用户行为数据集.https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1.

作者简介:费千笑(2000.09- ),女,汉族,四川成都人,本科在读,研究方向:金融数据分析

猜你喜欢
电商
电商直播模式的应用与创新
新电商 潮涌风劲向未来
社交电商,春天来了?
备战双十一
2016年“电商百佳县”TOP20
固始县举办团干部电商知识培训会
汽车电商生态:盈利之考
电商的缩命
大型电商十大热卖玩具排行榜
大型电商十大热卖玩具排行榜