基于深度学习的电子商务客户数据分析研究

2020-12-23 05:44梁亮
中国管理信息化 2020年21期
关键词:数据分析深度学习电子商务

梁亮

[摘    要] 在强调大数据、互联网、实体经济与人工智能充分融合的当下,电子商务成为人们关注的焦点。本文以深度学习为切入点,在简单介绍核心理论内涵的基础上,从电商平台的角度出发,对客户数据进行了分析,并综合考虑多方因素,提出了可使数据分析结论更加精准的方法,希望能够给相关人员以启发,为电子商务注入前进所需的动力。

[关键词] 电子商务;客户;深度学习;数据分析

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 21. 062

[中图分类号] F713.36   [文献标识码]  A      [文章编号]  1673 - 0194(2020)21- 0141- 02

0      前    言

电商的出现使生活更加便利,却也带来了一系列问题,对数据进行挖掘和分析,可使相关企业在面对挑战时拥有更大的胜算。在此背景下,相关人员选择以深度学习为切入点,针对电商客户数据制定有别于过去的分析方法,所取得效果也十分令人瞩目。由此可见,本文所研究课题拥有较为突出的社会价值,应当引起重视。

1      理論概述

1.1   电子商务

近几年,以京东和淘宝为首的电商品牌,给人们生活带来了极大便利,电商平台的特征,主要表现为低于实体经济的运营成本,还有更符合预期的消费模式。深度学习理念的提出,使相关人员意识到,以客户数据为依托,充分利用深度学习和数据挖掘法,对客户所做出购买等行为进行分析,为电商平台提供对体验进行升级的方向,确保电商平台对客户拥有更为强大的吸引力。

电子商务指的是以互联网为载体对商贸活动进行开展的运营模式,强调网上购物与电子支付。2013年至今,电商企业纷纷将提供高效服务视为工作重心,在电子商务得到大力推广的背景下,将其视为交易首选平台的人员数量不断增加,数据信息逐年增加,这部分信息主要由购买行为、客户评价和反馈构成,如何对相关数据加以应用,准确把握客户行为所呈现出规律,自然成为相关行业讨论的重点,这是因为客户行为有助于电商对潜在消费群体加以识别,促使浏览者向消费者进行转变,其经济价值及现实意义均有目共睹。

1.2   客户数据分析

针对电商客户所开展数据分析工作,强调以客户浏览记录、历史访问和服务器日志为依据,对行为规律进行提炼,以此来达到实时预测客户购买倾向与行为的目的。从电商平台的视角来看,这样做有助于自身对客户行为加以掌握,并有针对性地推荐商品,调整进货和出货的具体数量,另外,在对营销策略进行制定时,数据分析所得结论,同样有无法被替代的作用。早在20世纪90年代,部分学者就已将网络数据视为研究重点,并成立了对电商客户所涉及数据进行分析的机构。信息时代的到来,加快了电子商务推广和普及的速度,可被用来分析客户数据的方法也不断增加,其中,具有代表性的有神经网络法、决策树法和贝叶斯分类法。上述方法存在较为明显的共性特征,即驱动力为数据,将客户信息和行为视为切入点,从中对特征设计所需因素进行筛选,再经由计算机学习法,对模型进行训练。另外,上述过程又被称为深度学习,这点应引起重视。

2      数据分析

2.1   分析方向

近几年,在飞速发展的科技的加持下,深度学习模型逐渐走向成熟,其中,本文研究的CNN、RNN,还有DNN、DBN均已在语音识别、信息处理等领域得到应用,所取得效果也十分显著。在对电商客户数据进行分析时,相关人员应做到以客户数据为依据,根据分析结果,对其行为进行预测,当然,这也是电商平台的主要工作。在深度学习得到推广的背景下,电商平台对客户数据的掌握愈发全面,数据库的形成,使预测工作拥有了更加理想的针对性和实时性,这便是智慧化预测的开端。由此可见,可被用来进行数据分析的体系,通常要满足以下要求:第一,以统计学、数据挖掘和机器学习为切入点,完成提取数据特征的操作;第二,根据所提取特征,对相关知识库进行构建,确保数据输入、行为预测等内容均被纳入所构建体系。

2.2   数据处理

第一步,以电商交互系统为载体,对交互日志进行抽取,搜集客户分析所需数据;第二步,对数据进行预处理,例如,清洗数据,将异常值去除,以及对缺失值进行填充,确保数据满足唯一性的要求,使行为预测及后续工作的开展,拥有全面且有效的保障。

2.3   特征提取

以原始数据为依托,对客户购买行为所表现出特征进行提取,再利用现有分类方法,将特征划分为动态/静态或原始/拓展,通过对不同类别特征进行整合的方式,形成有别于过去的全新特征。研究表明,要想使预估效果达到预期,关键是参考数据与特征,对模型预估上限加以明确,并对模型进行调整,由此可见,如何增强所构建特征的科学性,已成为使客户数据得到精准分析的保障,在未来一段时间内,该项工作将成为研究的主要内容。

2.4   模型构建

预测模型是否准确,通常会给数据分析带来直接影响,甚至对分析结果的有效性有决定作用。现阶段,大量预测模型被投入使用,但现有模型的准确性,普遍和预期存在较大差距,如何以数据分析为依据,对客户行为进行预测,成为了电商平台关注的重点。众所周知,电子商务的特点,主要表现为数据量大和处理难度高,现有模型均不具备对全部问题加以解决的能力,其中,大部分模型都符合理论模型的特征,强调对影响因素进行定性分析。研究表明,在很长一段时间内,Logistic回归法均占据着主导地位,从本质来说,该回归法属于线性分类模型之一,其特征表现为对输入所提出要求相对严格,例如,目标对象应满足线性可分条件,而随机森林法、Badding法的性能,普遍会受到一定程度的限制。基于此,本文以深入学习为切入点,对分析电商客户数据的方法进行探究,具体内容如下:

2.4.1   理论概述

Hinton是首位提出深度学习概念的学者。作为机器学习研究全新方向,深度学习主要被用来对神经网络较易受到学习能力制约的问题,以逐层贪婪学习为原则,通过对非线性网络进行深入学习的方式,获得机器学习所需特征,为预测结果所具备精准性提供保障。

从本质上说,深度学习强调的是对数据表征进行学习,旨在对完善模型进行创建,并以未标记数据为依托,对表示方法加以掌握。现阶段,针对深度学习所展开研究,主要涉及以下方面:其一,以卷积运算为核心的神经网络,即CNN;其二,以多层神经元为核心的神经网络,通常分为稀疏编码和自编码;其三,以自编码网络为载体,通过开展预训练的方式,对深度置信网络加以优化。

2.4.2   特征构建

特征构建主要由三个阶段组成,分别是选择特征、对样本测试集与训练集进行划分和特征处理。从某个层面来说,选择特征是确保预测模型得到有效构建的前提,要求相关人员以现有数据集为依托,确定分类所需特征集,通过提升模型精准度的方式,将运行时间控制在合理长度。由于不同维度对特征量纲、单位所提出要求,通常有较为显著的差异存在,评估特征所拥有权重也会受到影响,因此,要想避免预估效果受到影响,关键是通过特征管理的方式,达到归一化处理的目的。

2.4.3   确定并验证模型

深度学习强调以算法为依托,在现有假设空间中对最优假设进行确定,而预测方法要求相关人员从多个角度对分析工作进行开展,在所处理数据不同的基础上,利用现有方法对客户所开展活动进行预测,通常会取得不同的结论,可以说,任何学习问题都有相应的算法,但是,并不存在适用于全部领域的算法,在此背景下,学者纷纷将目光转向对单一算法进行整合,形成拥有良好普适性的模型的方面,希望能够通过相关研究的开展,确保算法可发挥出应有作用,而合成算法所应用方法,也因此而成为对算法准确率起决定作用的因素。

待上文所提及工作告一段落,相关人员便应对模型进行确定并验证。一方面,利用CNN和RNN对模型框架进行构建,以此为基础,随机抽取数据负样本并对网络层数加以调整,在明确损失函数后,经由BP算法对输出误差进行反向传播,并以Adam算法为依托,完成模型参数的优化处理。另一方面,利用尚未经过训练的客户数据,对模型所具备泛化能力进行验证,若预测结果和预期相差较远,相关人员應对模型进行重新设计与训练。

3      结    论

通过分析文章内容可知,以数据分析所得结论为依据,对客户行为进行预测,现已成为电商领域所研究的主要内容,在深度学习模型逐渐趋于完善的背景下,对客户行为进行预测的精准度不断提升,但是黑盒特征的存在,导致深度学习无法为基于特征提取所开展定性研究工作提供支持,因此,未来一段时间内,由深度学习延伸出的可视技术将成为研究的重点。

主要参考文献

[1]孙晓凯,倪卿元,陈文强.图像增强方法在深度学习图像识别场景应用中的可行性研究[J].电信科学,2020,36(z1):172-179.

[2]戴成华,宋偲皓,薛继待,等.基于人工智能视频深度处理技术的景区智慧化管理探索研究[J].科技通报,2019,35(4):108-114.

[3]曹晓明,张永和,闫海亮,等.人工智能视域下的学习参与度识别方法研究——基于一项多模态数据融合的深度学习实验分析[J].远程教育杂志,2019,37(1):32-44.

猜你喜欢
数据分析深度学习电子商务
《电子商务法》如何助力直销
电子商务
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
关于加快制定电子商务法的议案
跨境电子商务中的跨文化思考