基于人工智能的电商大数据分类与挖掘算法

2021-09-23 01:53秦宇
电子技术与软件工程 2021年14期
关键词:商品信息数据类型订单

秦宇

(广东省外语艺术职业学院 广东省广州市 510620)

智能创新科技将引领电商产业数字化升级,人工智能技术正在为电商平台获取忠实用户提供源源不断的动力。随着产业数字化步伐的加快,电商平台依托互联网、云数据、人工智能等数字技术升级的步伐也越来越快[1]。人工智能时代,电商平台分析自身用户的实际消费潜力,已经成为电商平台获取高额利润的必要条件。针对电商平台上架产品的数据分类,针对用户群体的消费实力分类,针对消费者浏览行为、关注行为、消费行为的数据挖掘,有利于电商平台获取精准用户画像,从而完善消费引导或商品推送信息[2]。但是在电商大数据分类与挖掘的过程中,算法精准度偏低,成为阻碍电商发展的重要因素。为此,结合电商用户数据特征识别,总结了用户消费周期行为数据推导过程,现做如下分析。

1 人工智能电商大数据分类

1.1 商品数据类型

简单商品数据信息,是商家对商品信息的归类,主要包括品类、价格,其他参数信息如颜色、尺寸、出产地、规格、重量等辅助参考信息,以商品参数(para-N)代表。商品信息,如表1所示。

1.2 用户数据类型

除了商品信息之外,用户数据信息时判断电商市值和消费潜力的重要数据参考标准。用户信息主要是年龄、性别、用户等级。用户信息,如表2所示。

1.3 用户行为数据类型

电商平台的用户行为数据,是一种描述用户消费行为,或者是浏览关注行为。当用户在某日大量流量某一商品信息时潜在消费因素形成,后续出现收藏关注说明用户已经将购买行为提上日程,上述行为的发生频次越高说明用户消费需求越大。用户行为信息,如表3所示。

1.4 用户订单数据类型

用户订单是完成消费动作之后,电商平台后台数据库陈列的订单数据信息。包括:用户信息、商品信息、下单标识、订单日期、订单区域、订单件数等。用户订单数据类型,如表4所示。

1.5 用户评论数据类型

用户评论信息,代表着用户对于商家服务行为的满意度,是电商与用户良好沟通的基础数据。用户评论主要是好评、中评、差评,以及未作出评论的订单。用户评论信息,如表5所示。

2 人工智能电商大数据挖掘算法

2.1 数据特征识别

从原始数据表中直接提取出原始特征后,从原始数据表中提取单数据表特征,如订单时间特征、订单计数特征、订单金额特征、sku 参数特征、行为时间特征等。

(1)时间跨度特征,消费者从最后一笔订单到当日订单的时间间隔,从最后一次浏览页面距今天的时间。其中,包括间隔时间均值、最大值、最小值、标准差值[3]。行为描述在于统计用户的消费习惯,预测用户是否已经离开本平台前往其他电商平台消费。

表1:商品信息列表

表2:用户信息列表

表3:用户行为信息列表

表4:订单数据类型信息列表

表5:用户评论信息列表

(2)订单数,用于统计用户在该时间段内的订单比例,用于评估消费者对当前商品的需求程度和消费欲望[4]。单品类商品预测消费潜力时,以往销售订单量越高,未来预期销量越高,可作为预测消费决策的参考数据。

(3)商品数,代表用户在该类商品中浏览过、收藏过、消费过的商品数量[5]。商品总数、品类数、购买次数、目标品类的购买总数、日均购买数量。以此来判断用户对于购买此类产品的数量需求。

表6:描述统计量

表7:样本数双侧检验结果

(4)订单数与商品数结合,推算出用户对于不同品类、不同价格、不同商品参数的消费偏好。订单数与用户行为结合,推算出用户消费决策的行为过程。

2.2 用户消费周期行为数据推导

以一个总体消费周期S,代表用户在电商平台内的消费行为满足这一周期S时存在消费决策。设(a,b,c)分别代表一款产品,当用户消费行为周期满足假设序列(a,b,b,a,c,c,b)时,用户对商品b存在购买意向,同时高于商品a的购买意向,对c商品可能仅作为对比。用户最终收藏了商品b,消费意向更高于其他两款商品。

单独考虑消费观察的周期频率影响,以n代表商品i在消费浏览序列中出现的频次,得到公式为:wi=n/N。单独考虑时间间隔因素的影响,那么在S周期内的浏览序列行为标记为q,则长度为N,q序列自起始阶段到终止存在(1,2,…,N)个序列编号,最终消费决策商品满足集合序列p(q,i),那么时间间隔的影响效度函数表达式为:

综合上述时间间隔影响因素和浏览频率的影响因素,得到消费决策的函数表达式:

最终获得多个关联因素影响下,用户消费决策行为对商品销售的影响,并以此推断未来某种商品在电商平台可能存在巨大消费潜力,为电商平台调整战略布局提高数据参考。

3 基于人工智能的电商大数据挖掘算法检验

3.1 用户特征测评指标

以Oi代表第i个用户消费决策的选择,当Oi=1时消费决策成立,当Oi=0时消费决策不成立。N为电商平台对消费者浏览行为的总体记录数,限定N不高于5万次。根据消费行为统计用户在本季度内浏览商品数,并以S1代表消费者评价,限定用户数不高于3万人。从而得到S1评价指标:

进一步计算预测消费行为的准确率(accurate)和召回率(recall):

以TP代表消费商品的正确样本特征数;FP代表消费商品的不正确样本特征数;TN代表实际消费样本特征数,FN代表未消费样本特征数。

3.2 样本数双侧检验结果

以某电商平台具有代表性的31类商品消费者评价最高分100,最低分38,做为检测样本。以该电商平台用户消费浏览序列wi最高98次浏览同一款商品,最低浏览13次同款商品为对比序列。检测数据样本描述,如表6所示。

将上述检测样本带入SPSS25.0统计学软件,进行数理分析和检验,得到样本数集合内的双侧检验结果,如表7所示。

由表7可知,accurate准确率检测结果置信度在95%以上时,置信上限达到84.3652,置信下限也可以维持在70.7961,Sig值趋近于0,代表检测结果可信度较高。进一步说明,通过对用户以往消费决策的统计,可推算出可信度较高的预测结果,数据挖掘准确率高于70%。通过recall召回率检测结果可知,置信度在95%以上时,置信上限达到75.9047,置信下限也可以维持在54.5091,Sig值趋近于0,代表检测结果可信度较高。但是也能够发现,用户浏览次数对最终消费决策行为的影响并不高,浏览频率智能作为挖掘用户行为的辅助参考数据,而不能作为判断决策数据。

4 结语

综上所述,人工智能时代,依靠算法获得用户精准画像,建议电商平台细分商品数据类型、用户数据类型、用户行为数据类型、用户订单数据类型、用户评论数据类型,通过构建完整的数据库分类获取更为精准的原始数据信息。进一步优化针对用户消费行为数据的精准测评算法,通过数据特征识别来测算用户潜在的消费能力,并通过用户消费周期行为数据推导,进一步明确用户可能产生的消费总量。从而精准测算用户特征测评指标,检验用户消费潜力数据,做到实时精准推送商品信息,打造人工智能时代的高品质电商。

猜你喜欢
商品信息数据类型订单
中国商品信息服务平台
商品信息
春节期间“订单蔬菜”走俏
详谈Java中的基本数据类型与引用数据类型
新产品订单纷至沓来
如何理解数据结构中的抽象数据类型
备战双十一
“最确切”的幸福观感——我们的致富订单
商品信息标准化助力电子商务健康发展
怎样做到日订单10万?