基于大数据的汽车精准营销分析

2020-12-29 11:57杨明昕王悦婷简悦
电脑知识与技术 2020年32期
关键词:精准营销数据分析汽车行业

杨明昕 王悦婷 简悦

摘要:面对大数据时代下汽车市场强有力的竞争,各个企业如何吸引用户人群,强化自身的竞争力,改善自己的营销模式,是需要持续探究的重要问题。利用Python在数据处理与分析上的优势,运用常用的数据分析及可视化工具,从用户基本信息、汽车基本信息等不同角度进行统计分析,发掘汽车销售中的问题,总结出研究数据中的汽车销售状况及变化趋势,并给出对应的精准营销策略,从而满足用户的需求,为汽车销售带来利益,对汽车行业的积极发展提供思路。

关键词:数据分析;汽车行业;大数据;可视化工具;精准营销

中图分类号:F274        文献标识码:A

文章编号:1009-3044(2020)32-0044-04

Abstract: In the face of the strong competition in the automobile market, how to attract users, strengthen their own competitiveness and improve their own marketing mode is an important issue that needs to be explored continuously. Using Python's advantages in data processing and analysis, using common data analysis and visualization tools, statistical analysis is carried out from different angles such as user's basic information and vehicle's basic information to explore the problems in vehicle sales, summarize the vehicle sales situation and change trend in the research data, and provide corresponding precise marketing strategies, so as to meet the needs of users and provide marketing services Sales bring benefits and provide ideas for the positive development of the automobile industry.

Key words: data analysis; automobile industry; big data; visualization tools; precision marketing

1 引言

在日趨数据化的市场环境下,虽然现在汽车市场的销量仍持续上涨,但销量增长的速度逐渐放缓,利润中心开始转移,消费者对产品和服务的要求也日趋个性化,各个汽车厂商的营销方面面临着诸多问题。传统的汽车营销模式已经无法应对市场带给汽车厂商的这些威胁,汽车经销商必须开始寻求新的营销方式,所以利用互联网信息技术明确地对用户展开精准营销已成为必然趋势[1]。对研究数据中的用户信息进行处理、分析、整合后为汽车经销商极致细化目标用户,提供可以提升营销精准化的新的视角,使各个经销商强化各自精准营销的意识,制定更为精准的营销方案;分析潜在用户的大量数据信息,帮助各个汽车经销商了解用户的潜在需求偏好、个性化追求等,确立目标市场需要。让企业的未来发展更能重视大数据提供的理论依据,帮助企业改善汽车行业在营销和服务行业发展中遇到的困境,促进汽车行业的发展。

2 数据预处理及分析

本次研究数据来源于“国域无疆杯·大连第二届大数据解决方案创新大赛”,数据包含用户ID、用户个人基本属性以及消费基本信息等。考虑到原始数据中有大量缺失值,不能直接使用做数据分析,所以决定采用Python中的工具对数据先进行预处理,然后再进行可视化分析,本文预处理过程为:数据清洗、数据替换。

2.1 数据清洗

数据清洗是筛选清除缺失大的、重复、多余的数据,补充完整缺失的数据,将错误的数据纠正或者删除,最后整理成为我们可以进一步加工、使用的数据。未经过处理的原数据中,有大量用户的消费信息缺失过多,有部分属性列80%以上为空值,为了不影响后续的数据分析操作,需先进行数据清洗。

清洗过程大致分为:

1) 对缺失比例超过80%的特征属性列进行删除;

2) 对没有相关车辆信息的用户数据进行删除;

3)将用户的不具有代表性的特征属性列进行删除;

4)对用户信息缺失导致无法进行数据分析的行进行删除。

2.2 数据替换

为了使数据变得更直观、有效,且有利于后期的数据分析工作,通过了解用户所购买的车辆,了解汽车的等级情况,判断用户的消费能力,提出有效的营销策略。利用Python中的Pandas库的各种工具将‘报价这一属性列中每个用户的汽车报价区间进行分箱操作,按照汽车等级划分标准,将价格区间转化为文字形式。汽车等级划分标准如表1所示。

2.3 用户基本属性分析

2.3.1 用户性别、年龄段分布概况

从数据上看,男性车主占整体车主约2/3,女性车主占整体车主约1/3,可以看出男性车主占主导地位,从而得出,有车一族男性居多。因此目前汽车销售市场的主要购买力为男性,商家可以男性作为重点销售对象,女性作为潜在购买力。且从年龄分布上看,车主年龄大致分布在25至45岁之间,其中30至40岁的车主占比最多,年龄在32至38岁的车主数量占大多数,并且男性车主和女性车主分布大致相同,且32岁之前的车主数量呈上升趋势,38岁之后的车主数量越来越少呈下降趋势,因此可以推断,在销售时期,可以将年龄缩小到25至38岁之间进行准确营销。

2.3.2 不同性别、汽车品牌分布

随着汽车的普及,汽车文化的影响,汽车的性别特征逐渐显著,对于男性女性消费者,汽车品牌厂商应有不同的营销侧重点。于是分析了原数据中的男性和女性的品牌偏好,结果如图1、图2所示。

從原数据上看,男女对于不同的汽车品牌的喜好大致相同,其中大众、日产、丰田、奥迪等汽车品牌最为受欢迎。但奔驰、宝马(即德系汽车)相对男性车主而言更受女性车主的喜爱,可以看出女性选车时比较注重美观,奔驰、宝马的外观设计非常符合女性的审美标准,且乘坐的时候舒适感很不错,内饰给人以豪华的感觉。而相对女性车主更受男性车主青睐的是别克、福特汽车(即美系汽车),除了性能、安全系数高以外,外观和内饰同样重要,别克的商务风、福特的运动风符合男性的取向。当然“男女通吃”的是大众品牌,不仅做工精细、高级、行驶质感好,而且经济实惠。

简而言之,对于男性消费者而言,品牌汽车的动力、性能等重视更多;而女性消费者偏好于易操控、外观美、舒适性高的产品。但简而言之,用户对于汽车系别并不是很看重,想要赢得市场,产品本身才是关键,无关性别。

2.3.3 不同年龄段、汽车品牌分布

在我国汽车行业占有主导地位的有三种车,德系车、日系车和国产车。年龄的不同对汽车的品味自然也不相同。

不同年龄段的汽车品牌偏好如图3所示,从左到右、从上到下的年龄段分别是:18岁至24岁,25岁至31岁,32岁至38岁,39岁至45岁,46岁至52岁,53岁至59岁,59岁以上。

由图3可知,18至25岁的年轻人将近一半都选择丰田汽车,而丰田走的正是年轻化的路线,从外形设计到内饰处理都做了很多的运动化和年轻化的处理,且品质追求也逐渐上升,这也是他们赢得年轻消费者信赖的资本。而25至45岁年龄段的取向基本一致,且主要购买力为男性,分别为大众、丰田、日产、别克。青壮年时期正是男性事业的起步、上升阶段,对于汽车的需求量较大,多半选择经济实用型。而在45岁以后,经济能力提高,资产丰厚,因此奔驰、奥迪等高档车开始成为众多车主的首选。

2.3.4 不同性别、汽车等级分析

分析原数据,绘制了男性、女性的汽车等级划分图,分别如图4和图5所示。

由图4和图5对比可知,女性的汽车等级总体高于男性,中等偏上,且高档和豪华高档汽车的占比都多于男性,但男性中选择奢侈豪华高档的人数始终多于女性,女性在一定经济能力范围内更偏向于选择偏高档和豪华汽车,可以给女性推荐合适的高档汽车。

2.3.5 不同年龄段、汽车等级分析

车主年龄段与汽车等级关系如图6所示,从数据上看,在各种年龄段,驾驶35万汽车以下的人数在大部分,有一小部分汽车的价格在40万至60万之间,可以推断大众普遍能接受的汽车价格在15万至35万之内,可以将营销重点放在小于35万之内的汽车型号品牌中。

3 模型设计

为了给厂商提供更为精准的营销策略,需要进行特定的群体划分,为了让划分后的群体特征更加鲜明,有必要建立模型来判断特定群体划分的标准。

3.1 模型算法与介绍

此处用到了机器学习中的监督式学习,常见方法有:决策树、朴素贝叶斯、SVM、线性回归等等。不同的模型能适合不同的数据,准确率越高的模型跟数据的匹配度也越高,数据分析效果就会更好。下面介绍常见的三种数据挖掘模型。

1) 决策树:决策树(Decision Tree)是一种在分类、预测、规则提取等领域有着广泛应用的分类算法。决策树是一种叶子节点互相一一对应着分类,在某个属性上的划分对应着非叶子节点,若想将其划分成若干个子集就要根据样本在该属性上的不同取值来操作的树状结构。在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于零的概率,评价项目风险。

2) 随机森林:随机森林(Random Forest,简称RF)被誉为“优秀集成学习技术水平的方法”,是在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入了属性随机选择的方法。不同于决策树,随机森林只需考察一个属性子集即可。随机森林的功能强大,不仅简单且容易实现,计算开销也比较小[2-3]。

3) SVM:支持向量机(Support Vector Machine)模型,是由模式识别中广义肖像算法发展而来的分类器,它拥有许多特性,例如在解决小样本、非线性及高维模式识别中表现良好,并能够推广应用到其他机器学习问题中,如函数拟合等。由简至繁SVM可分为三大类:线性可分得线性SVM、线性不可分的线性SVM、非线性SVM。SVM在各领域的模式识别问题中有广泛应用,包括人像识别、文本分类、笔迹识别、生物信息学等[4-5]。

3.2 模型效果对比

通过原数据得知,用户划分的两大标准可以分为年龄段与性别,所以使用六种分类模型对车辆基本信息和部分用户消费信息进行测试。训练模型:将数据以6:2:2比例分为训练集、验证集、测试集。采用分类算法,分别取年龄段、性别作为标签,其他部分属性列提取为特征,通过测试集得到的数据结果评估模型在训练数据上的性能表现,每个模型经过五次随机测试得平均值后结果分别如表2、表3所示。

表3的测试结果与表2相比准确度较高,但由于数据集中可用数据较少,模型训练效果不佳。将性别作为标签的情况下,SVM支持向量机模型在六种模型中表现效果最好,所以后续将采用性别作为划分用户画像人群的标准。

4 汽车精准营销策略

4.1 根据不同的用户人群消费信息精准推荐

生活中男女的消费水准和消费偏好均有所不同,以性别作为划分用户人群的标准,制作了男性和女性用户的词云图。词云图绘制过程主要是选取了原数据当中的用户消费信息,并做了效果直观文本化处理,生成结果如图7和图8所示。

结合图7和图8可知,男性和女性车主大多是80后、90后。男性车主的日常消费在学生缴费、大型家电、购买汽油、餐饮、教育、买保险等,而女性车主的日常消费在房地产、旅游、逛百货商店、医院看病等。厂商可根据用户的消费信息来判断用户的消费水平及消费场所进行精准广告投放,例如根据之前分析的重点用户和潜在用户的偏好,在较多重点用户常去的商场举办相应汽车品牌、相应车型展览会。针对喜爱旅游的车主,如果酷爱自驾游,可以根据汽车性能,例如耗油量、越野性能、排气量、扭矩等指标推荐适合的车型。

4.2 根据车主个性化偏好推送相关信息

充分了解用户的基本信息后,可以根据车主的偏好推送相关信息,例如汽车品牌、车型、报价等。从原数据中看出,车主男性女性的比例正在逐年接近,汽车厂商应给予同样的重视,按照男女不同偏好来进行精准推送。

1)汽车品牌方面:男性偏好大众、日产、丰田、别克、福特等品牌;女性更取向于奔驰、宝马、奥迪、雷克萨斯、路虎等品牌。

2)汽车报价方面:结合车主的消费能力和接受价格,大多数人能接受的价格在30万以内,从单笔消费最大值在50万以内的用户能接受的汽车价格也在50万以内,根据能接受的消费最大值推荐在此价格范围内的汽车,可以将营销的重点放在30万之内的汽车品牌和型号中。

4.3 根据年龄段、使用年限确定潜在客户

1)车主年龄段分布方面:在中国经济高速发展的今天,新青年已经成为未来购车的主力军,消费者主要集中在30岁以下。随着消费者年龄的增长,潜在消费者年龄段已经降到30岁以下,潜在消费者的比例正持续不断下降,和已经购车的30至49 岁年龄段相比,购车一族的趋势逐渐年轻化,并且十分明显。在原数据中,年龄在32至38岁之间的男性车主数量占大多数,而在驾驶2008年之后出厂汽车的车主分布在32岁之前的呈急速上升趋势。

2)汽车使用年限方面:汽车使用期限通常分为技术使用期限、经济使用期限和合理使用期限。汽车在正常使用的过程中,其性能就随着使用年限的增加而有所下降,当使用到一定期限以后,就要做报废处理。技术使用期限受汽车制造质量、运行条件和保修方式等因素影响,而汽车经济使用期限涉及的因素很多,除汽车制造质量和使用技术外,与经营管理方面等因素也有密切关系。合理使用期限是以经济使用期限为基础,并根据本国的汽车运输政策、汽车工业技术的发展和燃料的供应情况等因素综合确定的使用期限[6]。一般的车型大多数人在10年左右就会更换新车,从原数据看,虽然驾驶2009年以后出厂汽车的车主占大多数,但2008年前出厂的汽车仍有一部分车主在使用。

可以针对汽车购买年份为2008年前的车主和年龄段在25至45岁之间的车主作为重点潜在跟进客户,进行适当汽车推荐。

5 结论

本次研究探究了大数据对汽车经销商精准营销的影响问题。利用得到的数据分析用户的基本属性信息,深入了解用户的特点与共性,发掘他们的真实需求与心理。利用大数据时代信息收集便利的优势,发展数据分析技术,使客户需求响应能力快速提升。汽车市场瞬息万变,汽车营销模式的探究仍在不断进行中[7],同时也更加了解到机器学习在人工智能大数据时代下的潜在力量[8]。只有抓住市场人群的消费心理,满足消费者多样化及个性化需求,才能使我国汽车行业获得更广阔的发展空间。

参考文献:

[1] 时迎健. 大数据对汽车经销商精准营销影响研究[D].东北石油大学,2018.

[2] 刘龙飞. 基于卷积神经网络的在线商品评论情感倾向性研究[D].大连理工大学,2016.

[3] 周志华.机器学习[M].清华大学出版社,2016.

[4] 李道成. 集成支持向量机在民营信用债中的应用[D].山东大学,2019.

[5] 周永章.地球科学大數据挖掘与机器学习[M].中山大学出版社,2018.

[6] 戚金凤.汽车维护保养[J].科技创新导报,2013(14):16-17.

[7] 刘杰.汽车4S店的市场营销策略研究[J].内蒙古教育(职教版),2013(7):72.

[8] Viktor Mayer-Sch?nberger.Big Data: A Revolution That Will Transform How We Live, Work,and Think[M].John Murray,2013.

【通联编辑:王力】

猜你喜欢
精准营销数据分析汽车行业
时代不等人,汽车行业在完成“双碳”这件事上,责无旁贷
汽车行业最热最IN资讯,这里看个够!
汽车行业 最热最IN资讯,这里看个够!
浅谈大数据时代的精准营销
浅析大数据时代对企业营销模式的影响
场景:大数据挖掘的新标准
2015中国汽车行业发展趋势