开源数据挖掘软件WEKA在市场营销教学中的应用

2017-04-27 12:22郭德超胡昌盛
时代金融 2016年35期

郭德超+胡昌盛

【摘要】市场营销学是经济管理类学生的专业基础课程,在授课过程中,不仅要教授学生理论知识,更有教会学生融入现实经济管理活动中,为了激发学生的学习兴趣,提升学生的实践动手能力,本文探讨了在课堂教学中引入开源数据挖掘软件WEKA的教学方法,并给出了实训教学实例,对提升市场营销学课程的实训质量进行了有益的尝试,课堂效果良好。

【关键词】WEKA 市场营销学教学 Apriori关联算法 购物篮分析

一、引言

市场营销学是经济管理类专业学生的专业基础课,随着信息技术的飞速发展,无论是商品信息还是客户信息均是海量的,如何在大数据中挖掘有用的营销信息然后应用到我们的营销中去就是市场营销专业学生需要解决的课题。计算机科学中的数据挖掘技术就是解决在大型数据库中自动分析发现有用信息的技术,其中Apriori关联算法主要用于发现隐藏在大型数据中的有意义联系,本文试图在市场营销学中以开源软件WEKA为例,讲解Apriori关联算法在超市数据分析中的应用,以此来引导学生用数据挖掘的方法来解决实际问题。

二、开源软件WEKA简介

WEKA[1]的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代碼可通过http://www.cs.waikato.ac.nz/ml/WEKA得到。在第11届ACM SIGKDD国际会议上,怀卡托大学的WEKA小组荣获了数据挖掘和知识探索领域的最高服务奖,WEKA系统得到了广泛的认可,成为现今较完备的数据挖掘工具之一。WEKA作为一个开源的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理、分类、回归、聚类、关联规则以及在新的交互式界面上的可视化[2],在现代商业社会,企业的数据一般是海量的,如果学生在进行营销数据管理中能借助于先进软件WEKA进行分析,从海量数据中挖掘出其背后隐藏的种种关系,肯定对于营销数据的挖掘利用、商机的发现大有好处。

三、开源软件WEKA在市场营销学教学的应用

在教学过程中我们选择的是购物篮分析实验,购物篮分析是将关联技术用于交易过程,特别是分析超市收银数据,找出那些以成组出现的商品。对于营销者来说,这是主要的用于数据挖掘的销售信息来源,比如自动分析收银数据后发现:买啤酒的客户也同时购买了薯片,对超市管理人员来说这个发现意义非常大,这些信息可以用于多种目的,比如规划货架的摆放位置、仅对会同时购买的商品中的一种进行打折销售、提供与单独销售的产品相匹配的产品赠券等,商家还可以从顾客的购买行为中鉴别特殊客户,不但可以分析其历史购买模式,而且还能精确地针对潜在用户提供特殊的极其可能感兴趣的购买信息。

教学实验中我们的实验数据采用Weka自带的一个超市购物篮分析数据集,文件名为supermarket.arff,这个数据集是从新西兰的一个真实超市里搜集而来的,数据集属性有217个,实例数量有4627个,很适合用来做购物篮分析实验,首先使用Weka的Explorer界面的预处理面板,加载data目录下的supermarket.arff文件,在Current relation子面板下,我们可以看到这个数据集的基本信息,由于数据集属性比较多,数据量也比较大,因此此时会让学生单击预处理面板上部的Edit按钮,打开数据集的Viewer窗口,查看数据文件,通过适当的讲解让学生理解数据的属性和结构。然后切换至关联面板,选择Apriori算法,保持选项为默认值,单击Start按钮,启动Apriori算法,运行结果如图示。

运算结果得到的十条关联规则中,多项商品多次出现,而且总金额都很高。我们从中可以分析出:第一,购买饼干、冷冻食品等速食的顾客,会顺便采购水果、蔬菜,以补充身体所需的维生素;第二,购买饼干、冷冻食品以及水果、蔬菜的顾客,会顺便购买面包和蛋糕;第三,购买上述食品的顾客,一次购买量都很大,总金额会很高;第四,总金额较高的交易,一般都会购买面包和蛋糕等等。这些信息如果提供给超市方面,可以根据挖掘到的知识重新安排货架、重新布局超市、提供快速付款通道以及安排送货等附加服务,以提升市场竞争力。

对以上结果进行分析以后,可以引导学生尝试Apriori算法的不同参数,然后分析其运算结果,看能否得到一些有价值的营销信息。

四、结论

为了激发出学生学习市场营销学课程的兴趣,我们尝试在教学过程中应用了一个开源工具——WEKA,并借助它的可视化环境、典型算法,在课堂上为学生演示了一个实际问题的解决过程,通过这些教学步骤,让学生循序渐进的做到了解开源软件WEKA,掌握典型算法的使用,利用WEKA处理和分析商业数据,提高数据处理能力,挖掘出对市场营销有价值的信息来。同时WEKA软件是开源软件,对于有编程基础的同学可以分析其算法的原理,也可以通过自己编程来优化算法,进一步提升自己解决问题的能力。

参考文献

[1]I.Witten,E.Frank.WEKA Machine Learning Algorithms in Java[D]. Data Mining:Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann Publishers, 2000.

[2]Kirkby R,Frank E.WEKA explorer user guide.[2007].http://www.cs.waikato.ac.nz/ml/WEKA/2004.

作者简介:郭德超(1978-),男,硕士,研究方向:信息管理。