基于SPSS软件在市场调研中的数据录入方法

2018-01-07 11:02白高洪杨鹏程岛宁
科学与技术 2018年6期

白高洪 杨鹏程 岛宁

摘要:介绍了SPSS在市场调研中数据录入的方法,以及对于录入数据中遇到的问题和麻烦提供了解决的方法,为人们进一步对于SPSS在数据录入上提供了方法。

关键词:问卷录入方式;数据录入;数据验证

一、认识SPSS软件

SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。SPSS对于调查问卷数据的录入和分析,更加准确直观的看出数据给我们的信息。利用SPSS录入问卷数据的有很多种不一样的情况,多选题、单选题、开放性问题、半开放问题等,选用不同的录入方法的时候要考虑到不同的功能和特点。

二、数据结构设计

在录入数据之前,首先要在变量视图中设计调研问卷的数据结构。调研问题的类型可分为开放性问题、半开放性问题、单选题、多选题,在数据结构设计中需要采取不同的方法来处理。

(1)开放性问题的变量设计。

开放性问题是指允许被调研者自己填写答案,而不提供选择项。

例如:你的姓名?( )

开放性问题的变量设计只需要设计一个变量来存储问题的答案,变量的类型根据答案的内容可以设置为字符型、数值型或日期型。变量宽度也根据答案内容来确定,一个汉字为2个字符,一个数字或字母为一个字符。因为变量的内容需要被调研者自行录入,所以值标签不需要设置。度量标准一般为名义类型。

(2)半开放问题的变量设计

半开放题指有选项,并且最后一个是开放性的选项,

例如:你的职业是(A、教师,B、学生,C、其他,——)

这一类题目在录入时可以用两个变量对其进行定义,在第一个变量中,“其他,——”为选项之一;第二个变量将“其他,——”的具体内容看做一个独立的开放题,按照开放题的录入方式进行数据录入,没有选择该选项的数据作为缺失值处理。

(3)单选题的变量设定

单选题的数据录入只需要设置一个变量,然后将变量的标签值设置为每一个选项。

例如:你所在的城市是(A.成都、B.重庆、C.昆明)。

这里我们对于选项的编辑上,为了方便我们后期的数据的录入一般会对数据进行编辑,比如1代表成都,2代表重庆,3代表昆明,这样就可以录入到数据视图里面。单选题的录入有三种方式,但是为了方便问卷后期的计算,一般我们采用数值代码+值标签的形式。

(4)多选题的变量设定

多选题是调查问卷中极为常见的一种问题类型。多選题的答案至少为两项,选出的结果不同当然这就需要设置多个变量来存储答案,多选题的变量设定方法有两种,多重二分法和多重分类法

第一种方法多重二分法适用于不限定最多选项数量的问题。多重二分法是把多选题的每一个选项的选择是否都进行记录,所以变量的数量与选项数量相等。如:你有贷款嘛?(A.车贷、B.房贷、C、其它贷款)这时候可以把这个问题拆分成三个问题,你有车贷吗?(是 否)你有房贷吗?(是 否)你有其他贷款吗?(是 否)。然后设置三个变量来存储调研的答案。

第二种方法多重分类法适用于选项多,但有最多选项数量限制的问题,例如一个有8个选项的多选题,要求最多选两项。针对这类问题就可以采用多重分类法来设置变量。变量的数量与最多选择选项数量相等的变量相同,一个变量录入一个答案即可。若变量数大于选项数,对缺少的选项对应的变量采用空值处理。

三、在数据视图里面录入调研获得的数据

在SPSS录入变量的时候,对于值标签的设定是很有必要的。标签量和值的设定下我们可以更好地去录入数据,可以减少对于文字的编辑量。还可以采用Excle文件来采集数据,然后复制粘贴到SPSS中,降低录入数据的难度。

四、设置验证条件

检验录入数据是否符合业务规则,查找出不合规的数据。首先需要设置变量验证规则,验证规则分为单变量验证规则和多变量交叉验证规则。单变量验证规则可以设置录入数据的值范围或值列表。例如:年龄数据的录入范围可以设定为最大值100,最小值0。多变量交叉验证规则是用来约束变量之间的关系,例如在多选题的多个变量中,不能出现重复值。

检查异常值(重复值、空值)对于异常值和极端值,最好的方法通过频数表来观察有无异常值,但是这样过于繁琐不便于很快的找出是哪一条记录的问题,最简单的方法是选择根据自己的需要选择变量进行排序,这样就可以更好的看出哪一条数据出现了问题,也可以快速的对于这条记录进行修改。

五、数据录入格式的规则

(1)每一个个案在不同的记录中出现,即每一个个案的数据应该占据一行。

(2)每一个测量指标/影响因数只能占据一列的位置,即同一个指标的测量数据应当录入到

同一个变量中去。

六、变量视图的几种情况

(1)认识变量视图

名称:代表这个变量的代号

类型:数值型:是用0——9的数字和其他的特殊的符号组成的类型。字符型:字符型数据以字符串方式存储,不能做四则运算,但可以拆分、合并、检索等操作。日期型:日期型数据用来存储日期和时间。

测量尺度:统计分析中只有变量的存储类型是不够的,很多时候不能说明变量的一些特征,这时候就需要有测量尺度。名义尺度是按照事物的某种属性对其进行分类或分组,变量的取值仅代表类别差异,不能比较各类大小。有序尺度是对事物之间等级或顺序的差别的一种测量,可以比较优劣或排序。定距尺度是对事物类别或次序之间间距的测量。定比尺度是能够测算两个测度值之间的比值的一种计量尺度。等距尺度和定比尺度统称为“标度”。

标签:可以对变量含义进行详细说明

值:可以对变量的取值的含义加以说明。

缺失值:用于设定自定义缺失值,主要用于问卷数据

参考文献

[1]张文彤,邝春伟著 《SPSS统计分析基础教程》第2版

[2]方颖《利用SPSS软件处理临床治疗率》[J]《医学理论与实践》2011

作者简介:白高洪(1996.09-)男,研究方向:数据营销;杨鹏程(1997.06)男,研究方向:数据营销;岛宁(1978.05-)女,讲师,研究方向:数据营销。