一个准确无误的SPSS数据文件是统计分析的原材料,那么如何才能形成一个准确无误的SPSS数据文件呢? 在这里主要介绍如何把零乱的问卷答案整理成SPSS格式的电子数据,也就是数据的前期处理,它的基本过程是:首先,在确认的问卷上标上输入的记号(即上Column),根据问卷定义输入的模板、编写查错程序(用于检查问卷矛盾和逻辑关系)和数据报告程序(撰写数据报告用)。在问卷回来后,如果问卷上有开放题或者半开放题,则对问卷上的文字进行编码,然后对所有答案统一输入到电脑上,再进行查错工作。在查错过程中,发现有问题的问卷返回访问部。直到所有问卷输入完毕并通过查错程序检查,保证数据正确后,再运行预先写好的SPSS程序,出SPSS格式的数据报告。 在数据录入完成后,可能因为访问错误或者输入本身错误导致数据的错误,为保证数据的准确性必须用quantum编写的查错程序对数据进行检查。由于问卷的题型大体上分为封闭题和开放题两类,所以数据查错也可以从着两个方面来分析。 一、封闭题 1.单选题 因为单选题有且只有1个正确答案,所以只要查出没有答案或者有1个以上答案的问卷。 2.复选题 a.一般复选题 一般复选题因为可以选1个或1个以上的答案,所以一般来说只要查出不在规定范围内的问卷就可以了。 b.有第一提及的复选题 对第一提及来说,有且只有1个答案,查错方法与单选题相仿。 对于其他提及,跟一般复选题相似,但要注意的是在第一提及出现过的答案不应在其他提及再出现,即查出其他提及同时有第一提及的答案或说“不知道”的。 3.封闭题与封闭题之间的逻辑关系 常见的有:提示(知名度)与不提示(知名度);最好/最理想/最喜欢/…的品牌与其知名度等等。这里指的是存在一种有A必有B或有B 必有A的逻辑关系。查错就是要把不符合这种关系的答案查出来。 二、开放题 1.一般开放题 因为开放题是被访者的主观答案,不存在对错之分,所以一般开放题只要有答案,问题都有不大。但要注意其意思与问卷其他内容的吻合性。 2.回答有具体数字的开放题 如年龄、收入、住房面积、电话费、产品价格等等。根据经验,这些数值会在一定范围内,否则,就不符合常理。 三、其他 查错除了要找出问卷上有逻辑错误外,查出输入错误也是比较重要的。然而因输入造成的错误是千变万化的,一般没有什么规律可寻。但也不是说没有办法查,我们可以把某一道题或某几道题的输入情况列出来,看是否有异常,再针对异常情况找出有问题的问卷。前面提到的单选题查错以及当我们不太清楚将会出现什么错误时也可以按这种方式来查。 总的来说,问卷的逻辑关系则可以分为题目内部的逻辑关系和各题目之间的逻辑关系,查错前要搞清楚整份问卷的内容,找出每一道题目及各道题目之间的前后联系,列出矛盾对立面,再写成程序,从而查出有错的问卷。 在数据编码、录入、查错都结束后,最后一步就是出SPSS数据报告,在这个环节只要把之前编写好的SPSS程序运行一遍就行了,也就是把后缀名为 .dta的数据文件读取到SPSS中并设置各变量的属性。为保证质量,在提交报告前通常还要对数据报告作最后的检查,主要检查以下几方面的内容: ①做个频数分析,检查样本量及配额情况 ②检查缺失值是否正确定义 ③检查数据是否有异常情况 ④检查标签定义是否符合要求 ⑤检查是否有相同问卷编号情况 通过以上几个步骤,可形成一个SPSS格式的电子数据,前期的数据处理基本完成。有了SPSS数据文件就可以进行后面的深入的数据分析,数据分析是一个整理、罗列、剖析与预测的过程。 |