6.3 描述性分析过程
SPSS的描述性分析过程的功能和上一节介绍的频数分析过程类似,主要以计算数值型单变量的统计量为主,但没有图形功能。另外,描述性分析过程可将原始数据转换成标准正态评分值,并以变量的形式存入数据文件中,便于后续分析时应用。
6.3.1 描述性分析的SPSS操作
描述性分析利用“Descriptive Statistics”菜单下的“Descriptives”过程进行分析,其基本操作步骤如下:
step 1 打开描述性分析对话框。
在数据编辑窗口,选择菜单“Analyze”→“Descriptive Statistics”→“Descriptives”命令,打开“Descriptives”(描述性分析)主对话框,如图6.7所示。
图6.7 “Descriptives”(描述性分析)主对话框
在对话框变量列表窗口,选择要分析的变量名,单击右向箭头按钮,将其移动到“Variable(s)”窗口。
对话框下方给出选项“Save standardized values as variables”,若选择该项,则表示为每个选择变量的取值计算Z标准得分,并在当前数据文件中添加新变量,用于保存相应的Z标准得分,其变量名为相应变量名前加字母z。
Z标准得分的数学计算公式为:,这里,xi是该变量的样本值,是样本均值,S是样本标准差。Z标准得分表示的是一个变量值与该变量的平均值之差是标准差的倍数。
step 2 选择“Descriptives:Options”对话框中的选项。
单击“Options”(选择)按钮,打开“Descriptives:Options”(描述性分析:选项)对话框,如图6.8所示。
图6.8 “Descriptives:Options”(描述性分析:选项)对话框
在“Descriptives:Options”(描述性分析:选项)对话框中,选择需要输出的统计量及其参数。对话框中可选统计量包括:
◆ Mean 均值,默认选项。
◆ Sum 求和。
“Dispersion”(偏离)窗口给出了描述离散程度的统计量,包括:
◆ Std.deviation 标准差,默认选项。
◆ Variance 方差。
◆ Range 极数。
◆ Minimum 最小值,默认选项。
◆ Maximum 最大值,默认选项。
◆ S.E.mean 均值标准误差。
在“Distribution”(分布)窗口选择描述数据分布的统计量,有两个可选项:
◆ Kurtosis 峰度。
◆ Skewness 偏度。
“Descriptives:Options”对话框还提供了当有多个变量时的输出顺序:“Display Order”(显示顺序)窗口给出了4个单选框:
◆ VariabIe Iist 按数据文件中变量显示的顺序,显示变量的统计量。为默认选项。
◆ AIphabetic 按变量的字母顺序显示变量的统计量。
◆ Acsending means 按变量均值的升序显示变量的统计量。
◆ Descending means 按变量均值的降序显示变量的统计量。
选择完毕后,单击“Continue”按钮,返回“Descriptive”(描述性分析)主对话框。
step 3 执行操作。
单击“OK”按钮,执行统计量描述过程。
6.3.2 实例:学生体检数据的描述性分析
6.3.2.1 实例数据
表6.2给出的是从某学校选取的3个班级各5名学生的体检列表,包括性别、年龄、体重(kg)和身高(cm)的数据,现要求以班级为单位列表,计算年龄、体重和身高的统计量,包括极差、最小值、最大值、均值、标准差和方差。(数据文件:descriptives.sav)
表6.2 体检列表
6.3.2.2 操作步骤
因为要求以班级为单位进行统计,所以“班级”变量应设为分组变量。但由于SPSS的Descriptives过程不具有分组统计功能,故先利用数据拆分功能按“班级”变量值进行拆分,再利用Descriptives进行统计量计算和描述。
操作步骤:
step 1 打开或创建数据文件descriptives.sav。
step 2 选择菜单“Data”→“Split File”命令,在弹出的“Split File”对话框中,选择“Compare groups”单选项,再将数据列表中的“班级”变量移动至“Groups based on”列表框,单击“OK”按钮,完成数据按班级拆分的操作。
第4章详细介绍了数据拆分的方法和基本操作。
step 3 在数据编辑窗口,选择菜单“Analyze”→“Descriptive Statistics”→“Descriptives”命令,打开“Descriptives”主对话框,在变量列表框中选择变量“年龄”、“体重”、“身高”,单击右向箭头按钮,将选择的变量移动到“Variable(s)”窗口。并选择“Save standardized values as variables”,即要求以变量形式保存标准值。
step 4 单击“Options”按钮,打开“Descriptives:Options”子对话框,选择统计量Range、Minimum、Maximum、Mean、Std. deviation、Variance。单击“Continue”按钮,返回至“Descriptives”主对话框。
step 5 单击“OK”按钮,执行描述性分析操作。
step 6 “Paste”得到的Syntax命令语句程序如下:
/* 按班级拆分文件语句命令. SORT CASES BY 班级 . SPLIT FILE LAYERED BY 班级 . /* 描述性统计分析命令语句. DESCRIPTIVES VARIABLES=年龄 体重 身高 /SAVE /STATISTICS=MEAN STDDEV VARIANCE RANGE MIN MAX .
6.3.3 描述性分析的结果
表6.3是描述性统计分析的结果。表中分别给出了3个班级的相应统计量,随着平均年龄的增加,体重和身高的平均值都在明显增加,同时,相应的标准差也有增大的趋势。
表6.3 描述性统计分析结果