第5章 数据转换与SPSS函数
本章包括
◆ SPSS表达式
◆ SPSS函数
◆ 变量的计算
◆ 数据的选取
◆ 个案计数
◆ 数据的重新编码
◆ SPSS变量集
在利用SPSS进行数据处理和统计分析的过程中,变量计算和数据转换是极为关键的一个环节。例如,不同年份的国民生产总值,由于不同年份的价格指数存在差异,因此在进行比较时,需要将所有不同年份的数据转换为统一口径下的数据。再如,进行非线性回归分析过程中,有时需要计算数据的特定函数值。
要解决上述问题,需要明确SPSS定义的关系表达式、SPSS的内部函数以及SPSS关于数据转换的基本方法和操作。
5.1 SPSS的表达式
SPSS定义的表达式与其他高级语言或软件基本类似,可分为算术表达式、条件表达式和逻辑表达式3种。
5.1.1 SPSS算术表达式
SPSS的算术表达式是由常量、变量、算术运算符和函数等组成的表达式。这里的变量指的是SPSS数据文件中定义的变量。
算术运算符由+(加)、-(减)、*(乘)、/(除)、**(乘方)构成。参与运算的数据类型和最后运算结果都为数值型。
运算次序为先乘方运算,再乘除运算,最后进行加减运算;同级运算中,按先左后右的顺序计算。可以通过添加圆括号改变原有的计算顺序。例如X+2*Y+LN(Z)是一个合法的算术表达式。
例如,在第4章表4.1教师基本情况调查问卷的数据文件中,需要计算教师的年度津贴分数,设定计算公式:工作量+论文数*2+职称*年龄/20,表达式中的变量都是数值型,可以参与计算。
5.1.2 SPSS条件表达式
SPSS条件表达式是通过关系运算符建立的两个量之间关系的表达式。如变量计算时,必须选择满足一定条件的个案参与运算,这时可利用条件表达式的值指定个案。
关系运算列表如表5.1所示,其中列出了关系运算符的6种表示形式及其含义。
表5.1 关系运算符列表
关系运算表达式表示的实际上是对条件进行判断的式子,其结果只有两种取值:如果判断条件成立,结果为“真”;如果判断条件不成立,结果为“假”。条件表达式的结果为逻辑型常量。相互比较的两个变量类型必须一致。
表示一个条件表达式有两种等价的方式,如“A大于B”既可以表示成“A>B”,也可以表示成“A GT B”。
例如,在第4章表4.1中的大学教师基本情况问卷统计表中,需要指出所有科研经费大于等于5000元的个案。条件表达式“科研经费>=0.5”为真时的个案为满足条件的指定个案。
5.1.3 SPSS逻辑表达式
逻辑表达式是由逻辑运算符号和条件表达式等组成的表达式。和条件表达式的值一样,逻辑表达式的值也为逻辑常量。
逻辑运算符列表如表5.2所示,其中列出了3种逻辑运算符的表示形式及其含义。
表5.2 逻辑运算符列表
逻辑运算符的运算顺序:NOT运算优先级最高,其次是AND,最低是OR;同关系表达式一样,也可以通过圆括号改变运算顺序。
逻辑表达式又称复合条件表达式。应用中,经常利用逻辑运算符将多个条件表达式连接在一起,形成复杂的关系表达式。
例如,在第4章表4.1中,需要在具有中低级职称的教师中指出所有科研经费大于等于5000元的个案。逻辑表达式“职称<=3 AND科研经费>=0.5”为真时的个案为满足条件的指定个案。