4.7 数据的加权
数据加权是指在统计分析过程中,不同个案定义不同的权数。加权变量的数值表示数据文件中个案观察值的频数。当加权值为0、负值或缺失值时的个案不参与分析,正的小数可以为加权值。
当执行加权后,该加权变量一直作用到改变权变量或停止加权之前。保存加权的数据文件,其加权信息也一并被保存,可以在任何时候改变加权变量或关闭加权功能。
下面举一个例子,说明加权操作的基本方法。
(Rutherford放射性粒子数实验)Rutherford进行了著名的实验,观测在固定的时间间隔内,放射性物质放射出的粒子个数。共进行了N=2608次观测,观测时间间隔为7.5s,Rutherford放射性粒子实验数据如表4.3所示。其中k为粒子数,Nk为相应出现的次数。指定加权变量,并画出粒子数出现频数的直方图。(数据文件:weight.sav)
表4.3 Rutherford放射性粒子实验数据
数据加权操作的基本步骤如下:
step 1 根据表4.3,在SPSS数据编辑窗口,创建名为weight.sav的数据文件。变量名分别为K和NK,表示时间间隔的粒子数和粒子数的频数。
step 2 在数据编辑窗口,选择菜单“Data”→“Weight Cases”(个案加权)命令,打开“Weight Cases”对话框,如图4.24所示。
图4.24 “Weight Cases”对话框
step 3 选择是否对个案进行加权操作。对话框中包含两个单选框:
◆ Do not weight cases不对个案加权。为默认选项。
◆ Weight cases by对个案加权。这时,“Frequency Variable”(频数变量)窗口变为可用。在左侧的变量列表框中指定频数变量,单击右向箭头按钮,将其移动到“Frequency Variable”框中。本例选择变量NK为频数变量。
step 4 单击“OK”按钮,执行个案加权。
step 5 选择菜单“Analyze”→“Descriptive Statistics”→“Frequencies”命令,打开如图4.25所示的“Frequencies”(频数)对话框。在变量列表框中选择变量“NK”,单击右向箭头按钮,将变量移动到“Variable(s)”(变量)对话框。
图4.25 “Frequencies”(频数)对话框
step 6 单击“Charts”按钮,打开“Frequencies:Charts”(频数分析:图形)子对话框,选择“Histograms”(直方图)选项,然后单击“Continue”按钮,返回至“Frequencies”对话框。
step 7 单击“OK”按钮,执行频数分析操作。在输出窗口中,得到放射性物质粒子数直方图,如图4.26所示。
关于描述性统计分析的频数模块,将在基本统计分析一章中详细解释。
图4.26 放射性物质粒子数直方图
step 8 “Paste”得到的Syntax语句程序如下:
/* 加权操作. WEIGHT BY NK . /* 频数分析. FREQUENCIES VARIABLES=NK /HISTOGRAM /ORDER= ANALYSIS .