4.7 数据的加权_SPSS宝典-QQ阅读中文轻小说网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

4.7 数据的加权

数据加权是指在统计分析过程中，不同个案定义不同的权数。加权变量的数值表示数据文件中个案观察值的频数。当加权值为0、负值或缺失值时的个案不参与分析，正的小数可以为加权值。

当执行加权后，该加权变量一直作用到改变权变量或停止加权之前。保存加权的数据文件，其加权信息也一并被保存，可以在任何时候改变加权变量或关闭加权功能。

下面举一个例子，说明加权操作的基本方法。

（Rutherford放射性粒子数实验）Rutherford进行了著名的实验，观测在固定的时间间隔内，放射性物质放射出的粒子个数。共进行了N=2608次观测，观测时间间隔为7.5s，Rutherford放射性粒子实验数据如表4.3所示。其中k为粒子数，Nk为相应出现的次数。指定加权变量，并画出粒子数出现频数的直方图。（数据文件：weight.sav）

表4.3 Rutherford放射性粒子实验数据

数据加权操作的基本步骤如下：

step 1 根据表4.3，在SPSS数据编辑窗口，创建名为weight.sav的数据文件。变量名分别为K和NK，表示时间间隔的粒子数和粒子数的频数。

step 2 在数据编辑窗口，选择菜单“Data”→“Weight Cases”（个案加权）命令，打开“Weight Cases”对话框，如图4.24所示。

图4.24 “Weight Cases”对话框

step 3 选择是否对个案进行加权操作。对话框中包含两个单选框：

◆ Do not weight cases不对个案加权。为默认选项。

◆ Weight cases by对个案加权。这时，“Frequency Variable”（频数变量）窗口变为可用。在左侧的变量列表框中指定频数变量，单击右向箭头按钮，将其移动到“Frequency Variable”框中。本例选择变量NK为频数变量。

step 4 单击“OK”按钮，执行个案加权。

step 5 选择菜单“Analyze”→“Descriptive Statistics”→“Frequencies”命令，打开如图4.25所示的“Frequencies”（频数）对话框。在变量列表框中选择变量“NK”，单击右向箭头按钮，将变量移动到“Variable(s)”（变量）对话框。

图4.25 “Frequencies”（频数）对话框

step 6 单击“Charts”按钮，打开“Frequencies：Charts”（频数分析：图形）子对话框，选择“Histograms”（直方图）选项，然后单击“Continue”按钮，返回至“Frequencies”对话框。

step 7 单击“OK”按钮，执行频数分析操作。在输出窗口中，得到放射性物质粒子数直方图，如图4.26所示。

关于描述性统计分析的频数模块，将在基本统计分析一章中详细解释。

图4.26 放射性物质粒子数直方图

step 8 “Paste”得到的Syntax语句程序如下：

          /＊  加权操作.
          WEIGHT
            BY NK .

          /＊ 频数分析.
          FREQUENCIES
            VARIABLES=NK
            /HISTOGRAM
            /ORDER=  ANALYSIS .