3.4 实例四——两个分类变量的列联表分析_Stata统计分析与行业应用案例详解（第2版）-QQ阅读男频轻小说网

上QQ阅读APP看书，第一时间看更新

3.4 实例四——两个分类变量的列联表分析

3.4.1 两个分类变量的列联表分析功能与意义

在上节中，我们讲述了单个分类变量进行概要统计的实例，在本节中，我们将以实例的方式讲解一下两个分类变量是如何进行概要统计的，即二维列联表。

3.4.2 相关数据来源

【例3.4】为研究A市居民的身体情况，某课题组对A市居民的吸烟喝酒情况进行了调查研究，调查得到的数据经整理后如表3.6所示。试对该数据资料进行二维列联表分析。

表3.6 A市居民的吸烟喝酒情况

3.4.3 Stata分析过程

在用Stata进行分析之前，我们要把数据录入到Stata中。容易发现本例中有3个变量，分别是性别、是否吸烟以及是否喝酒。我们把性别变量设定为gender，把是否吸烟变量设定为smoke，把是否喝酒变量设定为drink，变量类型及长度采取系统默认方式，然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后数据如图3.16所示。

图3.16 案例3.4数据

先做一下数据保存，然后开始展开分析，步骤如下：

进入Stata 14.0，打开相关数据文件，弹出主界面。

在主界面的“Command”文本框中输入命令：

    tabulate     smoke   drink

设置完毕后，按键盘上的回车键，等待输出结果。

3.4.4 结果分析

在Stata 14.0主界面的结果窗口我们可以看到如图3.17所示的分析结果。

图3.17 分析结果图

从分析结果中可以看出本次调查所获得的信息：发现共有124位A市居民参与了有效调查，其中有68人吸烟，有56人不吸烟，有41人喝酒，有83人不喝酒，具体来说，既吸烟又喝酒的居民人数为29人，不吸烟也不喝酒的居民人数为44人，只吸烟不喝酒的居民人数为39人，只喝酒不吸烟的居民人数为12人。

3.4.5 案例延伸

上述的Stata命令比较简洁，分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于，它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。

延伸：显示每个单元格的列百分比与行百分比

在本节的例子中，操作命令应该相应地修改为：

    tabulate     smoke   drink, column   row

在命令窗口输入命令并按回车键进行确认，结果如图3.18所示。

图3.18 分析结果图

分析结果表中的单元格包括3部分信息，其中第1行表示的是频数，第2行表示的是行百分比，第3行表示的是列百分比。例如，最左上角的单元格的意义是：不吸烟也不喝酒的样本个数有44个，这部分样本在所有不吸烟的样本中占比为78.57%、在所有不喝酒的样本中占比为53.01%。