临床研究方法与实用技巧1
上QQ阅读APP看书,第一时间看更新

16 EpiData系列之五—EpiData数据库的合并

2014-03-12 曾 琳 赵一鸣

前几期分别介绍了EDiData软件的安装和建库、录入等功能。今天开始要和大家谈谈EpiData软件的数据管理功能了。这些数据管理功能,使EpiData不同于Excel这类大家熟知的处理数据的软件,使它进入我们的视线,并成为我们真心推荐给大家的最大原因。

为了方便进行数据管理,数据库的录入通常不是一次性把所有问卷或病例报告表(CRF)都录入到一个REC文件里,常常会几十份CRF建一个REC文件,在录入完成后对数据库进行合并。这在EpiData中需要应用“纵向追加记录”的功能。

临床研究往往会把研究工作按研究流程分割成几块,如:基线调查、住院信息、手术所见、术后随访。不同模块完成时间不尽相同,录入工作一般不会等到病例都随访完了才做,可以在完成某个模块(如基线)的信息收集后就展开录入工作。也就是说,研究者或数据管理员针对研究流程里的不同模块,会分别建立相应的REC文件,在进行数据分析前需要把同一个患者的各模块的信息综合到一起。这时需要应用EpiData的“横向合并字段”的功能。

简单来说,“纵向追加记录”意思是把含有不同患者信息且结构相同的库合并起来,成为一个患者数量更多的数据库。“横向合并字段”的意思是把含有同样患者信息且结构不同的数据库合并起来成为变量数更多的数据库。

16.1 纵向追加记录示例

不管是追加还是合并,都要用“数据导入/导出”中的“纵向追加记录/横向合并字段”然后选择需要进行追加或合并操作的两个REC文件。

假设我有两个数据库,“append a.rec”和“append b.rec”,两个数据库变量数量、类型、长度是一致的,a库有32名患者的信息,而b库有10名患者信息。为了最后分析的需要,我要把a、b两个库合并在一起,形成一个“append all.rec”文件。这时我需要点击“数据导入/导出”→“纵向追加记录/横向合并字段”,后面的操作请看图。

点击确定后出现以下对话框,能看到要进行追加/合并操作的两个REC文件的大概信息(几个字段/变量和几条记录),需要在在空白框中键入合并后的REC文件的保存路径和文件名。此时注意,如果是对同样结构的两个REC文件进行合并,增加的是数据库里的病例数量则选择“追加/Append”选项卡,这时再次核对一下要进行追加的两个REC文件,从下图可以看到,“append a.rec”和“append b.rec”一样有28个字段(变量),记录数不同;基本确认了这两个REC文件的结构应该差不多,我们目前做的是追加记录。其他的选项让它保持默认选择就好。此时点击“追加/Append”按钮就可以实现两个REC文件的记录追加。

 EpiData会返回上图信息给你,说明已经成功追加了记录,原来的a和b都分别只有32和10条记录,都追加成功后新的REC文件:“append all.rec”中有42条记录,且数据库结构不变(28个字段)。

16.2 横向合并字段示例

假如我有一项研究纳入了32名患者,分基线和随访两部分内容,为了提高效率,我们分别对基线和随访两部分建立了“merge a.rec”和“merge b.rec”两个数据库。其中,病例编号、年龄和性别三个变量两个库中都有,而且变量名、变量结构一致,还指定了病例编号作为索引变量。那么,我目前需要把同样病例编号的患者的基线信息和随访信息进行合并。

对同样的病例,但结构不同的两个REC文件进行合并,数据库病例数量不变,而增加的是数据库里的字段(变量)数量,应选择“合并/Merge”选项卡。这时再次核对一下要进行追加的两个REC文件,从下图可以看到,“merge a.rec”和“merge b.rec”一样有32条记录(病例),字段(变量)数不同;基本确认了这两个REC文件的结构不同,但记录数相同,我们目前做的是数据库的横向合并。为了准确的合并,这时一定要“选择合并所必须匹配的字段”勾选REC文件中的索引变量,也就是病例编号,其他的选项让它保持默认选择就好。此时点击“合并/Merge”按钮就可以实现两个REC文件的变量合并。

Epidata会返回上图结果给你,我合并的两个REC文件都有32名相同患者的信息,其中a库有13个变量,而b库有18个变量;其中有三个变量是重的,相同的变量的信息来自a库,所以,合并所得的“merge all.rec”中有32名患者的28个变量的信息。

如果你还是觉得容易混淆追加和合并的话,想象一下咱们小时候搭积木,如果说每个患者的基线、随访是不同积木块,那么通过横向合并可以把每个患者搭起双层或多层小楼,而通过纵向追加可以把每个患者的小楼串在一起,成为一个小社区。最后希望大家都能玩转数据库这个变形金刚。