临床研究方法与实用技巧1
上QQ阅读APP看书,第一时间看更新

15 EpiData系列之四—EpiData的数据录入及管理

2014-02-28 李 楠 赵一鸣

使用EpiData进行数据录入其实是很简单的事情,但是保证数据录入的质量就不这么简单了。因为所有的数据录入过程都需要融合数据管理的一些思想在里面,否则只是拿到REC文件就开始录入,往往到分析的时候就会头疼了。即使分析的时候没发现有什么不妥,说不定由录入带来的问题已经隐藏在了数据之中,直接影响了研究的结果和结论。今天就简单介绍一下录入过程和其中的一些技巧。

15.1 EpiData的数据录入方法

不用多说了,如果是录入的话,首先就是要打开已经生成的REC文件。

可以见到如下的界面:

一般录入时应从第一份开始录入,既下方已完成的位置应该是0。如果REC中之前就存有数据,则开始时下方的已完成分数中可以不是0。

如果某一个变量录入框已经被填满,则光标会自动跳转到下一个录入框,可以直接录入下一个数据。如果某个录入框尚未被填满,但是已完成该项录入,则可以点击回车键,跳转到下一个录入框继续录入数据。当问卷的最后一个变量录入完成后(最后一个变量完全填满或在最后一个变量填写时点击回车),可以按系统提示记录存盘即可跳转到下一条记录。

如需在已录入的问卷间切换,可以通过单击下方记录数量标示处的箭头。从左到右分别表示“回到第一份”、“前一份”、“后一份”、“到最后一份”。

15.2 使用EpiData进行数据录入的几个管理要点

15.2.1 要保存好空白数据录入文件。在录入中,可能会需要分中心录入、不同录入员录入或者根据不同来源的数据分开录入等情况。当需要分开文件录入一批数据的时候,我们就会发现又需要一个空白的录入文件了。提前保留空白的录入文件备用显得十分重要。

15.2.2 录入过程中保证REC文件不被修改。从功能上说,EpiData建立的REC文件是可以在录入过程中进行修改的。但是如果录入人较多,待录入文件量较大的时候,我们还是建议您要在整个录入过程中保持REC文件的结构不被修改。因为如果结构发生变化,或者个别变量命名改变或增加、删减,则最后合并及导出的数据就会出现混乱,为后期数据整理和利用带来大量不必要的麻烦。万一由于实际需要,要增加变量数量、增加变量长度,则需要由数据管理员针对所用录入者的REC文件进行同步修改,以保证各REC文件的一致性。保证REC文件不被修改的重要方法之一,就是在把REC交给录入员的同时,不要把QES文件同时交给他们(虽然仅有REC也可以生成QES,但是至少避免了误操作)。

15.2.3 录入时保持数据的原汁原味。录入员经常会发现问卷中有些内容看上去有问题,有些甚至存在明显的错误。根据我们的经验,在数据录入过程中尽量不要对问卷中的“错误”进行修改。原因有几个,首先,我们无法准确判断这个“错误”是否真的错误,如果在录入阶段把它改掉了,则后面就再也没有机会进行判断了。暂时留着,等到数据清洗过程在发现和修改,这时才能保证每一次修改都是能留下痕迹的。其次,录入员的修改很可能为双录入和数据核查带来麻烦,增加后期数据核查的工作量。无论如何,录入员要把自己的“主见”放下,在录入过程中只要做好数据从纸质问卷到电子数据库的转移即可。

15.2.4 要给每个REC命名。当多个录入员、中心或时间点分别录入时,每个录入员录入的文件都应该有自己的命名。我们习惯在REC文件的命名中体现出录入者、中心及时间信息,以便进行区分管理。比如,可以将北京大学第三医院分中心2013年12月15日由张华录入的REC文件命名为“bysy张华20131215.rec”。

15.2.5 过程文件的保存与备份。如果一批资料需要分多日进行录入,则应将每天录入完成的文件拷贝一个副本到单独的备份文件夹中保存。这样做的好处是,万一发现某天以后的REC文件或其他文件发生损坏,通过回溯备份资料,能将损失减少到最低。此外,分不同的硬盘、不同电脑分别备份也是至关重要的,以免硬件故障带来不可恢复的损失。

15.2.6 要重视调查员培训。根据经验,我们发现专业水平越高的调查员,往往录入执行的依从性就越差。我们在录入前一定要重视调查员培训的过程,至少要用半天的时间详细讲解整份问卷,介绍上述管理要点。同时还要让每个录入员试录8~10份问卷,提出问题。经确认无误后再开展录入工作。需要强调的是,一定要不厌其烦的重复多次向录入员强调:根据原始记录如实录入;不能修改REC;做好按日的数据备份。根据我们的实际操作经验,我想这几件事情至少要在培训中重复强调3次以上,才能在一定程度上避免录入者发生上述情况。