临床研究方法与实用技巧1
上QQ阅读APP看书,第一时间看更新

14 EpiData系列之三—EpiData中的变量类型及规则

2014-03-06 陶立元 赵一鸣

我们跟大家一起讨论了EpiData的安装以及各种调试,经过调试之后能够避免不少使用过程中会出现的小错误。在本期中,我们来聊聊EpiData中的一个常用的概念—变量及其类型。

变量这个词源于数学,意思就是会变化的量或未知和未定的量,它是相对于常量而言的。常量不是会变化的量,而是保持不变的量。在计算机语言中,变量指能够储存计算结果或能够表示值的抽象概念,变量可以通过变量名访问。

在EpiData中有四种变量类型,分别是数值型、字符型(文本型)、日期型和其他。下面我们就一一介绍一下这四种类型的变量:

14.1 在对数值型变量进行定义时,我们只需要定义其小数点前后的位数即可。它的最大支持是14位(小数点算一位),即小数点及其前后的数字最多14位。这个应该足够用了。针对多选题的设计,需要将每个选项作为一个单独的变量进行设计,以方便后期的统计分析。

14.2 在对文本型变量进行定义时,首先需要定义文本类型(文本、大写文本和加密字段),然后再定义文本的长度,EpiData最长支持80个字符的长度,也就是可以录入40个汉字,如果有的文本题过长,那么可以为其设置两个变量。“大写文本”中输入的英文会自动转为大写字母,“加密文本”是对REC文件进行加密,你需要输入密码才能录入和导出数据。

14.3 定义日期型变量时,有日月年、月日年和年月日三种,另外还有自动插入日期,它自动插入的是系统的当前日期,也有上述三种类型。

14.4 在其他型变量中有:①自动ID号,就是每次录入一个问卷的时候会依次生成一个编号。②声音提示(soundex),它是依据Soundex码来对文本进行编码,主要用来进行隐私保护它可以将发音相似的姓赋予同样的编码。但是对于中文就真心没用了,因为Soundex码是用来编码英文字母的,至于中文和数字它都会编码为“-000”。③逻辑是否,就是只能输入0和1两个值,0是N,1是Y。

下面我们聊聊EpiData使用一般流程吧。首先你需要建立一个待录入问卷,也就是QES问卷。在设计QES文件时需要注意一些小问题,如多选题的设计需要将每个选项拆为一个独立的变量,这样会方便后期的统计分析。在既往病史的设计时,也最好将既往病史拆成不同的变量进行录入处理。在处理身份证号的时候,需要将身份证号设定为字符型变量,因为一方面EpiData的数值变量只支持14个字符长度,另一方面一些身份证号码是以X结尾,定义为数值变量会导致无法输入完整身份证号码。在设计日期型变量的时候,如果不能保证日期的获得足够完整,那么最好将日期拆成年、月、日三个变量,这样在日缺失的时候,至少还可以输入年和月的信息。

QES文件的设计如下图:

然后点击生成REC文件—选择存储路径—确定,就可以在你指定的存储路径上存储出你的REC文件。下图是REC文件生成成功的图。

再然后就是做CHK文件,CHK文件不是必须的,但是如果有就会防范一些错误。比如设置唯一的ID,这样在文件录入的过程的如果你录入了之前录过的ID,就会提示你该ID已存在。下图是check的插入和编辑窗口。

EpiData的CHK规则很多,有的也很有用处。如果你的研究需要设置CHK,你可以去网上搜索一下,有很多介绍呢。如果你搜索了还是没看懂,那么你可以在“临床流行病学和循证医学”微信公众号里联系我们。我们一定会尽快为大家解决各类临床研究问题的。