admin 管理员组文章数量: 1086019
2024年3月21日发(作者:属性是什么意思?饭圈)
·临床研究规范·
应用
EpiData
软件创建临床研究电子数据库
王瑞平
李斌
(上海市皮肤病医院临床研究与创新转化中心
上海
200443
)
摘
要
临床研究的实践中,考虑到大多数临床研究工作者的项目经费问题,往往不能应用临床试验电子数据采集
(
EDC
)数据库开展临床研究数据录入和管理等工作。因此,
EpiData
这种开源、免费的数据库软件便“脱颖而出”,受
到越来越多临床研究团队的青睐和应用。本文从
EpiData
软件简介开始,分别介绍建立电子数据库所用到的变量类别和
设置方式,并以建立
EpiData
数据库过程的先后顺序,讲解“调查表(
QES
)文件”“数据(
REC
)文件”“核查(
CHK
)
文件”的创建方法,由此来详细介绍如何应用
EpiData
软件创建临床研究电子数据库。
关键词
EpiData
软件
临床研究
电子数据库
R-3; G312
文献标志码:
C
文章编号:
1006-1533(2023)13-0072-05
中图分类号:
引用本文
王瑞平
,
李斌
.
应用
EpiData
软件创建临床研究电子数据库
[J].
上海医药
, 2023, 44(13): 72-76; 81.
Establishment of an electronic database for clinical study by EpiData software
WANG Ruiping, LI Bin
(Clinical Research & Innovation Center, Shanghai Skin Disease Hospital, Shanghai 200443, China)
ABSTRACT In the practice of clinical research, most researchers are often unable to use electronic data capture (EDC)
databases for clinical research data entry and management due to the financial constraints of their projects. As a result, EpiData,
an open-source and free database software, has become more and more popular and been used by clinical research teams.
The variable categories and settings used to build the electronic database were introduced starting from the introduction of
EpiData software, followed by the sequence of the process of establishing an EpiData database and the creation methods of the
“questionnaire (QES) file”, “record (REC) file”, and “check (CHK) file”, and finally how to create an electronic database for
clinical studies was introduced in detail.
KEY WORDS EpiData software; clinical research; electronic database
EpiData
是丹麦欧登塞的一个非盈利组织开发并推
广,该数据库软件的程序设计者是
Jens M. Lauritsen
、
Michael Bruus
和
Mark Myatt
。
EpiData
是一款免费的数
基金项目:上海市卫生健康委员会卫生行业临床研
究专项(
202240371
);上海申康医院发展中第二轮促进
市级医院临床技能与临床创新三年行动计划——研究型
医师创新转化能力培训项目(
SHDC2022CRS053
);上海
市皮肤病医院引进人才科研基金项目(
2021KYQD01
);
上海人才发展基金资助项目(
2021SHRCFZ01
);上海市
医院协会医院管理研究基金项目(
X2022117
)
作者简介:王瑞平,博士,副教授、副主任医师,
硕士生导师。研究方向:临床流行病学、生物统计学在
临床研究中的应用
通信作者:李斌,博士,主任医师、教授,博士生导师。
研究方向:皮肤病的中医药防治
据管理软件,研究者可以在
网站
上下载。
EpiData
软件目前最高版本为
3.1
,包括中文和
英文
2
个版本可供用户选择。
EpiData
软件数据库可承
载
200 000
~
300 000
条记录,每份记录的界面可以录入
999
行问题(变量),基本上可以满足
99%
以上的临床
研究对数据录入的要求
[1]
。研究者在
EpiData
软件官方
网站完成下载后,可以通过“
”在计算机中安
装这个程序,也可以通过直接将“
”文件拷
贝到计算机桌面,点击运行便可打开
EpiData
软件(图
1
)。
1
创建数据库前的准备
一份完整的
EpiData
数据库软件至少应包括:调查
表(
questionnaire, QES
)文件、数据库记录文件(
record,
REC
)和逻辑核查(
check, CHK
)文件。因此,研究者
应用
EpiData
完成数据库建立后,应审核数据库文件夹
72
Copyright©博看网. All Rights Reserved.
上海医药
2023
年 第
44
卷 第
13
期 (
7
月上)
·临床研究规范·
图
1 EpiData
软件数据库的打开方式示意图
中是否包括
QES
、
REC
、
CHK
这
3
个文件,以判断数据
库的完整性。
打开
EpiData
软件后,其界面如图
2
所示,包括标题、
菜单列、过程工具条和编辑工具条。标题仅显示“
EpiData
3.1
”提示研究者所使用的版本;菜单列与
Office
办公软
件的菜单列相仿,包括了“文件”“数据录入控制”“数
据导入
/
导出”“数据处理”“工具”“窗口设置”和“帮
助”等菜单栏,研究者可以根据需要选择;过程工具条
是
EpiData
软件建立数据库的核心提示内容和操作步骤,
包括“
1
打开文件”“
2
生成
REC
文件”“
3
建立
CHK
文
件”“
4
数据录入”“
5
数据处理”和“
6
数据导出”,初
学者根据这些步骤的提示,就可以完成数据库的建立和
数据录入;编辑工具条主要是帮助数据库建立中的“打
开文档”“复制
/
黏贴
/
剪切”等功能,方便数据库的建立。
图
2 EpiData
软件数据库界面
在创建
EpiData
数据库前,研究者应熟悉常用的变
量类型。临床研究中,常用的数据变量类型包括数值型
变量、字符型变量和日期型变量。数值型变量用“
#
”表
示,一个“
#
”可以录入一个数字;字符型变量用英文下
划线“
_
”表示,
2
个字符“
__
”即为一个汉字,最多可
以录入
80
个字符,即
40
个汉字;日期型变量用“
mm/dd> ”表示。另外,还有逻辑型变量“ N> ”和自动 ID 号,研究者可以根据实际情况选用。 如图 3 所示,以“流动人口特应性皮炎患病率现况 调查”问卷为例。示例共摘录了 7 个变量,包括问卷编 号和 a1 ~ a6 这 6 个问题。从变量类型看,问卷编号和 问题 a2 ~ a5 均为数值型变量,后续建库用“ # ”表示; a1 是有关出生年月的问题,为日期型变量,后续建库用 “ ”表示;而 a6 是有关省份的问题, 为字符型变量,后续建库用“ ___ ”表示。 2 创建 EpiData 数据库 在清楚识别调查问卷中每个问题的变量类型后,打 上海医药 2023 年 第 44 卷 第 13 期 ( 7 月上) 73 Copyright©博看网. All Rights Reserved. ·临床研究规范· 流动人口特应性皮炎患病现况调查问卷 (部分摘选) ££££ id 问卷编号: a1 您的出生年月: _____ 年 __ 月 __ 日 a2 您的性别: 1 男 2 女 a3 您的最高学历: 1 小学及以下 2 初中 3 高中 / 技校 4 大学及以上 a4 您目前所在的工作场所为: 1 工厂 2 建筑工地 3 服务、娱乐场所 a5 去年您的平均月收入(元): ( 1 )< 500 ( 2 ) 500 ~ ( 3 ) 1 000 ~ ( 4 ) 2 000 ~ ( 5 )≥ 3 000 a6 您来自哪个省份 ? ____________ 图 3 纸质调查问卷示例 开 EpiData 软件,点击“打开文件→建立新 QES 文件”, 新建一个空白 QES 文件,再把图 3 中调查问卷的内容直 接复制黏贴到该 QES 文件中,保存到在计算机中提前建 好的 EpiData 数据库文件夹即可。 在新建的 QES 文件中,如果原始调查问卷(图 3 ) 有每个问题的变量名称,就不需要在 QES 文件中设置变 量名,如果原始调查问卷没有设置变量名称,研究者需 要在建立数据库时给每一个问题指定一个变量名。变量 名命名应符合一定的规则和要求:①变量名不能是汉字; ②变量名的第一个字符一定是字母( A ~ Z ),之后可以 含字母( A ~ Z )和数字( 0 ~ 9 ),例如“ a1b ”“ ab1 ”“ a1a2 ” 等;③变量名最长为 10 个字符,过长则无法被系统识 别;④变量名要与后面的问题之间留有空格,如图 3 中 的“ a1 您的出生年月”,不能写成“ a1 您的出生年月”, 因为汉字与字母、数字连在一起,违反了命名规则,系 统会将其判别为错误;⑤注意唯一识别变量的重要性( key unique ),每一个数据库务必至少指定一个唯一识别变量, 这个变量在后续的数据库合并、双录入一致性检验时都 是必不可少的。 研究者完成对每一个问题进行变量名设置后,即可 根据变量的不同类型来分别设置每一个变量名对应问题 的数据输入格式。如图 4 所示,“ id 问卷编号”为 4 位数 a2 ~ a5 的数值型变量,因此录入格式设置为“ #### ”; 这 4 个问题全部为数值型变量,因问题选项个数全部为 a1 为日期型变量,个位数,因此录入格式设置为“ # ”; a6 为字符型变量,其录入格式设置为“ ”; 其录入格式设置为“ _____________ ”。完成上述设置后, 点击保存按钮,一份合格的 QES 文件便建好了。 流动人口特应性皮炎患病现况调查问卷 (部分摘选) id 问卷编号: #### a1 您的出生年月: a2 您的性别: 1 男 2 女 # a3 您的最高学历: 1 小学及以下 2 初中 3 高中 / 技校 4 大学及以上 # a4 您目前所在的工作场所为: 1 工厂 2 建筑工地 3 服务、娱乐场所 # a5 去年您的平均月收入(元) # : ( 1 )< 500 ( 2 ) 500 ~ ( 3 ) 1 000 ~ ( 4 ) 2 000 ~ ( 5 ) ≥ 3 000 a6 您来自哪个省份? ____________ 图 4 EpiData 软件 QES 文件格式特点 74 Copyright©博看网. All Rights Reserved. 上海医药 2023 年 第 44 卷 第 13 期 ( 7 月上) ·临床研究规范· 完成建立 QES 文件后,接下来一步工作就是根据建 立好的 QES 文件自动生成 REC 文件。如图 5 所示,在 EpiData 软件过程工具条中,点击“ 2 生成 REC 文件” 按钮后,软件会弹出“根据 QES 文件生成 REC 文件” 对话框,直接点击“确定”即可。 图 5 EpiData 软件根据 QES 文件生成 REC 文件示意图 此时,在 EpiData 软件过程工具条中,点击“ 4 录 入数据”按钮后,软件会弹出“打开”对话框,选择刚 刚建好的 REC 文件,即进入数据录入界面。如图 6 所示, EpiData 软件已打开 REC 文件,研究者已可以进行数据 录入。但是,由于没有添加“数据录入质控”命令,这 时录入数据是没有限制的。例如问题 a2 ,根据选项“ 1 男 2 女”,研究者期望的正确录入数字是“ 1 ”或“ 2 ”, 但由于没有添加“数据录入质控”命令,此时可以录入 0 ~ 9 中的任何一个数字,这便增加了录入错误的概率。 为了降低和避免这样的错误,可以通过建立 CHK 文件, 对 REC 文件中的每个变量的录入进行限制和控制,提高 录入的准确度和效率。 图 6 EpiData 软件 REC 文件录入界面示意图 为建立数据库录入的 CHK 文件,首先应在 EpiData 软件过程工具条中,点击“ 3 建立 CHK 文件”按钮,随 上海医药 2023 年 第 44 卷 第 13 期 ( 7 月上) 75 Copyright©博看网. All Rights Reserved. ·临床研究规范· REC 文件”对话框,选择刚刚建后软件会弹出“请选择 立好的 REC 文件后点击确定,打开 CHK 文件设置对话 框。如图 7 所示, CHK 文件设置的主要类别包括 Range, Legal (合法录入值)、 Jumps (跳转)、 Must enter (必须 录入)、 Repeat (重复)和 Value Label (变量值标签), 研究者根据需要,可以对数据库中的每一个变量进行不 同类别的设置。 图 7 EpiData 软件 CHK 文件建立示意图 “ Range, Legal ”主要是限定变量的数据录入合法值。 例如“ Range -15 15 ”表示允许录入 - 15 到 15 之间的数据; “ Range 2005/01/01 2005/12/31 ”表示允许录入的日期范 围;“ Range 1-5 ”表示允许录入 1 到 5 之间的数据;“ Range 1,2,9 ”表示允许录入 1 、 2 和 9 这 3 条数据。 “ Jumps ”表示跳转,因为有些调查问卷会有选择某 个选项后,跳转到规定的后续问题继续回答的情况,这 时候可以通过设置跳转来方便后续问卷的录入。须注意 的是,在设置跳转时应指定当前变量的某个可能录入的 数值与对应的跳转目标变量名对应起来。如图 6 中,可 以指定当问题 a2 为“ 2 女”时,跳转到问题 a6 。那么, 这时候在 a2 这个变量中,将 Jumps 设置“ 2 > a6 ”即可 实现。 “ Must enter ”为定义一些必须录入的变量。研究者 可以将数据库中所有核心的变量全部设置“ Must enter ” 为“ Yes ”,这样在数据录入时便不会遗漏。 “ Repeat ”命令表示指定一些变量的数量是可以重复 的,即完成第一份数据录入后,录入的内容会直接复制 到下一份数据该变量的位置,数据录入者不需要重新录 入内容,除非录入者需要更新录入的内容再进行修改。 由此,该命令加快了录入的速度,常常适合于字符型变 量大量重复出现的情况。 此外,最后一个也是最重要的一个设置就是唯一识 别变量“ key unique ”。上文也强调过,一份 EpiData 数 据库中务必要至少包含一个唯一识别变量。唯一识别变 量是数据库横向合并和双遍录入数据进行一致性核对时 的识别变量,同时也是对进行数据质量控制,避免重复 录入的关键控制点,具有不可或缺性 [2] 。如图 8 所示, 首先研究者须确定唯一识别变量( ID ),然后选择该变量 对应的 CHK 文件设置窗口,单击“编辑”按钮,打开“对 该字段的录入质控程序进行编辑”,将“ key unique ”录 入编辑窗口,点击“确定并关闭”即可。 完成上述所有对变量的设置后,保存 CHK 文件。 这时研究者事先建立的数据库文件夹中应该包括了 QES 、 REC 、 CHK 等 3 个文件,即是一个完整的数据库。随后, 研究者可对新建立的数据库进行测试,通过录入 5 ~ 10 份问卷来测试和发现可能存在的问题,并进行针对性的 修改完善。最后,把最终确定的数据库保存并备份备用。 (下转第 81 页) 76 Copyright©博看网. All Rights Reserved. 上海医药 2023 年 第 44 卷 第 13 期 ( 7 月上) ·医药论坛· 应用前景广阔,未来的监管科学研究需要监管方与申办 方、医疗机构、委托研究机构、患者等社会各界通力协作, 在生命科学基础研究发展的进程中齐头并进,在及时地 提供更具可操作性的工具、方法、标准的同时推进先进 治疗产品 FIH 的伦理审查不断完善,进一步提升患者和 社会的获益。 参考文献 [1] 中华人民共和国国家卫生健康委员会 . 关于印发涉及人 的生命科学和医学研究伦理审查办法的通知 [EB/OL]. (2023-02-18)[2023-04-08]. /zhengce/ zhengceku/2023-02/28/content_. [2] Abou-El-Enein M, Hey SP. Cell and gene therapy trials: are we facing an ‘evidence crisis’? [J]. EClinicalMedicine, 2019, 7: 13-14. [3] Emanuel EJ, Wendler D, Grady C. What makes clinical research ethical[J]. JAMA, 2000, 283(20): 2701-2711. [4] Chapman AR. Addressing the ethical challenges of first in- human trials[J]. J Clinic Res Bioeth, 2011, 2: 4. [5] Dresser R. First-in-human trial participants: not a vulnerable population, but vulnerable nonetheless[J]. J Law Med Ethics, 2009, 37(1): 38-50. [6] Hodge JG Jr. Ethical issues concerning genetic testing and screening in public health[J]. Am J Med Genet C Semin Med Genet, 2004, 125C(1): 66-70. [7] 国家药品监督管理局药品审评中心 . 国家药监局药审中 心关于发布《单臂临床试验用于支持抗肿瘤药上市申 请的适用性技术指导原则》的通告( 2023 年第 13 号) [EB/OL]. (2023-03-14)[2023-04-08]. . cn/main/news/viewInfoCommon/9f0c25dee6ba6781af809 b36cf682eb6. [8] 王瑞平 . 临床研究中混杂偏倚的识别和控制策略 [J]. 上海 医药 , 2022, 43(15): 30-34. [9] 中华人民共和国科学技术部科技监督与诚信建设司 . 关于 公开征求对《科技伦理审查办法(试行)》意见的公告 [EB/ OL]. (2023-04-04)[2023-04-08]. / wsdc/202304/t20230404_. [10] Salari P, Larijani B. Ethical issues surrounding personalized medicine: a literature review[J]. Acta Med Iran, 2017, 55(3): 209-217. [11] de Melo-Martín I, Hellmers N, Henchcliffe C . First-in-human cell transplant trials in Parkinson’s disease: the need for an improved informed consent process[J]. Parkinsonism Relat Disord, 2015, 21(8): 829-832. [12] Henderson GE, Davis AM, King NM, et al. Uncertain benefit: investigators’ views and communications in early phase gene transfer trials[J]. Mol Ther, 2004, 10(2): 225-231. [13] 许卫卫 , 吉萍 , 王涛 . 首例 TCR-T 细胞治疗晚期胰腺癌的 伦理审查实践 [J]. 中国医学伦理学 , 2022, 35(8): 865-869. 2023-04-14 )(收稿日期: (上接第 76 页) 图 8 EpiData 软件 CHK 文件中唯一识别变量的设置 参考文献 [1] 方积乾 . 卫生统计学 [M]. 6 版 . 北京 : 人民卫生出版社 , 2008. [2] 王瑞平 , 李斌 . 临床研究理论规范和实践 [M]. 上海 : 上海 科学技术出版社 , 2023. 2023-04-03 )(收稿日期: 上海医药 2023 年 第 44 卷 第 13 期 ( 7 月上) 81 Copyright©博看网. All Rights Reserved.
版权声明:本文标题:应用EpiData软件创建临床研究电子数据库 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1711030400a584937.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论