一种结构化电子病历的相似性查重方法*

2019-01-17 05:04王兴强
中国医学装备 2019年1期
关键词:拷贝相似性病历

王兴强 孟 娜*

病历相似性查重是医院病历文书质量控制的一项重要内容,是提高病历文书质量,有效防止临床医生违规拷贝病历的重要手段。随着医疗信息化技术的发展,结构化电子病历系统得到广泛的应用与开发[1-3]。结构化电子病历的应用提高了病历文书质量,有利于区域范围内患者医疗信息的发布与共享,以及医疗机构之间互联互通和协同[4-5]。结构化电子病历的相似性查重是病历文书质量控制的重要手段,单纯的文本比对方式已不适用于结构化电子病历的相似性查重。基于此,提出一种结构化电子病历的相似性查重方法,协助病历文书质量控制人员查找违规拷贝病历。

1 结构化电子病历规范

结构化电子病历是指从医学信息学角度,将以自然语言方式录入的医疗文书按照医学术语要求进行结构化分析,并将这些语义结构最终以关系型(面向对象)结构的方式保存到数据库中[6-8]。《电子病历基本架构与数据标准》[9]中明确了电子病历从临床文档到数据元的层次结构关系。电子病历数据结构共分为临床文档、文档段、数据组和数据元4层。

(1)临床文档。患者病历由一系列的病例文档组成,包括入院记录、首次病程记录、手术记录、出院小结等,每种病历文档都有与之对应的病历模板,有全院通用病历模板和专科病历模板。电子病历系统中通过病历模板来创建患者病历文档。

(2)文档段。指病历文档中逻辑上的段,包含入院记录中的主诉、现病史、既往史、婚育史、体格检查及首次病程记录中的病历特点、诊断依据、鉴别诊断及诊疗计划等。

(3)数据组。文档段中具有临床语义完整性和可重用性的基本单元,由若干数据元构成,可以嵌套。

(4)数据元。数据元为电子病历数据结构中不可再分的数据单元,通过定义、标识、表示和允许值等一系列属性进行赋值。

2 结构化电子病历的违规拷贝

结构化电子病历可以通过病历模板快速生成病历文档,再通过结构化录入的方式书写[10-11]。由于病历模板结构化制作工作量大,有些医院在电子病历系统上线时,对模板制作要求不高,部分病例模板未使用结构化语言录入,造成了生成的病历文档“千篇一律”,出现雷同病历现象。还有部分医生,大量使用复制粘贴功能,出现违规拷贝病历现象。有的同一疾病的患者,主诉、发病过程及起病的原因和处理方式完全一样,甚至标点符号都一样,这种拷贝病历的方式从单份病历上不易发现,但把相同病种的病历进行比较就显而易见。

违规拷贝的病历失去了病历原有的价值,是对患者的不负责,可能会引起不必要的医疗纠纷,并承当相应的法律责任,违规拷贝病历危害很大,需加强相应电子病历质量控制。

3 结构化电子病历相似性查重方法

一种基于结构化电子病历的相似性查重方法,通过定义结构化电子病历的文档模版查重属性、文档段查重属性,采用最小相似比字符串匹配(knuth morris pratt,KMP)算法,实现相似病历查重,在患者的结构化电子病历的病历文书中查找临床医生违规拷贝的病历。

3.1 文档模版查重属性

文档模版查重属性是指结构化电子病历的文档模版类型的属性,是否支持相似性查重。常见的结构化电子病历的文档模板类型属性包括结构化、首页另起纸张、尾页允许续打、归档及可重复等。病历的文档模版类型是否支持相似性查重,决定病历相似性查重时是否检索该文档。

3.2 文档段查重属性

文档段查重属性是指电子病历的文档模版类型中文档段的属性,是否支持相似性查重。文档段是病历文档中逻辑上的段,文档段为构成该文档段的数据提供临床语境。支持相似性查重的文档模版类型中的文档段是否支持相似性查重,决定病历相似性查重时是否检索该文档段。

3.3 最小相似比KMP算法

最小相似比KMP算法,是指在KMP算法基础上增加最小相似比系数C,当匹配目标字符串超过1-C比例时,退出匹配。KMP算法是字符串比较常用的算法[12-15]。

最小相似比KMP算法与KMP算法相比,运行效率显著提高,最小相似比KMP算法步骤如下:①在目标串S和模式串T中分别设比较的起始下标i和j,初始化最小相似比系数C,C的取值范围为0到1;②计算目标串S和模式串T的长度LS和LT;③采用KMP算法计算模式串T的前缀数组next[j];④如果目标串S未比较完i<LS或模式串T未比较完j<LT,跳到步骤⑤,否则跳到步骤⑨;⑤如果S[i]=T[j],跳到步骤⑥,否则跳到步骤⑦;⑥目标串S和模式串T的比较下标都下移一位,即i加1,j加1,跳回到步骤④;⑦如果目标串S未比较部分小于最小相似长度,LS-i<LS*C,跳到步骤⑨,否则跳到步骤⑧;⑧模式串T的比较下标j跳至next[j],即j=next[j],跳回到步骤④;⑨结束。

3.4 病历相似性查重方法

设置结构化电子病历的文档模版查重属性以及文档段查重属性,读取支持相似性查重的文档模板中支持相似性查重的文档段,并去除结构化绑定对象部分,加载到对比对象列表中,采用最小相似比KMP算法进行查重计算,步骤如下:①开始;②检索患者结构化电子病历的文件列表,包括入院记录、病程记录、手术记录及出院小结等全部文档类型的病历文档;③逐条读取病历文件列表,如果读取完毕跳到步骤⑩;④判断病历文件的文档模版查重属性,如果支持相似性查重,跳到步骤⑤,否则跳回到步骤③;⑤检索文档模版类型的文档段列表;⑥逐条读取文档段列表,如果读取完毕跳回到步骤③;⑦判断文档段查重属性,如果支持相似性查重,跳到步骤⑧,否则跳回到步骤⑥;⑧检索文档段中的结构化绑定对象;⑨加载病历文件的相应文档段的文本至待查重对象列表,并去除结构化绑定对象的部分,跳回到步骤⑥;⑩采用最小相似比KMP算法,对待查重对象列表中的文本,进行相似性查重后结束。

4 结构化电子病历相似性查重优势

结构化电子病历的文档模版查重方法能够从结构化电子病历文档中查找到内容重复的病历,可进行违规拷贝病历查找;将该方法嵌入到结构化电子病历质量控制系统中,能够实现病历相似性查重,成为终末病历质量控制的重要手段之一,杜绝临床医生违规拷贝病历的情况发生,可为病历质量控制工作人员提供有效的监测手段。结构化电子病历的相似性查重已累计查重病历3500余份,发现违规拷贝病历173份,并及时反馈召回。

5 结语

基于结构化电子病历的相似性查重方法,设置结构化电子病历的文档模版及文档段的查重属性,去除结构化绑定对象的内容,采用最小相似比KMP算法,进行病历文书相似性查重,协助病历文书质量控制人员查找违规拷贝病历情况,有效提高病历质量控制水平。

猜你喜欢
拷贝相似性病历
一类上三角算子矩阵的相似性与酉相似性
强迫症病历簿
“大数的认识”的诊断病历
浅析当代中西方绘画的相似性
“病例”和“病历”
唐氏综合征是因为“拷贝”走样了
文化拷贝应该如何“拷”
文化拷贝应该如何“拷”
基于隐喻相似性研究[血]的惯用句
临床表现为心悸的预激综合征B型心电图1例