以《医方类聚·消渴门》为例探讨知识元标引在方证和药证规律研究中的应用

2022-07-13 03:50赵倪娟戴娜罗涛王帅虎谭辉谢宇张丽莎郭锦晨陆翔
南京中医药大学学报 2022年7期
关键词:标引医方方剂

赵倪娟,戴娜,罗涛,王帅虎,谭辉,谢宇,张丽莎,郭锦晨,陆翔

(1.安徽中医药大学中医学院,安徽 合肥 230012;2.北京邮电大学信息与通信工程学院,北京 100876)

知识元是指语义上相对完整地表达特定知识的最小的内容单元,是能够被标记、存储、使用和管理的最小知识个体。知识元的研究多应用于图书情报以及计算机领域,现在随着网络信息技术的发展,亦逐渐向多领域扩展。在中医学领域,主要应用于中医古籍数字化的研究。

《医方类聚》系朝鲜金礼蒙等人所编的中医类综合性方书。该书成书于公元1445年,仿王焘《外台秘要》类书体例,选录明朝中期之前医籍及一些道教、佛教典籍中涉及医药方面的文献,共150余种。按照病证分列92门,共计266卷(现存世262卷),收录方剂5万余首。《医方类聚·消渴门》中引录的中国医籍尤为丰富,涉及历代方书47种,堪称集历代医方之大成。该门所录的医籍有些已经亡佚,因此该书具有重要的文献研究价值,除了能为研究明代中期之前中医药治疗消渴的理论与经验提供研究资料外,还能为现代中医诊疗消渴提供参考。

本文选取《医方类聚·消渴门》中的方药内容,依据知识元标引理论,通过对选取的文献进行数字化解析与标引加工,形成知识体和知识元间的层级知识图谱,通过挖掘《医方类聚·消渴门》中的方证和药证规律,探寻知识元标引在中医古籍数字化中的应用思路和方法。

1 研究资料

本研究所选用的《医方类聚》为人民卫生出版社1982年校点本。将《医方类聚·消渴门》的文献进行文本规范化处理,上传已校勘的电子文本至中医古籍“病脉证并治”知识元标引系统(以下简称“标引系统”),并按照纸质版篇章进行书体结构目录划分。“标引系统”是国家重点研发计划“中医药现代化研究”项目“基于知识元理论与临床需求深度融合的中医古籍整理及专题文献研究”在知识元理论的基础上建立的中医古籍加工平台。该系统的标引方法融合了框架表示与语义网表示两种知识表示方法,即基于现有研究基础或学界普遍认可的理论范式,预定义模板,确定标引主体,再将研究对象所涉及的语料知识元填充到预定义模板中,形成基于某一理论范式的语义网络,以此提高传统中医古籍的整理效率。

2 方法

2.1 知识元标引规范化处理

“标引系统”包括书体结构、标引模板、知识体、知识元、语义成分、语义类型、语义关联类型、知识体关联类型等。标引员登录“标引系统”后,通过“病脉证并治”标引模板进行线上自由标引。逻辑数据的构建主要依托于“标引系统”的数据导出功能,通过将《医方类聚·消渴门》的方药数据导出并存储在MSSQLServer数据库中,再按照预先设定好的数据导出程序,将全部标引的逻辑数据语言读取保存并规范化处理。根据《中国药典》(2020版)[1]和《中药学》[2]及《2型糖尿病基本证候临床表现及术语规范》[3],统一规范药物名称,选取统一的证候标准,对“药物”“证候”知识元语义作规范化处理。逻辑数据的导出可直观化地对该书中与消渴理法方药相关的知识元、知识体、语义和语义关联进行统计分析。

2.2 构建知识元标引数据库

首先对知识体原文进行结构层次分析,然后在知识元模板内标注出相应的属性要素,再提取出各属性类型的语义成分,最后将该语义成分进行相互关联,建立知识元语义网络。

2.2.1 知识体标引 知识体是古籍原文中一段文字所描述的一个知识对象。依据这一概念,我们将《消渴门》中内容,按照医籍书目划分章节,其内容主要为消渴治法方药的论述,文末再设食治、禁忌、针灸以及导引疗法等。根据“方剂”“病证”和“本草”三大类标引模块,将《消渴门》中关于方药的内容在解读的基础上进行知识体标引。以《消渴门三·袖珍方》为例,全文分列了四首方剂的功用主治、方药组成以及制法用量,故将其分别标引为四个方剂知识体。如将其中“补肾地黄丸:降心火,益肾水,治消渴,降骨蒸……盐酒下。和剂石臼杵千下”整体标引为方剂知识体,并命名知识体为“补肾地黄丸”;将“止渴散:治霍乱烦渴……蜜汤下,不拘时候”标引为方剂知识体,并命名知识体为“止渴散”等,以此类推。

2.2.2 知识元标引 知识元标引是以知识元作为标引的基本单位,是对文献进行再次组织排列的重要标记,从而实现对知识的检索。以《消渴门一·千金方》中“猪肚丸”知识体为例,“猪肚一具(治如食法),黄连、梁米各五两,栝楼根、茯神各四两,知母三两,麦门冬二两”为组成知识元;“治消渴”为功用主治知识元;“上七味为末,内猪肚中缝塞,安甑中极烂蒸,乘热及药木臼中捣可丸,若硬与蜜和,丸如梧子大”为制法知识元;“饮服三十丸,日二,加至五十丸,随渴即服之”为用法知识元。

2.2.3 语义类型标引 语义是从知识元中抽取出的语义成分,是构成知识元的基本要素,是具有完备语义的词、词组或短语,属于知识元下一级层次。通过对知识元进行进一步分析所提取的语义,可以体现出针对性更强、内容更丰富的信息表达效果。以《消渴门二·得效方》中“天王补心丹”为例,将“天王补心丹”标引为方剂语义类型;将“宁心保神,益血固精,壮力强志……除惊悸,疗咽干口燥,育养心气”标引为功用主治语义类型;将“熟地黄”“人参”……“茯神”“当归”“五味子”分别标引为药物语义类型,将“去芦”“去皮”“去尾”“去枝梗”分别标引为炮制语义类型;将“每服一丸,灯心枣汤化下,食后临卧服。作梧子大丸吞服亦可”标引为用法语义类型,将“上为末,炼蜜丸,每一两作十丸,金箔为衣”标引为制法语义类型。

2.2.4 语义关联标引 语义关联是指由若干个语义成分所构成的某种特定类型的关系,是概念之间关系的抽象概括。在知识元标引系统中,对《医方类聚·消渴门》中所载的方剂进行语义标引,构建语义关联。针对古籍文献中无名方现象较为普遍的问题,我们通过方义,以“治某病证方”命名无名方,如“治消中方”“治肾虚消渴病方”“治消渴饮水腹胀方”等。在提取方证关联数据时,只取方证文献较全者,对于有方而无病名证候的文献,考虑到这种情况占比较低,故不纳入统计范畴。以《消渴门三·圣济总录》中“芦根汤”知识体为例,将该知识体全部标引后,共提取出22个语义。通过分析知识的内在联系,选择语义类型创建符合逻辑的语义关联,共创建10个语义关联,分别是8个“药制量关系”:如牡蛎(药物)—煅(炮制)—二两(剂量)、黄芪(药物)—剉(炮制)—二两(剂量)、……;1个“方药关系”:芦根汤(方剂)—芦根,黄耆,栝蒌根,牡蛎,知母,生麦门冬(药物);1个方证关系:芦根汤(方剂)—食后乘渴细服(用法)—消渴(病证)—烦躁不止,小便多,羸瘦(证候表现)。

方证语义关联是基于知识元标引系统中方和证两个知识元,通过方证语义关联下设方剂名称、证候表现、病证等内容标引加工,构建方剂和证候的消渴病证-方图谱模型,形成了一证对应多方、多证对应群方的聚类现象。

2.3 构建逻辑数据与知识图谱

《医方类聚·消渴门》方药知识图谱的构建,是在人工标引后,通过标引平台导出标引数据,并将相关数据导入Gephi软件,建立证候、方剂、中药等数据集,从而构建复杂网络知识图谱。网络中节点代表证候、方剂、中药,边代表节点之间联系。运用Network Splitter 3D和Fruchterman Reingold布局形式对复杂网络进行可视化展示。数据处理流程具体为:标引数据(XML)→json半格式化数据→三元组数据→构建为知识图谱[4](图1)。

图1 《医方类聚·消渴门》数据加工流程图Fig. 1 Flow chart of data processing in the Categorized collection of medical formulas: Emaciation-thirst disease

3 结果

3.1 标引逻辑数据统计

《医方类聚·消渴门》标引内容共涉及616个知识体、3 213个知识元、10 298个语义以及4 369个语义关联。共标引了3种知识体类型,其中病证类知识体92个,方剂类知识体521个,本草类知识体3个,合计标引616个知识体。

知识元类型共涉及35种,包括方名、用法、组成、制法、功用主治、方剂、病证名、宜忌、疗效、证候表现等,合计标引3 213个知识元;语义类型29种,包括药物、炮制、证候表现、剂量、用法、病证、制法、方剂、用量、疗效、病位和宜忌等,共计标引10 298个语义;语义关联类型19种。限于篇幅,本文仅讨论知识元标引在方证、药证规律研究中的应用。

3.2 方证知识图谱

在Network Splitter 3D布局形式中,依据各节点加权度的大小分为了三个等级,并分别设置对应节点Z值为3,2和1,获取对应的证候和方剂社团节点组合(图2),图中证候以及方剂节点由上而下展开,并以直线连接各节点,节点和线边的集合就形成了联系紧密的社团,而节点的大小表明了该节点在社团中的重要性。K-core是网络图中的一个节点社团组合的子图,其中每个节点的度至少为k,为了获得子图,需要反复删除度小于k的节点及其连线,直到系统中不再有度小于k的节点保留[5]。在Fruchterman Reingold布局形式的“主要证候-次要证候”平面知识图谱中(图3),运用拓扑结构中的K-core过滤筛选核心社团组合,当K-core≥10时,复杂网络消失。因此,将K-core=9设为筛选条件,获得消渴的核心证候社团组合(括号内的数字代表节点度)。当节点度≥60时,主要证候为口渴多饮(103)、小便频多(70)、咽干舌燥(66)、五心烦热(63);当节点度<60时为次要证候,包括形体消瘦(55)、心神烦躁(44)、小便白浊(36)、小便不利(28)、食欲不振(27)、多食善饥(21)、小便黄赤(21)等。

图2 “主要证候-次要证候-方剂”立体知识图谱Fig. 2 Three-dimensional knowledge mapping of "main syndromes-minor syndromes-formula"

图3 “主要证候-次要证候”平面知识图谱Fig. 3 Flat knowledge mapping of "main syndromes-minor syndromes"

方-证知识图谱呈现出一证对应多方、多证对应群方的聚类现象,即可以随机检索任意一个证候表现,便能辐射出诸多其他证候以及与之对应的治疗方剂。为进一步说明该类现象,参照知识元标引系统中节点度的大小,依据核心程度的不同,以该书中最核心的“口渴多饮”为例进行检索。“口渴多饮”在知识元标引系统以及知识图谱中呈现共计有149首方剂与之对应,说明这149首方剂的共同主治皆有“口渴多饮”这一证候表现。将“口渴多饮and心神烦燥”输入知识元标引系统,共检索出可以同时治疗“口渴多饮”“心神烦燥”的46首方剂:清心莲子饮、大麦汤、地骨皮饮、瓜蒌丸、黄连猪肚丸、枸杞子丸、青粱米饮方等,以此展现出“主证-兼证-方剂”的聚类关系。

3.3 核心药证知识图谱

证候-方药的知识图谱,是基于同一方剂知识体下的方证关系、方药关系语义关联进行构建。在《医方类聚·消渴门》消渴对应的证候节点分布特点基础上,进行证候-中药分析,同时设置K-core,筛选核心社团组合。上述的证候分析结果提示《医方类聚·消渴门》中消渴的主要证候为口渴多饮、咽干舌燥、五心烦热、小便频多,故以此类证候为例说明如下。

口渴多饮证候节点连线表示对应的中药社团组合(K-core=14):甘草(108)、天花粉(99)、人参(83)、麦冬(82)、黄连(80)、知母(70)、黄芪(67)、石膏(64)、茯苓(55)、葛根(49)、五味子(47)、枳壳(46)、牡蛎(45)、熟地黄(45)、赤茯苓(44)、大黄(42)、苦参(42)、泽泻(42)、黄芩(41)、生地黄(40)等(图4)。

图4 口渴多饮证候对应的中药社团组合Fig. 4 Combination of Chinese medicine associations corresponding to the syndrome of thirsty with strong desire to drink

咽干舌燥证候节点对应的中药社团组合(K-core=10):天花粉(81)、甘草(77)、黄连(69)、麦冬(65)、人参(60)、石膏(59)、知母(58)、茯苓(44)、黄芩(44)、黄芪(40)、升麻(36)、地骨皮(31)、生地黄(29)、乌梅(27)、熟地黄(26)、苦参(25)、牡蛎(25)、犀角(25)、泽泻(25)、栀子(25)等(图5)。

图5 咽干舌燥证候对应的中药社团组合Fig. 5 Combination of Chinese medicine associations corresponding to the syndrome of dry throat and tongue

五心烦热证候节点对应的中药社团组合(K-core=13):甘草(77)、天花粉(75)、麦冬(72)、黄连(60)、人参(58)、黄芪(56)、泽泻(53)、知母(52)、赤茯苓(43)、茯苓(43)、生地黄(43)、石膏(42)、黄芩(41)、犀角(38)、桑白皮(36)、栀子(35)、葛根(33)、大黄(32)、茯神(32)、枳壳(32)等(图6)。

图6 五心烦热证候对应的中药社团组合Fig. 6 Combination of Chinese medicine associations corresponding to the syndrome of feverish sensations in palms, soles and chest

小便频多证候节点对应的中药社团组合(K-core=14):天花粉(87)、甘草(85)、麦冬(84)、黄连(82)、人参(75)、茯苓(56)、知母(55)、泽泻(54)、生地黄(51)、黄芪(50)、熟地黄(46)、五味子(42)、当归(39)、石膏(39)、黄芩(35)、地骨皮(33)、桂枝(32)、牡蛎(32)、赤茯苓(30)、菟丝子(30)等(图7)。

图7 小便频多证候对应的中药社团组合Fig. 7 Combination of Chinese herbal medicine groups corresponding to the syndrome of frequent urination

4 讨论

4.1 方-证规律分析

《医方类聚·消渴门》中节点度较高的证候包括口渴多饮、小便频多、咽干舌燥、五心烦热、形体消瘦、心神烦躁、多食善饥等,这一描述基本符合现代糖尿病“三多一少”的特点。肺居胸中,主司呼吸,若受燥热所扰,则宣降失司,肺亦为水上之源,通调水道,肺病气机失常,则津液输布排泄异常,故小便频多。《医学纲目·消瘅门》云:“盖肺藏气……肺病则津液无气管摄,而精微者亦随溲下,故饮一溲二,而溲如膏油也。”[6]又肺清虚娇嫩,喜润恶燥,肺灼阴伤,则口渴多饮。脾胃为后天之本,主运化腐熟水谷,若伤于热邪,可见形体消瘦、多食善饥。因脾主运化水谷精微,在体合肉,脾失健运,气血亏虚,肌肉失养,《素问·痿论篇》:“脾气热,则胃干而渴,肌肉不仁”[7]87。胃主受纳腐熟水谷,胃火亢盛,则多食善饥,《灵枢·大惑论》言:“热气留于胃,胃热则消谷,谷消故善饥。”[8]《素问·六节藏象论》云:“肾者,主蛰,封藏之本”[7]20,相火内涵于肾,潜藏不漏,肾阴充足,涵养相火,则相火不亢。若肾阴亏损,相火妄动,则扰乱心神,见心神烦躁,又肾水不足,不能上济于心,则五心烦热,而肾经循于咽喉,虚火灼津,阴液不足,则咽干舌燥。

而以口渴多饮和心神烦燥两种证候为例检索的46首方剂中,清心莲子饮最具代表性,方中石莲子清心火而通肾水;麦冬、黄芩清心肺之火;茯苓、车前子、生甘草清心火,利小便,导心火从尿而外泄;地骨皮清虚热;人参、黄芪益气生血,补阳配阴,诸药共用,共奏清心火,交心肾,益气阴,止淋浊的功效。现代研究发现清心莲子饮加减治疗气阴两虚型糖尿病具有较好的疗效[9]。而剩余的大麦汤、地骨皮饮、黄连猪肚丸等方,均含有清热益气滋阴的中药,具有清虚热、止烦渴的功效。

4.2 药-证规律分析

通过对《医方类聚·消渴门》的核心中药社团进行筛选,获得口渴多饮、咽干舌燥、五心烦热、小便频多对应的核心药组节点度高的为天花粉、甘草、麦冬、黄连、人参、知母、黄芪和石膏。天花粉甘苦、微寒,具有清热、生津、止渴之功,可用于热病烦渴、内热消渴等症,为治消渴之要药,无论是物质基础还是作用机制研究均表明天花粉在治疗消渴中具有重要的地位[10]。麦冬味甘苦、性微寒,养阴生津,润肺清心,可用于内热等症,具有保护心血管系统、降血糖等药理学作用[11]。黄连味苦性寒,有清热燥湿、泻火解毒之功,其所含的黄连素具有良好的降糖效果,可通过多条途径发挥抗糖尿病作用[12]。黄芪味甘,具有健脾益气的功效,其主要活性成分黄芪多糖可改善糖脂代谢紊乱,并且对胰腺有保护作用[13]。而人参、知母、石膏和甘草,正是白虎加人参汤的主要中药,此方能够清热益气、生津止渴,现代研究发现其能通过改善肠道屏障功能,从而改善胰岛素抵抗,降低血糖水平[14]。因此,这些中药可作为临床治疗消渴的常用药。

5 总结

本研究基于知识元理论对《医方类聚·消渴门》进行语义关联标引,深度挖掘《医方类聚·消渴门》方-证-药之间的逻辑关系与隐性知识,并通过逻辑数据分析、知识图谱等方法,探寻方证和药证的内在联系。基于知识元标引的知识图谱分析能层次分明的展示方-证-药之间的关联,并且各语义节点在对应的社团组合中的核心程度也一目了然,能直观地发现核心证候与治疗所用方药之间的关系,对中医古籍的数字化具有重要的应用价值。在未来的工作中,还可以考虑在模型构建以及分析过程中加入“病因病机”“治则治法”等与方药语义之间的关联度,实现辨证论治的综合考量,从而为临床上治疗消渴病提供新的诊治思路,也为今后中医药古籍的数字化和文献知识挖掘提供有益借鉴。

猜你喜欢
标引医方方剂
蒙医药清瘟杀黏类方剂组方的知识发现研究
中医古籍医案知识元标引方法的思考及对策
基于信任模型的中医药方剂相似度计算方法
作者书写关键词须知
中药方剂,新冠肺炎患者的福音
何谓中医“七方”
良医拒传方
良医拒传方
良医拒传方
黑水城出土西夏文古医方“天雄散”考述