基于CiteSpace的中医传承研究可视化分析*

2019-04-20 02:28张二力董宇翔黎明全黄静波杨雪芹
世界科学技术-中医药现代化 2019年12期
关键词:老中医数据挖掘图谱

张二力,董宇翔,黎明全,黄静波,谢 天,杨雪芹**

(1. 吉林大学第一医院中医科 长春 130000;2. 长春中医药大学第三附属医院脑病科 长春 130000)

中医传承研究是名老中医学术思想和知识精华薪火相传的重要手段,是继承、发展、创新中医的重要举措。自2001年开始,国家科技部在“十五”国家科技攻关计划、“十一五”、“十二五”国家科技支撑计划、国家重点基础研究计划(973 计划)等国家重大科技计划中, 先后设立了多项名老中医学术经验传承研究项目[1],使中医传承领域研究逐渐升温。近年来,随着计算机技术、现代统计学发展以及大数据时代的到来,通过数据挖掘技术进行中医药传承已成为中医药领域中的热点。围绕名医个人[2,3]、文献[4]、医案[5]、症候[6]、疾病及方药[7]的数据挖掘类文章层出不穷,但是很少有研究从宏观角度上探讨该领域的发展现状和未来趋势,中医传承领域呈现“一斑”遍地而不见“全豹”的境况。

CiteSpace 是Citation Space 的简称,可译为“引文空间”。它是一款多元、分时、动态的引文可视化分析软件[8],最早应用于信息科学、情报、图书、教育,晚近渗入医学领域。胡佳卉等[9]运用CiteSpace 对中药治疗2 型糖尿病情况进行分析,发现目前采用中西医结合方法治疗糖尿病及其并发症是临床的主要发展趋势;邓晴等[10]以知识图谱形式呈现《伤寒论》六经辨证的研究概况,展示了伤寒论六经病的研究焦点以及近年来伤寒研究由基础理论向临床实证转移的历史变迁。然而,目前多数可视化研究主要着眼于某一病症或某一科研方向,中医传承领域全貌的可视化研究迄今罕见报道。本研究利用CiteSpace5.2对2004 年以来的中医传承类文献进行深入挖掘,做可视化分析,把握研究团队、研究机构的分布,探究研究热点,预测未来趋势,将中医传承领域的全景概况以知识图谱形式清晰客观地展现给读者,以期为中医传承事业发展提供有益参考。

图1 2004年1月-2018年8月来源于CNKI、主题词为“中医传承”的论文数量

1 研究方法及过程

本研究对中医传承研究进行如下分析:首先做核心作者及作者间合作分析,然后进行核心研究机构分析,接着进行研究热点分析,最后做突变词统计。

1.1 研究工具

CiteSpace 是由美国德雷塞尔大学陈超美教授研发的一款引文信息可视化分析软件,该软件基于科学计量学、数据可视化背景发展而来,用于挖掘分析某一学科领域隐性知识,并通过可视化手段来呈现该学科知识结构、规律和分布情况,得到的可视化图形也称为“科学知识图谱”[11-12]。知识图谱研究构建于词频分析、共现分析、聚类分析等文献统计原理之上,利用可视化分析工具如CiteSpace、TDA 等对本学科的国内外文献数据进行分析,通过绘制各类型知识图谱,能够清晰直观、实时动态地全面掌握该学科领域的研究进展和研究热点[10]。

1.2 数据来源

本研究数据来源于中文期刊全文数据库(CNKI)。设定检索主题词为“中医传承”,资源类型为“期刊论文”,进行检索,共有1070 条结果。逐一筛查,去掉会讯等无关内容,去除重复文献,最后得到论文803 篇。文献时间跨度为2004-2018 年8 月20 日,共15 年。每条文献数据包括题目、作者、期刊名、关键词、文章摘要和文章来源,选择Refworks 形式从CNKI 中导出文献,以download_xxx.txt 格式保存。经过格式转换后,变成CiteSpace5.2能够识别的格式。

1.3 参数设置

时间分区(Time Slicing)的时间跨度为2004-2018年,1 年一切割,分成15 个时段处理。术语来源(Term Source)勾选:标题(Title)、摘要(Abstract)、作者关键词(Author Keywords)和关键词(Keywords Plus);节点类型(Node Types)依 次 选 择:作 者(Author)、机 构(Institution)和关键词(Keyword),这样分别获得作者、机构和关键词的可视化图谱;节点强度(Strength)默认余弦函数(Cosine)和时间切片内(Within slices),阈值(Thresholding)选择TOP50;网络裁剪功能区(Pruning)参数选择路径探测(Pathfinder)和修建切片网络(Pruning sliced networks)。可视化方式(Visualization)选择静态聚类(Cluster view-Static)和合并网络(Show Merged Network)。

在生成的图谱中,N 为节点数,E 为网络中的连线数,网络密度(density)表示节点之间的联系强度。节点的圆圈代表相应的作者/机构/关键词频次,直径越大说明频次越高;节点的圆圈层代表年轮,颜色从蓝色冷色调向红色暖色调变化,表示时间由远及近;圆环的宽度表示不同年份内节点内容出现的频次;节点连线代表共现频次,连线越粗说明关系越密切。

2 结果与讨论

2.1 文献的时间分布情况

发文数量的时间变化是衡量某一领域发展状况的重要指标,以年份为横坐标,以年度发文量为纵坐标,可以看到中医传承研究领域发文量呈现逐年递增趋势。2004-2018 年共发文803篇,其中2004-2007 年处于起始期,年均发文1-2 篇。2008-2010 年起缓慢增长,共发文40篇,年均发文10余篇。从2011年开始到2018 年(数据收集截止到2018 年8 月,2018 年数据不完全)呈显著增长,共发文758 篇,年均发文量百余篇,尤其是近四年来增长速度加快,表明该领域的研究受到越来越多的重视(见图1)。上述变化与国家采取科研立项专题研究的形式开展中医传承工作密切相关。自2005 年起,科技部973 计划“中医理论基础研究专项”先后设立了“中医基础理论的整理与创新研究”、“中医病因病机理论的基础与创新的研究”等项目[1]。“十五”国家科技攻关计划设立“名老中医学术思想、经验传承研究”课题对名老中医经验进行抢救性继承,“十一五”、“十二五"国家科技支撑计划“名老中医临床经验、学术思想传承研究”项目对名老中医经验进行进一步深入拓展研究,扩大传承范围、巩固传承效果。上述立项极大刺激了中医传承领域的科研热情,显著提升了科研产出,近10 年来中医传承类文章的显著增长正是国家实施科研传承政策结出的硕果。

图2 发文量4篇以上的研究者共现知识图谱

2.2 核心研究者及其合作

作者共现分析能够识别一个学科领域中的核心作者群和他们之间的合作密切程度。选取发文量≥4的作者绘制知识图谱。作者节点数是270,连线数是530,网络密度是:0.0146。合作关系结构总体上比较松散。图2及表1显示了发文量4篇以上的研究者。

图2为中医传承研究领域作者共现知识图谱。从图中可以了解该领域的核心作者和主要研究团队。发文数量较多的作者有唐仕欢、韩涛、吴嘉瑞、杨洪军、黄海量、季旭明、张冰等。核心研究团队主要有以唐仕欢为核心的团队,包括申丹、杨洪军、李健、卢朋等,这个团队汇集了中国科学院自动化研究所、中国中医科学院中药研究所和北京中医药大学等科研力量,体现了跨学科合作研究的特点。该团队将一般统计法、文本挖掘、复杂系统熵聚类等挖掘方法加以集成,成功开发并升级了中医传承辅助系统(Traditional Chinese medicine inheritance system,TCMISS)用于疾病方剂用药分析和医案数据挖掘等[13]。据统计,目前全国已有近百家单位应用该软件进行科研工作,发表论文近千篇,该软件已成为名家经验传承、中药产品研发、中医论文发表的一款科研利器。黄海量团队[14](包括吕征、韩涛等)以及赵艳青团队[15](包括滕晶等),主要是利用中医传承辅助系统进行中医组方规律的研究。以吴嘉瑞为核心的团队[16],包括张冰、杨冰、陈丹等,主要开展国医大师颜正华用药规律及临床经验研究。还有徐春波、李振吉、贺兴东等组成的合作团队[1],主要研究国家传承大政方针、中医传承模式与应用方法。总体而言,科研团队并不多,且团队规模不大,成员组成不够稳定。已有团队的论文发表基本上是围绕中医传承辅助系统的开发和实践展开的。

图3 中医传承研究的主要科研机构

表1 发文量4篇以上的研究者

2.3 核心科研机构分析

本研究统计了作者所在机构,分析从事中医传承研究的主要机构情况,取发文频次≥12 的单位,得到科研机构知识图谱。从图3 可以看出,中医传承研究领域的核心研究机构主要包括:山东中医药大学、北京中医药大学、天津中医药大学、中国中医科学院中药研究所、山东中医药大学附属医院等。其中中心度大于0.1 的机构有山东中医药大学、北京中医药大学、中国中医科学院中药研究所、中国中医科学院广安门医院,这些机构均具有较强的影响力和关注度,见表2。

2.4 中医传承研究领域热点分析

研究热点是指在某一研究领域中、某段时间内特别受到关注的焦点问题。研究热点体现了研究发展进程中的重大事件。关键词是对研究内容的高度概括和凝炼,如果关键词出现频率较高,说明该高频词(关键词)所代表的研究内容得到的关注较多[17]。因此,高频词可以反映研究领域中的热点。

表2 发文频次≥12的科研机构

图4 中医传承研究中出现的高频词(关键词)

运行CiteSpace 软件,取出现频次≥9,生成2004-2018年中医传承研究关键词共现知识图谱(图4)。节点数有167 个,连线504 条,密度是0.0364。图谱中最显著的10 个关键词包括“中医传承辅助系统”、“中医传承辅助平台”、“用药规律”、“组方规律”、“数据挖掘”、“中医传承”、“名老中医”、“关联规则”、“传承”和“中医”。其中有些高频关键词同时也具有较高的中心度,这样的关键词是研究热点中的“热点”,包括“数据挖掘“、“中医传承”、“名老中医”、“中医传承辅助系统/平台”等。可以把它们进一步归纳为四小类:中医传承辅助系统/平台、中医数据统计方法、用药/组方规律和名老中医学术传承。这4个小类构成中医传承领域的研究热点问题,体现了该领域知识网络的主要路径。

2.5 中医传承研究的内容分析

本研究对关键词进行了聚类分析,来判断中医传承研究领域的主要研究内容。阈值设定为25,发现7个聚类,见图5。

这7 个聚类分别是“传承”、“组方规律”、“用药规律”、“关联规则”“用药经验”、“复杂系统熵聚类”和“中医医院”。经查看各聚类的具体内容,把研究内容归纳为如下四个方面:①中医传承的知识来源:包括名老中医医案和中医典籍,如《中医方剂大词典》;②中医传承的手段:近期主要是通过中医传承辅助系统/平台进行,或是通过SPSS 等统计软件进行数据挖掘,以及传统的师徒模式;③中医传承研究的热点内容:包括用药/组方规律、症候规范化研究,名医经验、中医技法(如针灸、穴位贴敷)和传承模式的研究;④中医传承研究的主要病种:包括不寐、痞病、胸痹、咳嗽、痹症、慢性萎缩性胃炎、胃痛、溃疡性结肠炎、肿瘤、月经病、顽癣等。

表3 中医传承研究中出现的高频词(关键词)

2.6 中医传承研究的前沿趋势分析

CiteSpace 提供了突变词探测功能,通过探测在某一段时间内,被引用频次或共现频次突现度增加的节点来预测该领域的研究方向。图6是突变强度位列前12的关键词。

根据突变词词频的时间分布,可以描绘出15年来中医传承研究热点及趋势转向的图景,提供该领域发展演进的脉络。图6 显示,2004-2010 年,以突变起始时间为序,“中医教育”、“中医传承”、“传承”、“名老中医”和“传承模式”是陆续出现的高强度突变词,说明中医传承成已成为这一时间段的研究主题。但此期间发表的相关论文并不多。虽然国家一直重视中医教育及中医传承工作,但中医的继承和发展模式一直处于探索当中,突变词“传承模式”也恰恰证明了这一点。一般认为,名老中医学术经验传承模式包括师徒型传承、院校型传承和科研型传承等[18]。传统的“师带徒”模式主要存在于中医世家及民间,其特点是实践能力强而科研意识薄弱,同时由于流派观念及处方技术保密等做法,其临床经验很难见诸于文章;而院校型传承(包括本科生及研究生教育)一般以基础理论学习为主,即便是研究生也很难做到在短短3-4 年内将导师经验充分领悟并发扬光大。因此无论是师徒型传承、还是以往院校型传承模式都存在科研动能不足的问题,在相当长的一段时间内,同日新月异发展的西医对比,中医界存在学术乏力、成果寥寥、后继无人的尴尬局面。如前文所述,直到国家采取科研型传承以及名医师承新模式,这种情况才有所改观。然而,在2010年以前,受限于当时的计算机技术、统计学水平等原因,大规模、深层次的数据挖掘难以实现,此阶段的传承研究大多是跟师心得笔记、名医经验、医案报道等。在传承的大背景下,研究手段单一,研究内容以定性访谈居多、临床数据单薄,缺少系统性和连贯性是此阶段特点。

图5 中医传承研究关键词的聚类分析图谱

图6 突变强度位列前12的突变词

2008年10月由卫生部、国家中医药管理局等有关部门发起了首届“国医大师”以及国家级名老中医评选工作,此举极大振奋了中医界的行业热情。各地方也开展省级名医评选,纷纷成立名医工作室,并陆续聘请各批次国家级、省级名老中医专家成为学术经验指导老师,系统地开展中医传承工作,跟师学员发表了大量的学位论文和期刊论文,促使师承领域研究迅速升温。与此对应,2011-2016年,以突变起始时间为序,“中医传承辅助系统(v11)”、“颜正华(首批国医大师)”、“师承教育”、“中医方剂大辞典”、“方剂”和“组方用药规律”是先后出现的高强度突变词。这些突变词表明,中医传承由宏观概念向具体微观实施转变。突出表现为传承工具现代化,代表案例是基于现代统计方法和数据库基础上的“中医传承辅助系统v11/20”的开发和推广。该软件经北京、上海、天津、山东等地中医院校及名老中医工作室应用,得到广泛认可。借此工具进行数据挖掘,发表了多篇传承论文。内容涉及单味药应用、组方用药规律、新药开发、症候归纳、中医典籍如“中医方剂大词典”中方剂使用以及名医如“颜正华”等学术经验总结继承等,传承研究的深度和范围得到极大扩展。与前一阶段相比,此阶段研究工具更先进,研究内容更加丰富、细化、数据化,研究成果更具客观性和可信性,中医传承研究工作更系统和完善。

3 问题与展望

本文对2004-2018年中医传承领域的研究论文进行了可视化分析。受益于国家的中医药扶植政策以及计算机、统计学技术的发展,中医传承研究工作在近10年间得到迅速发展,以唐仕欢为代表的科研团队和以山东中医药大学为首的科研院校为中医传承做出一定贡献。中医传承辅助系统软件的开发应用极大方便和扩展了传承的内容和深度,显著提升了科研产出。近日,王波等[19]利用中医传承辅助平台并结合网络药理学方法,从分子水平探讨中药的物质基础、代谢通路和作用靶点,增加了复方中药治疗效果的循证依据,为发表国际认可的高质量学术论文提供了思路和启迪,也使中医传承领域成果走向国际成为可能,这也说明中医传承研究正在由数量向质量转变。展望未来,人工智能的迅猛发展必将成为引领中医学发展的新工具[20],智能化的舌诊、脉诊仪甚至专家诊断系统的问世以及互联网的普及,将有助于进一步提高名老中医学术经验的推广和传承效率。在大数据时代,如何有效地运用数据分析方法从海量医学数据以及长篇累牍的文字中迅速捕获关键信息,实现知识的快速发现、传播和未来决策,采用CiteSpace 等可视化软件辅助研究无疑是一条捷径。可视化、智能化、虚拟现实等也必将成为中医传承软件发展的趋势。可以预计,在当前以及今后的一段时间内,对中医传承实践方法的不断探索和基于人工智能的数据挖掘技术的开发、传承软件升级将是该领域的研究前沿和研究者持续关注的焦点。同时也应注意,传承领域目前还存在一些问题。对研究热点的追捧不可避免的导致学术投机,诸多利用中医传承软件发表的论文存在内容重复、方法雷同甚至粗制滥造现象。重数据、轻分析是传承论文普遍存在的问题,有些挖掘结果与临床实践不符合,但缺少合理解释。有些传承人中医功底薄弱,对数据分析浅尝即止,无法反映出名老中医的思辨过程和学术精髓,其结果无法推广和继承。理、法、方、药是中医临证四要素,传承软件的优势在于分析方和药、强于计算数量和总结规律;但对于理、法,即反映名老中医的辩证过程、思维模式、临床视角以及其他人文关怀、医德修养、成长轨迹等定性方面,计算机尚嫌不足,而这些恰是传统师徒模式所具有的优势。因此,中医传承研究应本着定量与定性并重,数据与人文结合的方式进行。虽然数据挖掘和新兴统计方法为传承工作创造了便利,但传统的跟师学习、日积月累的知识积淀和揣摩领悟仍然是成为名医不可取代的过程。

猜你喜欢
老中医数据挖掘图谱
探讨人工智能与数据挖掘发展趋势
绘一张成长图谱
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
老中医教你睡眠养生
老中医坐诊
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
老中医
周来兴老中医治疗疑难杂症的思路与经验
高级数据挖掘与应用国际学术会议