基于CiteSpace的中医体质辨识研究可视化计量分析*

2021-09-08 15:05钟慧慧王东军程嘉骏王益民王泓午
世界科学技术-中医药现代化 2021年6期
关键词:发文图谱聚类

钟慧慧,王东军,程嘉骏,王益民,王泓午

(1.天津中医药大学研究生院 天津301617;2.陕西中医药大学第一临床医学院 咸阳712000;3.天津中医药大学组织部 天津301617;4.天津中医药大学健康科学与工程学院 天津301617)

体质是人体在生命活动的外在表现,它与健康与否有着密切的联系,中医学自古以来都十分重视体质,表现在生理病理、养生保健方面的差异性[1]。中医体质学说兴起于上世纪70年代,以王琦教授为首的一批学者开始了中医体质方面的研究,1982年《中医体质学说》的问世,标志着中医体质学说的成立[1,2],体质辨识是在《中医体质分类判定标准》的基础上结合《中医9种基本体质分类量表》而形成的[3]。《“健康中国2030”规划纲要》提出预防为主,早诊断、早治疗[4];在健康中国的理念促进下,医学从注重治疗疾病朝着重视预防疾病的方向发展[5],在此背景下中医健康状态辨识得到广泛关注,中医在健康辨识方面有其独到的认识,如中医基础理论中提到的“阴平阳秘,精神乃治”“正气存内,邪不可干”、“形神合一”、“平人”等[5,6]。体质辨识作为健康状态辨识的一种重要方法,通过中医体质辨识可以在疾病防治和健康保障方面开创全新的局面。目前中医体质辨识已被应用于疾病的筛选、预防、治疗以及康复等多个领域,如高血压前期、糖尿病前期等多种慢性疾病的防治,以及肿瘤疾病、老年病的治疗与康复[7-10]。

CiteSpace是基于JAVA编程程序的一款科学知识图谱软件,由德雷克赛尔大学的陈超美教授开发,是基于科学计量学和数据和信息可视化的基础上,通过对某一研究领域的文献计量并绘制知识图谱,探寻并展现该领域的信息全景、演化的关键路径及其知识拐点,用于分析该学科知识领域的演化动力、研究现状、学科发展前沿[11-13]。本文应用CiteSpace5.6软件对中国自建库至2020年6月29日的中医体质辨识相关研究的文献绘制知识图谱,由于CNKI数据库所导出的文献信息与CiteSpace软件有不相契合之处,因此本文以发文作者、机构、关键词为切入点,对该领域的研究现状、研究热点及发展趋势进行系统梳理,为后续研究提供借鉴[14]。

1 资料与方法

1.1 资料

文献来源于中国知网数据库的期刊,以:主题=中医体质辨识,检索年限为建库—2020年6月29日,进行精确检索,排除会议论文、新闻报道、通告及重复发表的文献外共得到1099条符合条件的数据,以refworks格式将检索到的数据导出,保存名称为“download-**.txt”。

1.2 方法

将导出的数据在CiteSpace软件内进行数据转化,以符合CiteSpace处理要求,时间参数设置跨度为2007年—2020年,时间切片(Time Slicing)为1年,节点类型分别选取作者(Author)、机构(Institution)、关键词(Keyword),演算时阈值TOP(Top N per slice)=50,对作者、机构不进行裁剪。探索中医体质辨识领域研究发展的特点及规律。分别以作者、机构和关键词为研究目标进行知识图谱可视化分析。

2 结果与分析

2.1 年发文量分析

年发文量是衡量该领域发展状况的重要指标,采用2007年1月1日—2020年6月29日的数据,以每年发文量为对象,以年份为横轴,年发文量为纵轴对近13年中医体质辨识研究进行计量统计,对纳入的1099篇文献按其发表的时间统计(图1),发文量整体呈上升趋势,特别是2014-2016年发文数量快速增长,在2017年稍有回落,之后发文量继续增长。

图1 文献量变化趋势图

2.2 作者合作网络分析

以作者为网络节点,绘制作者合作的网络图谱,可以反映出国内中医工作者在体质辨识方面的发文数量及合作情况:①发文量排名前6的作者分别为王琦(23篇)、王济(15篇)、李玲孺(10篇)、周苏娟(10篇)、万生芳(9篇)、李英帅(9篇)(表1);②作者的节点数量N=427,各作者间的连线E=442,密度(Density=0.0049),由于中医体质辨识领域的学者之间的协作交流,在知识图谱中形成了几个作者协作团体网络结构,较为显著的是以王琦为首的网络结构与发文量较多的几位作者王济、李玲孺、李英帅等人形成这一网络结构,另有以周苏娟、万生芳、陈润东等人为首形成的网络结构显示其有固定的合作作者。图中显示几位高产作者合作较少,主要表现为学者王琦、王济、李玲孺、李英帅之间存在学术交流与联系,但与其它发文量较大的学者(如万生芳、周苏娟、陈润东、张彩等人)之间尚无合作;单独节点的学者较多(如:张彩、邹学敏、倪进军),以上表明我国学者在中医体质辨识的研究上沟通合作意识不足,学者们的学术交流与合作亟待加强(图2)。

图2 作者共现知识图谱

表1 发文量前20位的研究者

2.3 机构合作分析

选择机构为网络节点,绘制机构合作的网络图谱。反映国内2007年至今年各研究机构在中医体质辨识方面发表论文数量(表2)及合作情况(图3):①发文量前五名的机构为:上海中医药大学(16篇),北京中医药大学(15篇)、山东中医院大学(9篇)、广东药科大学公共卫生学院(9篇)、广东药科大学信息工程学院(9篇),这五所机构在我国中医体质辨识方面的研究中发文量较多,由此得出,这几所机构在体质辨识领域发展较好,走在我国前列、科研力量较强;②机构的节点数量N=295,各作者间的连线E=122,密度(Density=0.0028),连线数量及连线密度表示各机构节点之间的联系,连线数量越多、密度越大表示机构之间联系越密切,而由图3可看出节点之间的连线数较少,有连线的各个机构多为同一大学不同学院之间的合作,或同一省市之间的机构合作,由此可得出各机构之间的联系不够紧密,缺乏合作意识,并且缺乏跨校或跨省之间的合作,机构间的合作较封闭。

图3 研究机构共现知识图谱

2.4 关键词共现与聚类分析

2.4.1 关键词共现结果

关键词是最能说明全文含义、最能反映出论文中心内容的名词或词组[15],通过研究关键词或主题词在某一研究领域文献中出现的频次高低,提炼出该研究领域的研究热点及潜在研究方向[16]。中介中心性是衡量节点在网络中重要性的指标,在CiteSpace中使用此指标来发现和衡量文献的重要性[17],基于CiteSpace分析中医体质辨识研究领域的关键词结果如图4,节点数量N=449,各作者间的连线E=549,密度(Density=0.0059),图中节点越大表示其出现的频次越高,节点与其他节点连线越多则表示关键词之间的联系越紧密,排名前十的直接涉及中医体质的关键词有中医体质(369次,0.53)、中医体质辨识(270次,0.19)、体质辨识(201次,0.37)、体质(76次,0.23),排名靠前的高频关键词主要涉及的疾病为:高血压(57次,0.06)、2型糖尿病(30次,0.07),而涉及的研究方向主要为治未病(88次,0.22)、健康管理(75次,0.41)、亚健康(27次,0.19)等;涉及的人群主要为老年人(62次,0.07);在中医体质辨识的研究中,中介中心性较高的关键词为:中医体质(0.53)、健康管理(0.41)、体质辨识(0.37)、糖尿病(0.23)、治未病(0.22)等,表明在该领域中这些研究比较重要为热点研究。(详细关键词频次及中介中心性见表3,关键词共现图谱见图4)

表3 前20位的关键词

2.4.2 关键词聚类结果

在关键词共现知识图谱(图4)基础上,从文献关键词中抽取的结果对每个聚类进行自动标识,共得到21个聚类通过citespace设置仅显示前10个具有代表性的聚类结果,在“Cluster Explorer”中按照对数似然率(log-likelihood ratio,LLR)算法,得出关键词共现网络聚类结果Modularity(聚类模块值,Q值)=0.8736;Mean Silhouette(聚类平均轮廓值,S值)=0.5552,根据以上两数值可认为聚类合理且聚类结构显著。分析关键词聚类表及聚类图谱可将聚类结果大致分为4类:①#0、#3、#6、#7、#8主要为中医体质本领域研究②#1、#5为体质辨识在治未病领域的研究③#2、#5、#7、#9体质辨识在疾病的治疗及预防方面的研究④#2、#3、#4、#9体质辨识在健康管理及现代生物医药领域的探索(表4、图5)。

图5 关键聚类图谱

表4 关键词共现网络聚类表

图4 关键词共现知识图谱

2.5 突现词与时区图

2.5.1 突现词

突现词是在某一个时间段内频次变化率比较高的词,年度研究热点的变化情况可以通过突现词展示出来,从而反映出研究主题随年度而变迁的趋势[18]。鉴于此,运行CiteSpace在关键词共现基础上选择控制面板上的“Burstterms”得出关键词突现图,从图中的得出自2007年至2020出现的突现词其持续时间在5年以上的有:形体特征、支持向量机、王琦、调查研究、健康体检;从当前结果看六味地黄丸、高尿酸血症、体质学说为目前的研究热点(图6)。

图6 关键词突现图

2.5.2 关键词时区图

关键词时区图可以反映该领域研究主题随着时间进展主要研究内容的演变,也能够反映该领域在某段时间内的研究发展趋势[19],因此运行CiteSpace 5.6在关键词共现基础上选择timezone view以时区视图布局生成关键词时区图(图7)。

图7 关键词时区图

3 讨论

本文检索以“中医体质辨识”为主题词的研究文献,绘制该领域所纳入文献的知识图谱,通过图谱的方式展示了中医体质辨识领域的整体概况。分析了2007年-2020年中医体质辨识领域的发文量,研究作者、科研机构、关键词共现及聚类分析等方面的情况。

3.1 作者及机构合作薄弱

分析纳入的文献,以作者为网络节点绘制出的图谱密度为0.0049,以研究机构为网络节点绘制出的图谱密度为0.0028,由此两结果可得出在中医体质辨识领域各作者之间及各机构之间合作薄弱。在作者共现图谱中可以看出合作最密切的团队为以王琦为主的研究团队,且其团队的研究者发文量在总体作者发文量排名中排名均靠前,从图中可看出在形成的研究团体之间缺乏合作,团体之间合作封闭,单独作者节点较多。在研究机构共现图谱中可以看出发文量较多的机构多存在北京、上海、广州等一线发达城市及沿海地区,而内陆城市及发展水平较底的地区发文量排名靠后,在研究机构的合作中多为同地区同机构的内部合作,以广东药科大学公共卫生学院、广东药科大学信息工程学院及广州中医药大学临床药理研究所这3所科研机构所形成的合作团体为例,在此3所合作机构中共有2所机构为广东药科大学的两个学院,另一机构为同地区的广州中医药大学。分析作者及机构合作薄弱的原因可简单归纳如下:①中医体质研究存在不同的分类方法,其中研究最多的为以北京中医药大学王琦教授提出的体质九分法;其次为上海中医药大学匡调元教授提出的匡氏人体体质分型学说,将人体划分为6种体质;山东中医药大学的田代华教授结合阴阳气血精液学说将人体分为9类;南京中医药大学的黄煌教授提出的经方体质;除此之外还有何裕民、赵进喜、边海云等人提出的不同的体质分类学说[20,21]。此为作者及机构合作薄弱的主要原因。②地域差异引起,龙斯玥等人在其研究中指出因各地域之间存在环境、气候、生活方式及人文特征的差异性,造就了人群体质类型具有体质共性趋势[22]。此为合作薄弱的次要原因。③体质辨识应用尚未形成标准化的应用规范,体质辨识被应用于多个领域,目前对其应用多存在于中医体检、流行病学调查、健康管理、公共卫生服务等领域,缺乏统一的标准化应用规范[23],并且中医体质辨识的文献报道多为流行病学调查,集中在同一地区,或同一类人群之间展开,所以缺乏跨区域合作。以上两者对该领域的合作也有一定的影响。

3.2 研究热点及潜在研究方向

对纳入的文献以关键词为网络节点,通过关键词的共现及聚类分析结果可以推测出中医体质辨识领域的研究热点及潜在研究方向。对关键词共现及聚类结果分析,各个高频关键词及聚类研究内容存在相互交叉现象,可归纳为4个大类:体质研究、治未病、健康管理、与现代生物医学相结合,详述如下:

3.2.1 体质研究领域包括的关键词

中医体质、体质辨识、阴虚质、中医体质类型等,此类研究多是中医体质的基础研究以及某一地区的流行病学调查类研究。

3.2.2 治未病领域包括的关键词

治未病、高血压前期、糖尿病、高脂血症、危险因素等。与中医学治未病思想相结合,将中医体质辨识运用于临床中,对疾病早期干预,在临床实践中应用颇丰,何婧[24]等人在进行“治未病”健康管理的高血压前期患者的临床实验中采用中医体质辨识及干预方法的患者舒张压、收缩压、头痛头晕症状发生率均低于对照组。周红梅[25]等人在观察中医辨体调质护理在2型糖尿病患者护理管理中的效果的临床研究中发现运用中医辨体调质护理比常规护理有助于提升患者遵医的行为,更好地改善其生活质量。

3.2.3 健康管理领域包括的关键词

中医健康管理、健康指导、健康体检、基本公共卫生服务项目等。中医体质辨识在健康管理方面尤其是区域健康管理或社区老年人健康管理方面应用较多,且效果明显,黄奔仁报道根据中医体质辨识结果,进行中医药保健指导,能有效改善社区老年人的健康状态,提高生活质量及幸福感[26]。中医体质辨识在健康管理方面的研究与《“健康中国2030”规划纲要》和《中国防治慢性病中长期规划(2017—2025)》中提出健康中国的目标高度一致,以健康促进和健康管理为手段,发挥中医药在慢性病防治中的作用和优势[27,28],在实现健康中国战略目标中发挥中医药不可磨灭的作用。

3.2.4 中医体质辨识与现代生物医学结合的领域包括的关键词

神经网络、支持向量机、基因多态性等。潘思行在研究指出基于人工神经网络或支持向量机的舌象、形体特征辨识在中医体质辨识中起重要作用,有利于提升中医体质辨识的客观化水平,且支持向量机的体质辨识效果优于人工神经网络[29]。孙占东[30]在其研究中指出中医体质形成的实质是基因表达模式的差异,易患疾病与体质有高度相关性。中医体质辨识与现代医学结合不仅有利于提高体质辨识的客观化水平,也为临床诊断和治疗提高了新思路新方法。

3.3 研究的发展历程

结合突现词图谱及时区图(图6、图7)可将我国中医体质辨识领域的发展历程客观的展现出来,中医体质辨识于2007年第1次出现,在今后的14年间得到充足的发展,按时间可将中医体质辨识的发展大致分为3个阶段。

第1阶段为基础时期(2007-2009年)中医体质辨识是在中医体质学说的基础上进一步发展起来的从1982年第一部《中医体质学说》专著的出版标志着中医体质学说的正式成立,王琦在2007年第五届全国中医体质学术研讨会提出可将体质辨识用于健康评估,用于具有亚健康状态的、疾病危险因素的、慢性疾病和康复期的人群或个体,为其进行健康管理服务,指导生活行为、养生保健和医疗干预[31,32]。在此3年间中医体质辨识在辩体施养、形体特征及健康体检等方向研究较多,充分体现了王琦教授提出“体质辨识”的意义将人的健康问题由笼统化转变为个性化。

第2阶段为发展时期(2010-2014年)在这一时期我国中医体质辨识领域研究逐渐丰富,尤其在治未病方面的发展,孙理军等人研究指出“治未病”体现了中医学预防为主的思想主要包括“未病先防”和“既病防变”即预防健康、亚健康、疾病各个阶段的进展,而体质辨识是各阶段预防的基础[33],学者结合个体体质及其危险因素在疾病预防方面尤其是高血压及糖尿病的预防研究较丰富。

第3阶段为繁荣时期(2015年-至今)在这一时期随着国家大力发展中医的号召,以及中医工作者的不断努力,中医在我国的医疗体系中的地位得到显著的提高,中医体质辨识领域也快速的进步。张彩研究指出中医体质辨识在血脂水平、基因、人体热成像、舌象、激素水平、脑功能等方面的研究,为中医体质辨识提供新的研究思路与方法,结合现代生物医学为中医体质辨识提供客观化、量化依据[34]。

3.4 创新点及不足之处

本文基于科学计量学与数据和信息可视化的基础上,采用CiteSpace 5.6对纳入的1099篇文献进行了详细的分析,通过图谱的形式,直观地反映中医体质辨识领域的研究现状、展现了该领域研究热点以及14年来体质辨识领域从基础研究向健康服务管理及结合现代生物医学研究转变的研究历程。另本研究仍存在不足之处,如:由于CNKI导出数据的局限性无法对纳入的文献进行共被引分析、文献耦合分析及双图叠加分析;并且CiteSpace不能对CNKI导入数据进行去重,仅能通过导出文献时通过手动去重,可能造成少部分文献重复纳入,对研究结果产生一定误差。

4 结论

对我国中医体质辨识领域研究现状进行分析后发现:①发文量逐年上升的趋势,说明中医体质辨识的研究逐渐受到关注。②作者之间以及研究机构之间缺乏合作意识,需要加强合作交流,促进中医体质辨识领域朝着全面化、系统化的方向发展。③从研究热点及发展趋势来看,中医体质辨识从最初的基础研究到之后与治未病相结合,接着应用于健康管理及公共卫生服务,再者逐步发展为与现代生物医学结合,从根本上提升中医体质辨识领域的现代化水平,使中医体质辨识朝着客观化方向发展。在中医工作者的努力下,与临床工作相结合探索行之有效的方法,使中医体质辨识真正服务于临床,服务于患者,为我国实现健康中国的目标贡献中医的一份力量。

猜你喜欢
发文图谱聚类
高清大脑皮层发育新图谱绘成
基于图对比注意力网络的知识图谱补全
绘一张成长图谱
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
基于高斯混合聚类的阵列干涉SAR三维成像
主动对接你思维的知识图谱
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
雷达点元聚类算法性能的比较与分析