全科医学和初级保健横断面研究的基本设计和实施步骤

2024-03-08 01:10李雪迎康晓平迟春花王熙诚尚美霞周国鹏高畅潘子涵
中国全科医学 2024年13期
关键词:分析方法临床

李雪迎,康晓平,迟春花,王熙诚,尚美霞,周国鹏,高畅,潘子涵

1.100034 北京市,北京大学第一医院医学统计室

2.100191 北京市,北京大学公共卫生学院流行病学与卫生统计学系

3.100034 北京市,北京大学第一医院全科医学科

4.University College London,school of management,Gower Street,London WC1E 6BT

横断面研究是经典的流行病学研究方法之一。在全科医学和基层卫生研究中,横断面研究是一种耗时相对较少且能够帮助解决实际问题的研究方法,其特点在于可以在短时间内完成调研,通过了解研究对象在一个时点或短时间内的状况,了解疾病特征、卫生服务现状、医学教育情况、卫生经济学情况、解释医疗过程的一般规律、探讨信息间关联的研究方法,所以也被称为现况研究[1]。相对而言,横断面研究是一种研究过程比较迅捷的方法,能够在较短时间内完成研究,是一种应用广泛的研究组织方式。

在全科医学和基层卫生研究中,如下研究场景可以考虑采用横断面研究的设计方法验证临床命题:(1)以了解现况为目标的研究。例如,当研究的目标集中在了解社区人群的疾病状况、健康行为习惯、医疗服务现状、医疗服务利用情况等主题时。(2)以关联或差异性特征分析为目的的研究。例如验证患者对治疗的依从性与对疾病危害的认识程度相关,不同口腔卫生习惯群体龋齿患病情况的差异。在临床研究中,了解各临床特征间共同变化的趋势或者不同属性群体其临床表象的异同,是认识临床过程的重要工作,可以借助横断面研究完成。此处需要特别说明的是临床研究中存在大量以因果关系验证为目标的研究,例如疾病发生的影响因素,慢性病患者治疗依从性的影响因素研究等。对于因果关联的验证,横断面研究通常不能胜任,因为横断面数据的特征信息是同时取得的,因此常难以具备因果推断需要的时间特征(即因出现于过之前),但来自横断面调查的关联性分析可以协助获得针对因果推断的初步线索,为进一步的工作打基础。(3)诊断能力评价研究。临床诊断方法的改进是临床研究中活跃的研究领域。诊断方法的改进、提升对于提高临床效率、降低操作风险、改进可操作性具有重要意义,例如研究新的准确度良好而且简便易行的适用于社区卫生服务的诊断方法。在评价新诊断方法对疾病的诊断能力时,常需要采用所研究的新方法和作为参比的“金标准”同时对研究对象完成测量进而评价新方法的诊断能力,这类研究从研究设计角度看,通常也属于横断面研究。

本文将结合全科医学和基层卫生的研究需求,基于横断面研究的场景与经典案例,对横断面研究从设计到实施各个环节的方法学要点进行梳理[2-3],为研究提供借鉴。由于具有足够代表性的大规模流行病学调查研究,常需要通过完备的抽样策略,在目标区域内选取充分的样本作为研究对象,通常规模较大并非单中心,本文不将此类研究作为重点介绍。

1 研究设计与实施步骤

1.1 研究设计

研究设计是良好研究的开始,是研究实施的指引,通常包括专业设计和统计学设计2 个部分。临床设计需要明确研究的目标,并在充分考虑方法学原则的前提下,明确研究中的临床要素。统计学设计则主要关乎样本的获取方式以及样本量的确定。

1.2 专业设计

1.2.1 明确研究问题:明确研究问题是研究的起点,解决这些问题就是研究的起点和最终目标,明确需要解决的专业问题(比如明确社区人群的医疗服务需求,了解不同特征群体健康状况的异同;探讨行为心理特征与疾病状态,健康状况之间的关联;构建更便捷的社区筛查诊断方法等)、工作的方向。但对于研究而言,有了研究方向并非是研究的真正开始,还需要针对要验证的研究目的提炼明确的研究问题、建立研究假设。

例如要确证所构建的新诊断方法具有临床应用价值,就需要将验证问题具体化:即研究目的可以是评价该诊断方法诊断能力的正确性(灵敏度、特异度),也可以是探讨新诊断方法的诊断界值[受试者工作特征曲线(ROC 曲线)]。若是上述第一个目标,建立的研究假设就是新诊断方法可以提高真阳性率(灵敏度),或真阴性率(特异度),或两者均可。

提炼研究问题的过程是把临床研究目标具体化的过程。临床目标指明了工作方向,但其可能是由一个或者多个,也可能是一连串具体的研究问题组成的。因此在研究开始的时候,明确本研究的研究问题是研究的开端和关键一步。

例如,PAN[2]在针对初级医疗保健中慢性阻塞性肺疾病的筛查诊断方法研究中,其研究目标在于寻找适合初级医疗保健应用的慢性阻塞性肺疾病筛查方法。依据以上目标将研究问题表述为评价中国初级保健人群中各种慢性阻塞性肺疾病筛查测试方法的准确性和成本效益,从而明确了筛查方法的临床效用评价与筛选,对诊断准确性与经济两个方面做出综合判断。

1.2.2 明确研究要素:在明确研究问题的基础上,进一步需要对验证研究问题所涉及的诸研究要素加以细化和明确。研究要素通常包括研究对象、研究因素(也包括对照因素)和评价指标。

(1)研究对象:需要明确研究对象的特征,这是一个重要的研究要素,因为其阐释了研究人群特征与目标人群特征的一致性。只有当研究人群与目标人群特征相同的时候,研究所获得的结论才可以外推至目标群体,从而获得具有实际临床推广意义的可靠结论。

在研究方案中,通过定义具有足够严谨性及可操作性的纳入、排除标准来呈现研究对象选择的设计思路,同时说明研究对象群体的代表性、科学性、合理性。一般来说,纳入标准勾画目标群体的特征,表征研究结论所对应的临床目标群体的特点和人群范围,将目标群体中情况过于复杂、不适宜参加研究或无法配合完成研究的个体排除在研究之外。

例如PAN[2]在慢性阻塞性肺疾病筛查诊断研究中,由于慢性阻塞性肺疾病好发于中老年群体,即所研究的筛查方法针对的目标人群为中老年人,故而研究人群的入选标准定义为年龄40 岁及以上因任何原因就诊于社区医疗服务中心的社区居民;同时应将各种原因无法配合检查及无法参与的研究个体排除在外,所以排除标准则定义为无法给予知情同意、有肺活量检查禁忌证或因其他原因无法进行检查者。

从以上设定可见,纳入的研究对象反映了未来实际应用中目标人群的群体特征,充分说明了研究对象选择的代表性。

(2)研究因素:当研究目的不同时,研究因素的定义也会各有不同。无论哪一类研究目标,作者均应对各要素的测量方法和组织方式给予明确说明。当采用量表完成信息收集时应特别注意要选择信效度良好的量表。

在现况调查研究中,研究因素即为所关注的特征属性,应明确其获取方法、判定标准。在关联性为主要目标的研究中,所要研究的相关因素即为研究因素,其测量方法及测量结局的记录方式需在方案中明确。关联性分析中常通过研究因素不同水平间的对比分析获得是否关联的结论。在诊断能力评价中,所研究的因素就是等待评价的诊断方法,同时为了获得准确目标,临床结局作为诊断能力评价的参照。当前针对该问题的“金标准”诊断方法常作为参比方法引入研究。结局评价指标是对验证目标给予表达呈现的重要参数。选择能够从本质上准确反映研究状况、关联强度的指标是研究设计的关键。

从指标属性上看,包括主观指标和客观指标。客观指标是来自于生物学、物理学等特征的测量结果(例如来自各种临床检查所获得的客观结果、实验室检查的测量结果、肺功能测量结果以及病理检查结果等);主观指标则需要借助研究者或患者的主观判断获得。其中,以患者为中心的结局指标,即患者报告结局(patientreported outcome,PRO)[4-5],具有重要的实践意义。在临床研究中PRO 被定义为:任何来自患者直接报告且不被他人修改或解读的对自身疾病和相应治疗感受的评估结局[6]。在全科医学和基层卫生领域的研究中,大量针对医疗服务、健康认知以及治疗干预的主观感受和体验均需要通过来自患者、健康服务对象的主观感受获得评价。因此PRO 在全科医学和基层卫生领域得到了日渐广泛的应用和重视。从研究设计的科学性角度看,结局指标需要足够的准确性。在这个问题上,客观指标因其测量的方法学特性,在可靠测量方法和严谨操作的保障下更容易获得可靠的测量结果。对于主观指标,由于人为因素的参与,其测量结果的准确性、可靠性自然面临更大的挑战。因此PRO 的测量手段就成为影响PRO 测量结果可靠性的重要因素。在PRO 测量过程中,需要具有足够可靠性的测量首当方可完成研究任务,例如各领域中具有可靠信效度的量表,视觉模拟评分(Visual Analog Scale,VAS)、数字等级评分(Numeric Rating Scale,NRS)等都是常用的评价方法。

从不同的研究目的角度看,评价指标也各有特点:在诊断能力评价中,通常以研究方法诊断结果与“金标准”参比方法诊断结果的一致性作为评价标准,通常会通过灵敏度、特异度等指标呈现对患病与否等二分类结局状态的判断准确性(详见统计分析部分)。在现况调查研究中,则会明确研究目标,例如将患病率、知晓率、满意率等指标作为评价指标,并通过目标参数的统计描述与相应的区间估计来表达情况特征。在关联性分析中则以关心的临床参数为结局指标,经常通过多变量回归分析,采用回归系数或通过回归分析获得表达关联强度的指标如OR 值,来阐述研究因素与结局指标之间的关联强度、关联特征。

1.3 抽样与统计学设计

1.3.1 样本的获取方式:从统计学角度看,研究样本的收集分为普查和抽样调查两类。

普查是将特定时间点或时间内的全部人群(总体)作为研究对象进行的调查,例如对社区内60 岁以上的老年人进行饮食习惯调查;以研究时间段内所有在社区医疗服务中心完成健康体检的人为研究对象,了解肥胖情况。

抽样调查有别于普查之处在于并非将特定群体的全部个体作为研究对象,而是采用随机或非随机的方法选择总体中的部分个体作为样本,以其为研究对象开展研究来推论总体特征的研究方法。抽样研究从样本的选择角度看分为随机样本(即通过随机化方法完成样本选择,具有更好的代表性)和非随机样本(即方便样本)。

例如,曹瑾等[6]在甘肃省急性病患者家庭用药合理性和药品可及性调查研究中明确说明,为了了解甘肃省急性病患者家庭用药合理性和药品可及性现况,为规范甘肃省急性病患者家庭用药行为,提高其用药合理性和药品可及性,采用了分层多阶段随机整群抽样法。第1 阶段,根据甘肃省各市人均国内生产总值(GDP)排名,并考虑现场配合度,等距抽取5 市;第2 阶段,在抽取的5 市中分别随机抽取1 个区和2 个县;第3 阶段,在抽取的每个县中分别随机抽取2 个乡镇;第4 阶段,在上述36 个抽样点分别随机抽取30 户常住家庭共1 080户家庭完成问卷调查,从而获得了具有足够代表性研究对象。

1.3.2 样本量估计:样本量估计是方案设计阶段的重要环节,关乎研究设计的科学性和研究工作量的确定。样本量估算是研究设计的基本要素,是在主要评价指标明确的基础上完成的,样本量估算需要以主要评价指标的估计值作为临床参数才能完成。

主要指标的估计值可以来自前期的预探索研究结果,或者文献报道中研究者认为具有参考意义的相关结果报告。由此可见,在作为初次“尝试”的探索性研究中,由于前期尚未获得相应的可参考信息,没有办法对效应强度做出合理的估计,也就没办法完成样本量估算。所以,探索性研究常是小规模的,其样本量的确定并不依据统计学估算确定,而是综合考虑数据特征、临床可操作性等因素决定。同时,探索性研究的分析过程也并不强调需要明确的验证目标和实现确证,而是完成对研究问题的初步了解,并为确证性研究奠定基础。探索性研究中所获得的信息则是确证性研究样本量估算的重要临床参数。在最终以确证为目的的研究中,当前期信息尚不充分时,也可以首先考虑完成小规模的探索性研究,从而增加对研究问题更充分的认识,也为确证的实施和研究规模的确定、积累信息奠定基础。

样本量实施过程所需要准备的参数包括统计学参数和临床参数两部分。在横断面研究中,根据抽样方法的不同及资料性质不同,样本量估计的方法也不同。针对结局指标是二分类变量的单纯随机抽样,描述性研究样本量估算公式适合多个工作场景(例如针对医疗服务满意率的问卷调查),应用比较广泛的估算方法[7-10],估算公式如下:

其中n 为样本量;统计参数α为检验水准,通常取0.05,当双侧检验α取0.05 时,Z21-α/2=1.96;临床参数p 为主要结局指标参数的估计值(在诊断能力评价中可以是灵敏度、特异度;在调查研究中可以是满意率、知晓率等二分类结局指标);δ为允许误差,即样本率与参数值相差所允许的限度。通常研究中还会考虑一定比例的数据脱失(通常不超过20%)。也就是说当考虑的脱落比例为20%时,计划纳入的样本量为估算结果的1.2 倍。

(1)调查研究举例:在针对社区幼儿龋齿患病率的调查中,预调查显示,3~5 岁学龄前儿童的龋齿患病率约为60%。如果允许的调查误差为6%,也就是患病率的调查结果的误差要控制在±6%以内。取α=0.05,根据以上设定完成样本量估算:

针对需纳入的阳性病例数,采用灵敏度的估计值完成功能计算,带入以上公式,Z21-α/2=1.96,P=0.60,δ=0.06 得:

故需要完成调查257 例,考虑脱落比例约为20%,故需纳入研究样本:257×1.2 ≈309 例。

当研究目的在于验证研究所获得的率指标达到或超过某一特定目标水平时,可采用单组目标值设计[10-12]的样本量估算公式:

(2)诊断能力评价举例:在针对某社区筛查诊断方法的评价研究中,根据前期研究,待评价诊断方法的灵敏度可达到95%以上,特异度可达到85%以上;如依据临床应用要求,灵敏度需达到90%以上,同时特异度需达到80%以上才满足筛查工作的要求;取α=0.05(双侧),β=0.2;按照前期调研所见,目标群体中阳性病例约占30%,根据以上设定完成样本量估算:

针对需纳入的阳性病例数,采用灵敏度的估计值完成功能计算,带入以上公式,Z21-α/2=1.96,Z1-β=0.84,P1=0.95,P0=0.90,得:

故需要完成阳性研究病例238 例,因为阳性病例在筛查目标群体中约占30%,则为获得足够的阳性检出病例需纳入得研究病例数为:238/0.3 ≈794 例

考虑的脱落比例为20%,则共需纳入研究病例794×1.2=953 例。

在诊断能力评价中,以上公式同样适用于特异度的计算,当临床应用同时对灵敏度和特异度提出了各自的验证目标时,则需要对灵敏度和特异度分别完成以上计算并以其中较大者作为研究的样本量,从而同时满足两参数的验证需要。

以组间平均水平差异为核心验证目标时,则可以采用组间平均值差别性分析的方法完成样本量估算,以下介绍两样本平均值差异验证的样本量估算公式(组间比为1:1 的情况):

其中n1,n2为两组样本量;统计参数α为检验水准,通常取0.05,当双侧检验α取0.05 时,Z21-α/2=1.96;统计参数β为检验水准,常用水准为0.2,Z21-β=0.84;临床参数S 为评价指标参数的公共标准差估计值;δ为两组平均值差值的估计值。

(3)组间差异性分析举例:在针对某社区运动习惯和BMI 关系的问卷调查中,根据前期预调查结果,保持良好运动习惯者其BMI 水平更低,与缺乏运动这相比BMI 平均水平差值约为1.5 kg/m2,设公共标准差为3;取α=0.05(双侧),β=0.2;按照前期调研所见,目标群体中坚持运动与缺乏运动者约各占50%,根据以上设定完成样本量估算:

将以上参数带入公式,Z21-α/2=1.96,Z21-β=0.84,S=3,δ=1.5,得:

故需要完成坚持运动极缺乏运动社区人群调查各63 例。考虑的脱落比例为20%,则共需纳入研究病例(63+63)×1.2 ≈152 例。

1.3.3 统计分析:统计分析的一般原则为统计分析是验证研究目的的方法和环节。统计分析策略的确定,首先依据验证目的明确整体思路,进而根据指标属性选择统计描述方式和统计推断方法[13]。

从统计学角度,数据分为数值变量(例如血压、血糖)、分类变量(例如性别、民族)和有序变量(例如心功能分级、肿瘤病理分级)。

统计描述的目的在于准确呈现研究数据特征,服从正态分布的连续变量数据通常采用(平均值±标准差)表示,不服从正态分布时则采用中位数(上四分位数,下四分位数)或中位数(最小值,最大值)完成描述;对于分类变量统计描述则通常采用相对量形式。有序变量则会考虑数据等级的特点选择各等级的例数(百分数)或采用中位数(最小值,最大值)的方式描述数据。

统计推断的目的在于利用样本信息推知总体特征。统计推断包括假设检验和区间估计两种方法,其中假设检验根据分析目的不同分为差异性分析和关联性分析。

差异性分析验证比较组间的不同:连续变量服从正态分布时,两组间比较常采用t 检验,多组间比较采用单因素方差分析;不服从正态分布的连续变量和等级变量则采用秩和检验;分类变量则根据数据特征采用卡方检验或确切概率法。

关联性分析包括相关分析与回归分析两大类型。相关分析通过相关系数和假设检验结果呈现关联的密切程度及趋势特征;回归分析则着重通过针对回归系数的分析探讨变量间共同变化的依存关系。根据分析变量(自变量)的数量,回归分析又可分为单变量回归分析(仅包括一个自变量)和多变量回归分析(包括多个自变量)。

在横断面研究中,不同研究目标,其分析策略的重点也各有不同。

现况分析:通过对核心指标的统计描述及其相应的区间估计来呈现结果,例如对于某病患者健康教育知晓率的调查研究,可以计算样本知晓率并按不同特征分层进行组别间知晓率的比较,并进行假设检验及相应的95%置信区间。

关联性分析:对于临床信息间关联性分析,通常通过统计描述呈现数据特征,再通过单变量分析探讨变量间的关联。在临床过程中常见一个临床特征与多个因素相关的情况,故而关联性分析中根据研究目的和临床特征在很多情况下都会借助多变量回归分析探讨临床特征间的关联。常用的方法有多变量Logistic 回归和多变量线性回归。在Logistic 回归中通常通过OR 值及其区间估计表达关联强度和方向,线性回归分析中则依靠回归系数来体现关联性。

例如曹瑾等[6]在家庭用药合理性和药品可及性调查研究中,采用统计描述的方法对家庭用药情况做出总结和说明,并针对不同特征的群体完成了差别性检验或相关分析,从而探讨不同地区人群的用药特征,以及药品获取方式与用药情况的关联等等信息为临床医疗提供帮助。

诊断能力评价:在诊断能力评价中最常遇到的是针对二分类结局(鉴别病例和非病例)的诊断能力研究。通常通过“金标准”诊断方法获得研究对象的准确疾病状态,将研究对象区分为病例和非病例。同时对研究对象完成所评价的诊断方法的检测,获得阳性或阴性的结果,故而所有研究对象的检测结果可归纳为如表1 中的四格表。

表1 诊断能力评价数据结构表Table 1 Diagnostic capability evaluation data structure

从诊断能力评价角度看,会同时通过检出病例和排除非病例两方面的能力来评价试验诊断方法的效用。故而对于二分类结局通常通过灵敏度(检出病例的能力)、特异度(排除非病例的能力)为核心指标的一系列诊断指标及其区间估计来说明诊断能力。

另外,诊断方法构建中,根据诊断模型构建的数据属性不同,连续变量(如血糖、尿素氮)、等级变量(如心功能分级、肿瘤分期)必要时可以首先通过ROC 分析初步说明诊断能力进而寻找诊断界值,通过灵敏度、特异度等呈现诊断能力;当涉及多变量诊断模型时,则可能根据应用需要和数据属性采用并联方式(2 个或2个以上的诊断方法同时完成,其一获得阳性结果即判断为阳性,旨在提高检出灵敏度)、串联方式(2 个或2个以上的诊断方法同时完成,全部获得阳性结果才判断为阳性,旨在提高特异度)、序贯方式(诊断过程由一系列诊断方法依序按照事先规定的准则实施,例如在每一步的检查中获得阴性诊断的研究对象即判断为阴性,而获得阳性诊断的病例将进入下一步诊断检验,直至最后一步仍未阳性的研究对象才获得阳性诊断)以及多变量模型分析(例如:Logistic 回归分析)或适宜的构建方法完成模型构建,但最终都会通过前述的诊断能力指标呈现验证能力。

1.4 实例分析

慢性阻塞性肺疾病是常见的呼吸系统慢性疾病,因为通气功能受损而严重影响患者健康和生活质量,需要长期治疗和监测防止病情进展和复发。因此慢性阻塞性肺疾病的早诊、早治是社区卫生医疗工作的重要任务。如前文介绍中已经简要提到的有关研究设计的各要素,潘子涵[2]在针对初级医疗保健中慢性阻塞性肺疾病的筛查诊断方法研究中,从社区医疗的实际需要出发,明确研究问题,为社区医疗寻找符合操作条件、诊断准确性良好且具有较好卫生经济学效用的筛查诊断方法。研究人群特征反映了社区筛查工作的目标群体特点;所评价的诊断方法包括了操作简便的呼气峰流速仪等客观测量方法和反应患者主观感受的量表评价结果;参比方法采用具有“金标准”意义的诊断性肺量计测量结果作为临床诊断;统计分析方法遵循了诊断能力评价的要求,通过灵敏度、特异度等指标最终呈现诊断能力,相应设计要素归纳如表2 所示。

表2 社区慢性阻塞性肺疾病筛查研究的设计要素Table 2 Design elements of a community-based chronic obstructive pulmonary disease screening study

2 实施步骤

2.1 撰写研究方案

方案撰写在明确研究目的、准确描述研究要素的基础上开始,应语言简练、表意准确,充分体现临床验证思路的科学性、严谨性。(1)题目应简明,对科学问题、验证目标做出准确概括。(2)研究目的是对工作目标的概括说明,应简洁准确,通常在一个独立的研究中,研究目的应集中于一个明确的科学问题,根据研究目的提出或建立研究假设。(3)研究背景对研究领域的临床现状和研究进展做出简要概括,明确当前面对的未解问题,说明本研究的必要性和临床意义,从而说明研究工作开展的专业基础以及本项研究立题的必要性和临床意义。(4)总体设计对研究设计类型,组织形式(如单中心或多中心研究)等设计特征给予概要说明,从而体现研究的组织思路、组织形式与研究验证目的的一致性。(5)研究对象说明样本来源,比如样本获取自社区人群或医疗机构的就诊患者,并应依据研究要素定义明确入选、排除标准,同时还应注意说明样本纳入的筛选方式:如连续纳入就诊患者、通过随机化方法筛选纳入符合标准的社区居民或者采用非随机化方式招募研究对象等。(6)信息采集与明确结局指标需说明针对研究目的所需要收集的信息,以及收集、测量的方法,充分体现科学性及可操作性;应注意包括与研究相关的人口学信息,与入选、排除标准判断相关的临床信息,研究要素,研究结局信息;此外,还需要考虑收集可能的分层因素以及混杂因素,为数据分析做准备,在明确收集信息的基础上,应对结局指标做出明确定义。(7)数据管理方法概要要有说明,包括数据管理工具、安全性措施、数据核查质量控制措施(具体要点可参考2.5数据管理)。(8)样本量估计与统计分析中样本量估算过程的报告应包括预期参数、估算公式、估算结果,说明预计纳入的研究样本数量、统计软件、检验水准,概括统计描述、假设检验方法,特别应注意说明针对主要指标的统计分析方法(具体要点可参考2.6统计分析),以呈现验证思路。(9)撰写及完善研究方案是研究实施前重要的环节,方案一经确立,在获得伦理委员会批准的前提下,研究实施过程将严格遵照方案执行,不得随意更改。因此,应特别注重研究团队针对方案的讨论和完善。研究开始前,研究人员应对方案设计达成共识,只有在研究团队认识统一、设计完备合理的情况下,研究开展才能验证临床目的。

2.2 信息报告表设计与研究者培训

信息收集前,确定调查工具和信息收集表格是重要的准备工作。在研究方案明确的基础上,依据方案对研究信息的要求和定义完成信息报告表设计。信息收集以满足达到研究目的的最小数据集为宜,并非信息收集越多越好,这是因为数据信息收集的增加不仅增加研究工作量,也增加了数据收集阶段出现错误的机会,影响数据质量,同时过长的访问时间也可能降低研究对象的依从性,从而给数据质量和完整性带来影响。

对于数据记录方式,建议在数据采集表中明确计量指标(例如身高)相应的计量单位(例如:cm),对于分类指标建议通过封闭提问的方式(也就是通过固定的选项收集信息),避免使用自由填写的报告方式,以促进信息的可利用性。选项设置中应从信息特征出发,对可能出现的情况做出划分和陈列,应特别注意各选项描述的准确性,避免歧义。同时应注意完备性与互斥性,从而避免部分情况无对应选项或在选项间难以准确判断的情况。选项设定关乎数据分析和目标验证,选项应根据研究需要和数据特点设定。多数情况下,所设定的选择范畴和分类并不难决定,例如性别通常区分为男性和女性两个选项即可;而有些信息则需要对类别划分做出有针对性地设定,例如民族信息的取得,是将56 个民族分别作为选项列出,或者在很多研究地区因居民中汉族为主则将民族信息区分为汉族与非汉族,在对少数民族者另设变量记录其具体民族信息。亦或在特定的民族聚居区根据研究对象特征做出便于分析、易于记录的分类方法。

涉及量表、问卷时,应尽可能选择成熟且经过评价被专业内认可的测量工具。问卷、量表作为调查手段是合理的选择,在需要针对研究目的自行设计问卷时,则应根据问卷设计的一般要求完成设计工作。应特别注意:问题描述清晰、准确避免诱导性,避免歧义;尽量避免否定性问题,不使用双重否定问题,防止理解困难和可能的错误;问卷长度不宜过长,填写总时间控制在30 min 或更短为宜,防止影响依从性;敏感问题的提问应置于问卷后部。

信息收集表格构建完成后,必要时可以通过预调查了解应用情况,对问卷进行完善,进而开展正式研究。

研究工作开始前,应通过充分的研究者培训统一对研究内容的理解,以及调研方法的同质性,只有当研究者充分统一认识和具有相同的判断能力时方可付诸实施。

2.3 伦理审查

在研究设计阶段工作完成后,应依据相关要求将研究相关信息递交伦理委员会完成审查。对于前瞻性收集过程,需要在递交审查前依据伦理委员会的要求撰写知情同意书,并递交审查。回顾性收集病例信息的研究则需要提交免除知情同意的申请,只有当研究方案通过伦理审查后方可开始临床工作。

2.4 数据收集

数据收集工作需在所有研究者通过对方案及信息收集内容做出充分讨论、获得统一认识的基础上并获得伦理批准后开展。收集过程需遵照方案规定,认真履行培训要求,确保数据完整性、准确性,保障数据质量。

2.5 数据管理

数据管理的核心任务在于确保研究数据的准确性,为研究提供可靠的数据基础。因此需明确数据管理标准化操作流程,并严格遵照执行,从而保障数据质量。

(1)管理工具:在条件允许的情况下先选择功能完备的数据库系统记录数据产生过程,保留循证证据,确保数据质量都是有益的。在条件不具备的情况下,研究者亦可借助简单的数据表工具完成数据管理工作。在采用简单数据表格存储研究数据时,则更应注意数据管理的各个环节从而保障数据准确可靠。(2)数据存储安全策略:专设数据管理员明确权责、设置密码保护,及时、多设备、多途径备份存储是重要的管理措施,对于防止误操作或可能的安全风险都具有重要意义。(3)数据结构的定义:针对信息采集表中的数据信息内容,在数据库中给每一个数据点定义相对应的变量名,根据分析工具的要求常采用简要的词汇或常用的缩写为变量命名,对于以固定选项收集的数据经常需要通过数据编码以便于分析。在有序分类变量的编码中,需保持选项间的程度关系与编码所对应的数值大小相对应。例如BMI 分类为消瘦、适中、超重、肥胖时,其对应的编码可以分别为1、2、3、4。这样一来,数值的大小与BMI等级特征的程度一致,便于数据分析。对于数据库中各变量与信息采集表信息的对应关系以及变量名称,变量属性(数值变量、分类变量)编码,取值范围,录入要求应作为数据管理重要文档给予妥善记录和保存,便于查找和使用。(4)纸质数据采集方式的数据录入过程:首先需要将来自纸质信息表的数据信息从原始记录尽可能准确的转移到电子数据存储体系中。为确保数据库中的信息与采集表一致,通常需要完成数据准确性核查。常用的方法例如双份录入核查比对:也就是由两个数据录入人员分别独立录入数据后对两人的录入结果进行比对,对二人录入不一致的数据再与原始数据表完成核对检查,保留正确结果。显然,采用电子数据采集时则不需要这个录入的程序。(5)逻辑核查:无论采用何种方式采集数据,数据逻辑核查都是保障数据质量的重要环节。逻辑检查的目标在于通过数据内部或数据间的逻辑关系发现可能存在数据准确性问题,进一步提高数据质量。逻辑核查包括但不限于:发现异常缺失的数据并及尽可能及时补救,例如性别信息的缺失;对异于临床认识的测量值进行复核,例如收缩压记录为330 mmHg(1 mmHg=0.133 kPa),明显异于常理需要进行复核;数据信息间存在矛盾,例如既往病史中说明存在高血压长期服药,但合并用药中未见相应记录需要核实并及时更正等。

2.6 统计分析

统计分析过程应严格遵循方案中关于统计分析的方法和策略完成。评价策略评价指标不应随意调整,必要时根据研究目的通过未在方案中计划的事后分析,例如分层分析、亚组分析、敏感性分析等作为补充,为研究提供更多的信息。需要说明的是,事后分析无预先计划,无法支撑确证性结论,仅可作为探索性分析为今后的相应确证性研究提供研究基础。

2.7 论文撰写

论文撰写是研究结果呈现和分享的重要途径,因此对研究过程的简明准确呈现,在准确呈现研究科学性、循证可靠性的前提下兼顾易读性是写作的目标。对研究方法和分析结果进行准确呈现做出研究结论。临床研究论文写作,通常包括摘要、前言、方法、结果、讨论几个部分。(1)摘要:对研究核心设计要点和主要结果与结论的精炼概括。通过阅读摘要能够有效地让读者了解研究目的、研究方法、主要结果以及研究结论。摘要通常为结构式,包括目的、方法、结果、结论。目的概括说明研究要达到的目标,通常为完整的一句话;方法需要对研究对象、研究因素、结局指标、分析方法进行概要说明;结果要说明所纳入的研究对象群体特征以及分析所见,着重说明主要评价指标的分析结果,支撑研究结论;结论依据分析结果,概括研究结论与目的相呼应。(2)前言:回顾研究领域的临床工作现状和研究基础,归纳尚待解决的临床实际问题,明确本研究的研究目标和科学问题,指出本研究的临床意义。(3)研究方法:说明总体研究设计,逐一报告研究对象特征,观察指标与观测方法、评价指标的选择与定义以及数据管理和统计分析策略。(4)研究结果:完整呈现研究所见,应做到层次清楚逻辑严谨,可借助流程图说明研究对象纳入筛选及完成研究情况。数据信息呈现通常包括研究对象的一般特征,研究计划的完成情况与依从性,并依据方法部分的分析方法说明,完整报告分析结果。调查研究特别注意研究特征的描述及区间估计;关联性分析则需着重报告关联性分析结果,特别注意说明关联强度;二分类诊断能力评价则需要最终通过灵敏度、特异度等诊断能力指标及其区间估计获得诊断能力验证。并根据数据特征、建模需要,报告ROC 曲线分析,模型构建情况。结果呈现应注意易读性,综合采用文字,统计图和统计表等呈现方式报告结果。统计表通常采用三线表形式。(5)讨论:表达作者对研究问题、研究结果的分析,依据研究所见进一步阐述研究发现,阐释其理论依据,分析应用前景。对研究成果的科学性意义和实际应用意义做出评价,全面分析本研究的优点与不足,对未来研究做出展望,并最终得出结论。讨论过程应基于研究结果展开,避免泛泛而谈。

对于论文撰写而言:清晰准确、详略得当、科学严谨是所有研究需要遵循的准则。不同研究设计类型的报告过程,因其设计方式、论证目标具有各自不同的特点,在报告中又会各有侧重。为了让验证过程中的设计要点和分析要点呈现更准确,避免遗漏,方便阅读,各类研究设计均形成了研究报告撰写要点的指导性意见。在现况研究与关联强度分析的研究可遵循STROBE[14-15]声明中的报告要点,一一对照完成研究报告撰写。诊断能力评价的研究,则须遵循STARD[16]声明报告研究要点。研究者可对照检查防止遗漏重要信息。

3 讨论

横断面研究仅涉及特定时点或时期内的信息采集,相较于需要长期随访的队列研究,其实施过程更为迅捷,所需研究投入相对较低,在临床研究中针对适宜的研究目标,应用广泛。

基于研究信息采集自特定时点的数据特征,横断面研究在了解疾病、医疗现况,探究临床信息之间的关联,构建诊断方法上具有重要作用,设计实施流程见图1。

图1 横断面研究设计实施流程简图Figure 1 Transect study design implementation flowchart

针对不同的研究目的,研究者需要定义相应的研究要素、组织研究、完成验证,但三种看似完全不同的验证目标之间,实际上存在一定的相互关联,在应用中也有存在联合运用的方式。

在针对现况特征的研究中,在完成现况分析的同时,还可以在满足设计要素的情况下,展开针对数据间关联的分析[17],从而更充分地利用数据。例如通过对某社区60 岁以上居民的调查了解其对社区医疗服务的满意度,在此基础上仍可以通过关联性分析了解疾病情况、生活习惯、家庭情况与医疗服务安逸度的关系。

在关联性分析中,当关联足够密切时,亦有机会构建相应的预测诊断模型。例如通过关联性分析首先探讨胰腺超声检查各参数与病理诊断性质(良性及恶性不同程度)的关系。在关联性足够强的情况下,则有机会继续通过构建预测模型,从而通过无创超声检查实现对病理诊断的预判,构建具有临床实际意义的诊断方法,更充分地发挥超声检查在良恶性鉴别诊断中的作用。

当研究兼顾多个目标时,需要综合考虑使研究的诸要素能够契合每一个目标的验证需要。

横断面研究和其他的研究设计类型也存在协同应用的可能。例如在队列研究中,会首先完成研究对象入组时的基线信息收集,再通过随访获取临床结局。在这个过程中可以看到,基线信息的取得实际上具有横断面数据的属性,在科学问题清晰、研究要素具备的情况下,有机会利用队列研究的基线信息作为横断面数据实现可能的研究目的,更加充分的利用研究信息服务临床工作。

为获得高质量的循证证据,实际操作中应特别注重充分的方案讨论及研究者培训,从而统一认识,在力求设计严谨的前提下确保数据质量,进而通过合理的分析策略验证研究目标。

全科医学研究是在实践中不断前进的学科。研究的设计、组织、管理、分析方法都随着研究工作的需要不断探索前进。本文仅是针对全科医学与初级保健领域研究中最常见的场景展开,不可能尽述所有细节和要点。例如由于本文着重于小型研究团队可以完成的研究工作,在针对现况的调查研究中,很多课题目标需要大规模复杂抽样调查,多机构大规模团队协作才能完成的课

参考资料推荐:

1.《临床研究设计》,北京大学医学出版社,2017,Hulley S,Cummings S,Browner w,et al. 著,彭晓霞,唐迅,译

2.《临床流行病学》,人民卫生出版社,2011,李立明、詹思延、谭红专等 临床流行病学题任务,本文未对此作展开;再如针对诊断能力的评价过程,通常验证过程包括内部验证和外部验证两个部分方可确证诊断能力水平,本文则以分析方法为主并未对此进行详细说明,必要时还请结合相关方法学的指导再做探究。

横断面研究具有研究周期相对较短、开展较为便利的特征。在现况特征分析,关联因素分析及诊断能力评价中有着广泛的应用。研究实施中应特别注重科学问题提炼,研究要素明确,分析方法应用准确。

作者贡献:李雪迎负责结构设计、撰写文章;康晓平、迟春花负责结构设计、审阅修订;王熙诚负责文献检索与讨论,参与撰写及制图;尚美霞负责方法学要点梳理、案例筛选讨论;周国鹏负责临床应用要点梳理、案例筛选讨论;高畅负责文章要点梳理、案例筛选讨论;潘子涵负责案例分析、应用要点梳理与讨论。

本文无利益冲突。

猜你喜欢
分析方法临床
隐蔽失效适航要求符合性验证分析
普外急腹症临床治疗的初步探讨
电力系统不平衡分析
电力系统及其自动化发展趋势分析
可能是方法不对
用对方法才能瘦
四大方法 教你不再“坐以待病”!
捕鱼
元胡止痛膏治疗软组织损伤的临床观察
当归四逆汤治疗虚寒型痛经临床观察