定性研究可信度释疑
——从历史沿革与哲学基础谈起

2024-02-24 07:25万倩雯

外国经济与管理 2024年2期

万倩雯,卫田

（1.华东理工大学商学院,上海 200237；2.复旦大学管理学院,上海 200433）

一、引言

可信（trustworthiness）指“读者评估研究是否诚实以及结论是否合理的程度”（Pratt等，2020）。可信的研究能够改善人类命运、增进社会福祉，不可信的研究则会带来难以预估的伤害。以人类个体、社会组织为直接研究对象的管理学者，应以“寻找能够改善人们生活的可信知识”为己任（Tsui和Jia，2013）。当下中国所涌现的社会、技术与管理变革，为增进社会福祉提供了新的设想。然而，伴随中西方制度、文化的差异日益凸显，西方管理学理论难以有效解释这些新的变化（卫田，2022）。在此情形下，扎根实践、善于洞察、蓬勃发展的定性研究为学者构建中国特色的管理学理论赋予了工具与契机。开展可信的中国管理学定性研究，不仅“立足中国实际、解决中国问题”，还能够为全球发展贡献中国的管理智慧，增进全人类的福祉。

然而，由于定性研究自身的复杂性以及定量研究范式的影响，学者一直疑惑该如何评价并提升定性研究的可信度。一方面，定性研究可信度并不存在唯一的评价标准。多元哲学基础决定了不同方法在研究问题性质、数据收集与分析、研究呈现等维度存在显著差异（Morgan和Smircich，1980；Cunliffe，2011）。另一方面，定量研究范式主导了学界对“可信”的认知。定量学者认为可复制即可信，倡导公开数据，加强已发表研究的可复制性（Open Science Collaboration，2015）。但这种做法反而会削弱定性研究可信度（Pratt等，2020）。假设期刊要求定性学者公开全部访谈原文，对受访者信息进行隐私处理可能会丢失关键性的情境信息；若不处理则可能由于保密协议限制而使论文无法进入审稿流程。两类情况都是学界所不乐见的。因此，直接将定量研究可信度评价标准用于定性研究，既不科学，也不实际。

目前尚缺乏对如何解决这一疑惑的系统、深入阐释。现有研究包含三类：（1）比较实证主义与诠释主义定性研究的不同，加深学者对整体方法的理解（如井润田和孙璇，2021）；（2）聚焦于某一方法，解析其核心特征、研究设计与沿革发展等，为学者提供细节指导（如贾旭东和衡量，2020；Eisenhardt和Graebner，2007）；（3）关注定性研究可信度与透明性（如Aguinis和Solarino，2019）。前两类研究构建了学者理解定性研究的基础框架，但均未特意关注可信度。近年来，第三类研究逐渐获得关注，但正如上文所述，它们多以定量研究评价标准要求定性研究。为此，Pratt等（2020）呼吁将“透明”与“复制”脱钩，并罗列了部分提升定性研究可信度的举措，但也只能使学者“知其然，而不知其所以然”。

因此，有必要站在历史的高度，全面囊括多元的哲学基础，并结合具体实例解释“如何评价并提升定性研究可信度”这一问题。第一，每一种方法都是历史的产物，人们难以脱离时空嵌入性理解方法产生和发展的动机。如果不理解发展历程，研究者便无法理解定性研究的本质及其哲学基础多样的根源（Bansal等，2018）。第二，已有研究主要探讨实证主义与诠释主义定性研究，较少将社会建构主义纳入比较。实际上，社会建构主义作为重要的哲学范式，对评价定性研究具有重要影响，不应被忽略。第三，以往探讨定性研究可信度的研究只罗列标准，缺乏细节展示，导致学者们仅仅知道要做什么而不知道如何做。鉴于此，本文首先介绍定性方法从社会学、人类学起源，并逐渐影响东西方管理学界的历程，以探明其本源。其次，介绍实证主义、诠释主义、社会建构主义三类范式的哲学基础，提供系统多元的认知。再次，结合三篇管理学领域顶级期刊论文实例，阐释不同范式下提升可信度的具体操作。最后，预测定性研究可信度评价标准的变化趋势，为学界提升定性研究可信度提供具体建议。本文旨在从更长远、更全面、更细致的角度解释“如何评价并提升定性研究可信度”这一疑惑。

二、定性研究的历史沿革

（一）人类学与社会学界的发展

1.起源（1855—1935年）

波兰人类学者Bronislaw Malinowski、法国社会学者Frédéric Le Play以及20世纪初的美国社会学芝加哥学派，都运用定性研究关注当下重要社会单元，并产生巨大影响。Malinowski认为，人类学者应该通过田野调查，抢救未受西方文明污染的“小众文化”，因此选择异域“村庄”作为研究社会的最小单元。1914—1918年，他忠实地记录了自己与新几内亚地区土著共同生活的经历。他依据记录写作的《西太平洋上的航海者》确立了民族志为现代人类学研究方法的范式，奠定了参与式观察的重要地位。

随着人类迈入工业化时代，占据欧洲95%人口的“工薪家庭”取代村庄，成为揭示社会变迁的重要单元。Le Play和同事走访了英、法、俄等国的煤矿矿厂，对300个工薪家庭进行了白描。他们观察每户家庭的物质、社会及精神生活，进行访谈，并向社区权威或熟人确认记录是否准确（Healy，1947）。白描的影响力蔓延至欧洲大部分地区及加拿大（Mogey，1955）。

20世纪初，加速城镇化为美国大城市带来移民，也带来社会问题。芝加哥大学社会学系学者因此将“城市”作为研究社会的实验室（Abbott，1999）。Robert Park作为代表人物，主张学者“拿起笔记本与地图”去结识移民，通过访谈、收集报刊和私人信件，真正理解他们的困境。芝大社会学系通过授课与研讨，将这种案例研究理念传递给Ernest W.Burgess、Everett Hughes等人。他们也相继成为系里的中流砥柱。这群秉持共同研究主张的师生，被称为芝加哥学派，在美国社会学界占据权威地位。案例研究也由此成为美国社会学界首选的研究方法。

定性研究在欧美独立兴起，具有差异。但它们的共同点代表了定性研究的核心，即通过重要的社会单元，探索当下重要社会现象。表1呈现了定性研究起源阶段的异同。

表1 Malinowski、Le Play及芝加哥学派定性研究异同

2.北美社会学界案例研究的危机（1935—1967年）

随着芝加哥学派垄断地位的凸显，以统计方法见长的哥伦比亚大学学者开始提出质疑。1927年，毕业于哥大的William F.Ogburn到芝大担任助理教授，开设统计方法课程，促使芝加哥学派内部产生分歧。1930年，在美国社会学年会上，时任主席Ogburn称，只有运用统计方法验证理论，社会学才是科学。其支持者也开始抨击定性学者违背独立客观原则，且基于特定案例得到的结论不具备可拓展性。

方法论争锋的背后是话语权的争夺。1935年美国社会学年会上，为了表达对芝加哥学派主导美国社会学学会及其会刊AmericanJournalofSociology的不满，哥伦比亚大学学者设立了抵制定性研究的新刊AmericanSociologicalReview（Lengermann，1979）。第二次世界大战期间，定量学者对定性研究的指责（如定性研究难以真正影响政府决策；定性学者应为战争买单）又加重了学界对定性研究的敌意（Rawls，2018）。自此，北美社会学一分为二。一部分学者仍遵循芝加哥学派传统，坚持开展案例研究（如Hughes），成为日后推动定性研究复兴的有生力量。而绝大多数学者则选择了统计方法。此后30余年是以统计检验为标志的定量研究统治社会科学的时代（除了人类学），定性研究少有人问津。

3.扎根理论所代表的定性方法的复兴（1967年以来）

但是，演绎式的定量研究难以构建理论，30余年的发展使得其能够验证的宏大理论也寥寥无几。只有定性研究拥有构建理论的潜力。于是，学者们重燃了定性研究的热情。此时的定性研究已不再满足于描述和理解社会生活，而是希望能够构建理论。Anselm Strauss和Barney Glaser于1967年提出的扎根理论由于“嫁接了实证主义与诠释主义这两种看似矛盾的研究范式”（井润田和孙璇，2021），致力于弥合理论研究与经验研究之间的鸿沟（Glaser和Strauss，1967），极大地拓展了定性研究在理论构建上的生命力（Welch等，2013），被誉为“定性革命”的先声（Denzin和Lincoln，1994）。由于其相对显性的策略以及从定性数据中发展理论的呼吁，学者与专业人士受此鼓舞，纷纷采用扎根理论开展定性研究（Schreiber和Stern，2001）。

扎根理论逐渐演化为三个流派：以Glaser为代表的经典流派，以Strauss与Corbin为代表的程序化流派，以Charmaz为代表的建构型流派（Charmaz，2006；贾旭东和衡量，2020）。经典流派认为，理论完全从数据中自然涌现（Glaser，1978）。程序化流派则认为，合理引入个人经验反而会帮助研究者明确研究议题（Strauss和Corbin，1998）。建构型流派的提出者Kathy Charmaz是Glaser和Strauss的学生，她提出研究者也是研究对象及数据的一部分，通过与他人的思想观点和行为实践互动构建理论（Charmaz，2006）。扎根理论受到认可，逐渐成为社会科学领域中应用最广泛的定性方法（Denzin和Lincoln，1994）。Denzin和Lincoln（1994）更直接表示，“当我们剥开众多定性研究的话语表层，就会发现Strauss方法的特征赫然其中”。可见，扎根理论尤其是程序化流派对定性研究影响之深远（贾旭东等，2018）。

（二）在西方管理学界的发展

定性研究在北美与欧洲管理学界的发展呈现差异。在北美，定量占据主流，定性不懈复兴，才逐渐获得认可；而在欧洲，定性的多元传统则得到相对妥善的保护。

1.在北美管理学界的发展

第二次世界大战后，北美定量研究“一直在知识生产上占据垄断地位”（van Maanen，1979），定性研究则处于边缘，“定性—定量鸿沟”也一直存在，直到1979年John van Mannen在AdministrativeScienceQuarterly（后简称ASQ）开设专刊才有所转变。专刊主张，定性研究能够帮助学者从更多来源获取洞见，并刊载了Henry Mintzberg等学者共13篇研究论文，倾力介绍管理学界较少使用的民族志、话语分析等方法，还充分讨论了定性与定量方法兼容的可能性。

即便如此，定性与定量的角力并未消失（Bluhm等，2011；Pratt，2008；Rynes和Gephart Jr，2004）。在上述专刊中，定量学者Matthew Miles在尝试定性研究后，认为其从数据收集、分析到结果汇报都不够客观，本质还是讲故事（Miles，1979）。Robert K.Yin逐一回应，解释如何通过标准化的操作保证案例研究的科学性（Yin，1981）。类似争论于1996年管理学会年会上演化为一场尖锐的冲突。定性学者控诉，定量学者把持了绝对的话语权，严重挤压定性学者的生存空间；而定量学者则认为定性学者过分敏感、过于极端（Lee，1998）。

直到近十年，定性研究才重新获得认可（Bansal和Corley，2011）。Yin引入心理学的实验思想，撰写了翔实的案例研究操作指南（Yin，1989），削弱了学界对定性方法主观且难以实施的质疑。Kathleen M.Eisenhardt基于扎根理论的“理论敏感性”及理论抽样原则，确立了多案例研究范式（Eisenhardt，1989），强调定性与定量研究应合作而非敌对，即：定性研究构建理论，定量研究验证理论（Eisenhardt和Graebner，2007）。该观点极大地消弭了定量学者对定性研究的敌意。相应地，她的操作方法（比如借鉴实验中的对照组设计，采用变异设计进行理论抽样），也增加了管理学顶级期刊对多案例研究的认同度。

逐渐地，越来越多的学者开始呼吁欣赏并鼓励其他范式的定性研究，如民族志、过程研究等（Frost等，2010；Welch等，2011）。为了与定量学者对话，他们开始阐述研究范式的特征、适用范围及提升严谨性的方法。例如，Gioia等人为了解决针对定性研究严谨性的质疑，基于扎根理论的编码思想，提出“Gioia方法论”，指导如何系统地展示理论构建过程（Gioia等，2013）。与此同时，多本顶级期刊邀请定性学者担任副主编或编委，开辟定性研究的发表空间。大批定量学者（如徐淑英、Thomas Lee）也运用自身影响力提升定性研究地位。2010—2017年，尽管AMJ、ASQ发表的定性论文仅占发表总量的11%，却在年度最佳论文中占50%（王冰等，2018），足以说明北美管理学界已经意识到定性研究的价值。

2.在欧洲管理学界的发展

1982年，当定性方法在北美重获关注后，欧洲管理学顶级期刊JournalofManagementStudies才召开专题研讨，讨论定性研究之于管理学的重要性。学者们探讨了定性研究重获重视的原因（Das，1983），介绍了扎根理论（Turner，1983）、民族志（Fairhurst，1983）等方法，还借机重申定性与定量方法的可兼容性（Fineman和Mangham，1983）。

作为各种哲学思想的发源地，欧洲一直拥有多元的定性研究传统（Bluhm等，2011）。欧洲期刊相较于北美期刊，发表了更多的定性研究，且范式更加多样（Lee和Humphrey，2006）。欧洲各国定性研究发展各异。例如，英国直到20世纪六七十年代才开始使用民族志研究组织（Beynon，1973）；而意大利则有悠久的民族志研究历史（Bruni和Gobo，2005）。

为了保持多样性，欧洲期刊一直批判北美倡导的研究标准化。Joep P.Cornelissen认为，“定性方法在撰写和理论构建方式上越来越模仿定量方法”，将导致管理学理论“枯竭”（Cornelissen，2017）。类似地，Symon等（2018）也表示，研究标准化“形成（不合适的）同质性标准评价定性研究……规训定性学者选择某种特定规范”。他们敦促期刊主编们通过编者按等方式尽力营造具有包容性的学术共同体。

（三）在中国管理学界的发展

定性方法在中国的发展主要受到北美的影响，经历了先抑后扬。20世纪80年代，国内管理学科重建，与北美的交流日趋频繁，定量方法成为主流。90年代，受到北美案例教学的影响，国内管理学期刊陆续出现案例研究雏形，以案例故事和总结思考为主，缺乏方法介绍，也不够严谨规范（毛基业和李亮，2018）。

直到2001年，成思危教授发文探讨案例研究的重要性，国内才逐渐意识到其对理论创新的价值。随后，《南开管理评论》《科学学研究》等期刊开始系统介绍案例研究方法论（毛基业和李亮，2018）。《管理世界》自2006年起专门为定性论文开辟“中国工商管理案例研究”栏目。2007年，中国人民大学和《管理世界》联合主办的首届“中国企业管理案例与质性研究论坛”召开，以会议形式扩大定性研究的影响力，至今已举办17年。论坛一直坚持强调案例研究的学术价值和本土意义，通过提升方法的规范性，增强中国故事的影响力。

其他方法也逐渐走入国内学者的视野。最初，国内更认可Yin与Eisenhardt提倡的多案例研究。随着国际交流的深入、国外顶级期刊的推广，国内也逐渐观察到定性方法的多样性。以扎根理论为例，贾旭东、张敬伟等意识到扎根理论对构建中国管理学理论的独特价值，开始在工商管理领域积极推广扎根理论（贾旭东和谭新辉，2010；张敬伟和马东俊，2009）。贾旭东等学者还结合中国实际，进行扎根理论的本土化探索，提出了“中国管理扎根研究范式”并准备在未来构建“Zhagen methodology”推进中国本土管理研究（贾旭东和衡量，2016，2020）。此外，学者们还将人类学（田广和戴琴琴，2013）、话语分析（吕源和彭长桂，2012）及定性比较分析（杜运周和贾良定，2017）等引入国内，为国内学者构建高质量理论成果奠定了基础。

纵观定性方法的历史沿革，我们发现，时代需求决定了方法特征。一百年前，定性研究在欧美独立发端。不论人类学还是案例研究方法，都源于学者对当下社会重要现象的关注。之后，定性研究方法在东西方的发展呈现不同的状态：北美定性研究方法遭遇危机，定量研究方法占据主导，直到扎根理论助推了定性方法的复兴，定性方法的多样性逐渐受到认可；欧洲多元的定性传统并未受到直接冲击，但也是在北美定性方法复兴后，才逐渐获得重视；而中国受到北美影响更深远，近年来才逐渐认可定性方法多样性。当下中国，涌现了大量优秀的、复杂的本土管理实践，亟待学者采用多元的定性方法构建中国特色管理学理论。扎根于中国的管理学理论若要获得更大的影响力，学者们必须重视定性研究的可信度。那么，定性方法多元的根源是什么？不同方法评价并提升可信度的具体操作是什么？这都需要深入哲学基础进行探索。

三、定性研究可信度评价标准

（一）哲学基础

可信度的评价涉及价值判断，体现人们如何理解存在（being）与知识（Esterby-Smith等，2015）。我们有必要追问：科学家如何理解世界、理解知识、创造知识？社会科学与自然科学是否相同？定性学者与定量学者区别何在？科学哲学所关注的本体论、认识论以及方法论，就旨在回答上述问题（Okasha，2002）。

本体论关注现实的本质（Risjord，2014）。对社会科学学者而言，争议的焦点在于：社会科学在本质上是否与自然科学相同（Blaikie，2007）？基于不同立场，社会科学学者大致持有三类本体论：内部实在论（internal realism）、唯名论（nominalism）以及相对论（relativism）。内部实在论认为存在唯一现实即真理，但研究者无法直接触达（Putnam，1987）；唯名论认为现实仅仅是人们通过语言与话语创造出来的（Cunliffe，2011）；相对论居中，认为并不存在唯一等待发现的现实，不同的人对现实拥有不同看法，真理是学者们讨论后形成的共识（Latour和Woolgar，1979）。

认识论探讨知识的本质，是对探寻现实本质最优方式的假设（Esterby-Smith等，2015）。与上述三类本体论对应的认识论分别为实证主义（positivism）、诠释主义（interpretivism）以及社会建构主义（social constructivism）。实证主义认为研究者应价值中立，独立于研究对象，通过演绎（deduction）验证因果关系从而提出人类社会行为中的普遍规律（Comte，1853）。而诠释主义认为研究者应秉持某种价值取向，与研究对象深度交互，通过归纳（induction)）挖掘研究对象认知的世界（Habermas，1970）。社会建构主义认为，研究者既应承认个体体验，也不应忽视客观存在，倡导通过溯因（abduction）形成共识性解释（Ernst，1996）。学者运用何种方法论研究取决于他们的本体论和认识论。以Yin与 Eisenhardt为代表的案例研究属于实证主义范畴，民族志属于诠释主义范畴，扎根理论属于社会建构主义范畴（Esterby-Smith等，2015）。

为了明确不同哲学基础对方法的影响、呈现研究者对提升可信度的最新理解及高标准执行，本文尽可能地选择了3篇最新发表的管理学国际顶级期刊论文作为例文（见表2）。

表2 所选例文具体信息

（二）实证主义定性研究可信度评价标准

实证主义定性研究可信度的评价标准包含构念效度（construct validity）、内部效度（internal validity）、外部效度（external validity）与信度（reliability）（Yin，2014）。本节将结合Ott和Eisenhardt（2020）的论文（即例文1）进行解读。

1.构念效度的涵义及示例

构念效度指测量准确反映构念内涵的程度（Yin，2014）。提升构念效度主要通过数据收集和分析实现。首先，在数据收集上，研究者应从多种来源收集数据。例文1使用了四种数据来源，包括“与高管的访谈、媒体和公司档案材料、与深度参与战略形成的其他对象的访谈（如投资人）、非正式邮件以及电话”，通过三角验证确保“测量更准确”（Ott和Eisenhardt，2020）。

其次，在数据分析上，研究者应该将数据与已有文献进行反复比对，在斟酌微调后形成准确的构念定义，最终形成清晰合理的构念，并与数据本身相匹配。例文1专门辟出一节阐述其研究的核心构念——战略构建的内涵（Ott和Eisenhardt，2020），体现了定义准确和证据链清晰。（1）作者通过与已有文献的比对，强调该文对战略构建的定义与已有文献是一致的；（2）作者通过对不同案例数据的比较分析，提炼出测量该构念的方式；（3）多位研究者独立分析且结论一致，符合实证主义“世界是客观的”的本体论（Esterby-Smith等，2015），从侧面印证构念内涵能够反映数据本身。

2.内部效度的涵义及示例

内部效度指测量因果关系的可信度（Cook和Campbell，1979）。首先，在数据收集上，通过收集多视角数据、研究框架外数据及过程数据来增强数据的完备性与准确性。

（1）多视角数据：例文1收集4轮访谈数据，不仅访谈的焦点会随着核心构念的推进而变化，还会访谈所有与该构念相关的对象；兼顾了回顾与实时数据，提升了准确性。此外，作者还采用了嵌入式设计，即包含多个分析单元，确保多视角收集数据。

（2）研究框架外数据：例文1 “从企业初创期开始收集数据可以避免遗失事件的时间信息，即‘左删失’，从而增强因果推理”（Ott和Eisenhardt，2020）。同时，他们还扩大数据收集的范围（如企业高管社交媒体数据），确保数据完备；并且格外注意“凸显因果性”的意外事件（Ott和Eisenhardt，2020）。

（3）过程数据：研究者跟随事件进程收集数据，增强内部效度（Leonard-Barton，1990）。例文1通过4轮各间隔7～9个月的访谈关注了核心构念的丰富内涵。长时间跨度且不间断收集数据的方式充分体现了该研究对研究对象变化的关注。

（4）配对抽样：配对抽样类似实验设计中的控制组与自然组抽样，指研究者在抽样时控制非研究关注因素，而对研究关注因素尽可能扩大差异。其主要作用是在对比分析中排除非研究关注因素的影响，让案例间差异聚焦在研究关注因素上，从而得出有意义的结论。配对抽样能很大程度排除竞争性解释，是Eisenhardt多案例研究的突出特点。同时，配对抽样与实验研究方法的相似性，能增加定量学者对实证主义定性方法的认可。例文1运用了配对抽样。作者最终抽取的6家案例企业，分为三组，每组内的两家企业在成立时间等非研究关注因素上完全一致，但在是否构建了有效的战略（研究关注因素）上却结果迥异。

其次，在数据分析上，学者需要关注构念及因果关系的可重复性，并排除竞争性解释。具体操作为模式匹配和解释构建。针对模式匹配，例文1 “通过数据涌现出的模式尝试形成构念与构念间关系”，并在“组内、组间、案例间”不断进行复制对比，以确保精准匹配（Ott与Eisenhardt，2020）；针对解释构建，例文1提到不仅要从数据和认知逻辑中构建理论，“扎根于认知过程、案例证据以及逻辑获取理论观点”，也要与已有相关文献比较，“深化理论解释”，增强对理论模型的信心（Ott与Eisenhardt，2020）。

3.外部效度的涵义及示例

外部效度定义了研究结论能拓展的范围（Cook和Campbell，1979）。Yin指出，在评价定性研究的外部效度时，应关注“分析可拓展性（analytical generalizability）”而非“统计可拓展性（statistical generalizability）”（Yin，2014）。前者是指，案例研究的结论能够在类似案例情境下重复出现（Eisenhardt，1989）。在实证主义定性研究中，提升外部效度依然需要从数据收集和分析两方面努力。首先，在数据收集上，学者应采用多案例研究并且强调案例数量满足“理论饱和”条件。例文1表示“采用多案例研究是为了构建更具可拓展性的理论”。因此，所选案例分布在不同行业，增强结论在不同行业的可拓展性。

其次，在数据分析上，学者应提升结论在多个案例中的可复制性。例文1通过跨案例分析增强外部效度。每个案例配对组间的差异使结论能够在不同条件下复制，加强了构建理论的可拓展性。

4.信度的涵义及示例

信度指研究操作的可重复性（Yin，2014）。首先，在数据收集中，学者需要尽可能详细地记录数据收集和分析过程，如展示访谈提纲、详尽描述研究过程等。例文1就详细记录了研究问题的变化。作者最初并不关注战略构建有效性。但随着研究深入，他们发现无法有效构建战略的企业都失败了。为了能构建更贴近企业现实的理论，他们调整了研究问题以及访谈重点（Ott和Eisenhardt，2020）。

其次，在数据分析上，学者往往通过数据分析表提升信度。例文1在提出核心构念（战略构建）时，就在数据分析表中详细呈现了每家企业不同维度的“战略构建”原始数据，帮助读者清晰地观察到“从数据到构念”的过程。例文1还有多个类似的数据分析表，呈现了数据分析与抽象过程。表3总结了实证主义定性研究可信度的评价标准及具体操作。

其他学者也就如何提升实证主义定性研究可信度提出了观点。其中，潘善琳团队的SPS（structured-pragmatic-situational）案例研究方法具有一定的影响力。该方法提出了一系列结构化、实用性强且能够针对不同情境灵活调整的研究流程，细节拆解提升可信度的操作（潘善琳和崔丽丽，2016）。比如，为了让“模式匹配”更结构化、更具实用性、更符合情境，SPS提出了一系列分析逻辑：以案例中具有鲜明特征部分作为切入点的特征逻辑（潘善琳和崔丽丽，2016）、通过类比得出关键发现的类比逻辑（Du和Pan，2013）、侧重分析案例主角重要活动的组件逻辑（Tan等，2015）、从研究对象的发展过程切入的流程逻辑（Huang等，2014）等。

（三）诠释主义定性研究可信度评价标准

诠释主义学者主张 “在特定情境中考察人类的生命体验”（Armstrong，2010；Lincoln和Guba，1985），采用下列指标评价相应研究工作：可信性（credibility）、可转移性（transferability）、可靠性（dependability）、可证实性（confirmability）（Lincoln和Guba,1985；Pratt等，2020）。本节将结合de Rond和Lok（2016）的论文（即例文2），对上述四个维度进行解读。

1.可信性的涵义及示例

可信性指研究者重现研究对象所感知现实的程度（Lincoln和Guba，1985），包含两个重要维度：第一，研究者是否尽量提升研究结论可信任的程度；第二，研究者是否设法向读者证明这一点（Golden-Biddle和Locke，2007；Lincoln和Guba，1985）。可信性与内部效度都关注研究结论是否真实。区别在于，诠释主义认为的真实是研究对象感知的真实，实证主义认为的则是客观存在的真实。诠释主义学者通过数据收集和分析提升可信性。首先，在数据收集方面，提升可信性包括长期参与（prolonged engagement）、持续观察（persistent observation）及三角验证。

（1）长期参与指研究者通过充分了解研究对象所处的文化、社会情境，拓宽研究广度（Lincoln和Guba，1985），有助于被研究者建立对研究者的信任，提升研究者获取信息的价值。例文2中，de Rond进行了长达16个月的深度调研，尽可能了解研究对象所处情境，如与医护团队一起参加执勤前培训、在培训期与医护团队成员外出吃饭喝酒、跟随医护团队赴阿富汗执勤。这16个月正式与非正式社交建立了医护团队对他的信任，使很多医护向他倾诉个人经历、情感及所思所想。

（2）持续观察指研究者一直关注与研究现象相关的事件，保证研究深度（Lincoln和Guba，1985）。例文2关注情境在战争心理损伤中的角色，因此，de Rond一直观察医护团队成员的内心痛苦及相关事件与情境。即便某些特殊状况下难以用语言进行交流（如医护人员紧急救治伤员），他也通过拍摄上千张照片观察医护工作状态。照片蕴含丰富的信息，有利于在事后“涌现新数据”（de Rond和Lok，2016）。

（3）三角验证指通过不同来源的数据互相验证，确保数据准确性。例文2中，de Rond在执勤期前、中、后三个阶段，在伦敦、阿富汗各处，针对外科医生、护士、工作人员等，收集了参与式观察、访谈、照片、医疗记录、研究对象撰写的报告与诗歌及推荐的书籍等多类型的数据。

其次，在数据分析方面，学者通过同侪核验（peer debriefing）、成员核验（member checking）以及偏差（deviant）案例分析等方式提升可信性。同侪核验指研究者初步分析数据后，向其他研究者介绍并获取反馈。例文2中，Lok的角色正是同侪核验。他“反思性地质疑、提问从数据以及数据解读中涌现出的洞见”，区分de Rond个人体验和研究对象体验（de Rond和Lok，2016）。同时，基于de Rond详细的数据资料，Lok也独立编码，形成理论见解。成员核验指研究者将对数据的解读提供给信息提供者，并寻求他们的反馈。偏差案例分析指研究者基于驳斥已有分析结论的案例资料进行再分析，重新解读数据。例文2并未提及成员核验及偏差案例分析。

2.可转移性的涵义及示例

可转移性指读者基于研究者对情境的充分描述判断研究结论在其他情境的解释力（Lincoln和Guba，1985）。诠释主义学者认为，他们的职责仅在于提供充分、翔实的情境与案例描述。读者根据描述判断研究结论是否具有可转移性以及在哪些情境中具有可转移性。为此，评价可转移性的重点是研究者“深描”（thick description）的程度。

首先，在数据收集方面，学者需要透彻、生动、丰富地展现研究情境，不仅需要凸显情境特点，还应细致描述研究者在研究过程中的角色与经历。例文2中，作者以具有冲击力的图片与生动的文字叙述为镜头，带领读者进入巴斯营地，聚焦营地的战地医院，让读者迅速贴近战争。为了凸显巴斯营地的重要性，例文2引用前英国首相布莱尔的公开讲话“这是一片非同寻常的沙漠，此地将决定21世纪初世界安全的命运”（de Rond和Lok，2016）。此外，例文2用必胜客与肯德基组合集装箱的图片说明该营地虽地处阿富汗但拥有英美内核。类似地，在描述战地医院时，例文2通过翔实的数字（输血量、伤亡数量、其中儿童占比等）以及因炸伤而截肢的士兵照片凸显战争的残酷，通过生动的形容词展现医护团队生活现状（如休息室里“早已过期的报刊”和“过度使用的咖啡机”），使读者理解战争、与医护人员共情（de Rond和Lok，2016）。

其次，在数据分析方面，学者应对案例深描，展示而不是仅仅讲述。具体方法包括：运用清晰易懂的语言展现数据的真实变化，体现数据质感；审慎选择、逐字逐句引用访谈对象的原文，体现数据真实（Lincoln和Guba，1985）。通过描述与医生的对话、战地医生的诗，例文2将这些个体遭遇的痛苦剖开，向读者展示战地医护团队感受到的徒劳（futility）与荒诞（surreality）。这不仅帮助读者与研究对象共情，也促使读者思考个体产生痛苦的原因。接着，例文2展示了现实与医护团队的职业情境、组织情境与文化情境间的不和谐，告诉读者情境对产生心理创伤的直接作用，解答读者疑问。随后，在理论构建中，例文2又结合图片、叙述与实例展示了医护人员应对心理创伤的方式。这些方式也依赖于每个人所处的情境。案例的展示逻辑与de Rond进入情境后的思维逻辑一致，背后的真诚得以说服读者。同时，例文2也谨慎选择了合适的数据证据，通过丰富细节加强读者信任。例如，荒诞是一种难以言明的心理感受。为帮助读者理解“为何医护人员会感到荒诞”，例文2选择了医护人员的三段离奇经历。其中，一个战地护士回忆，复活节时医院收治了一位双腿截肢的伤员，他负责将伤员的腿送到焚尸炉，在路上与一位戴着兔耳朵拿着复活节蛋的护士擦肩而过。这个简单有力的细节迅速构筑了读者心中“荒诞”的内涵。

3.可靠性的涵义及示例

可靠性指数据跨时间、跨条件下的稳定性（Lincoln和Guba，1985）。信度是效度的前提，可靠性也是可信性的保障。在数据收集上，主要依赖细致描述所收集数据的变化及其原因保证可靠性。例如，例文2提到之所以最后收集并阅读《陆军野战医院》等书籍，是因为执勤多次的医护人员认为这些书籍最贴近他们在战争中的经历。

在数据分析上，则主要依靠调查审计（inquiry audit）确保可靠性。我们可以将研究者和数据审计者的关系类似财会人员和审计人员的关系。财会人员根据真实情况形成报表，审计人员根据相关记录审核报表。同样，诠释主义学者通过引入其他学者核实已形成的数据收集、分析过程的记录，提升可靠性。例文2提供了详尽的研究过程记录，使得审稿人、编辑和读者都可以作为数据审计者评价研究的可靠性。

4.可证实性的涵义及示例

可证实性是研究客观性的体现：确保研究结论扎根于研究情境和研究对象，而不是由研究者创造的（Guba和Lincoln，1989）。在数据收集上，主要通过三角验证以及自反性（reflexivity）提升可证实性。三角验证已在可信性部分详述。自反性指研究者应清醒地意识到自己对研究的潜在影响。定性学者深入研究情境，不可避免影响研究对象。诠释主义学者认可影响存在，指出研究者需清楚了解这些影响，确保研究结论贴近真实。确保自反性的措施是记录日志，提醒研究者发生了什么及当下的价值判断。例文2提到de Rond会记录“自己的经历、焦虑与反思”，同时也指出“援引这些记录将自己置于研究情境中，展示自己和医护团队人员对每天经历的战争的感受和思考”（de Rond和Lok，2016）。

在数据分析上，可以通过逐步展示数据分析过程及背后原因，体现可追溯性。例文2详细地介绍了数据分析的结果及决策缘由。例如，作者最初总结了在战争中医护团队成员工作和生活中的五类痛苦（恐怖、矛盾、徒劳、陌生、无聊），经过抽象和提炼，最终形成三大类痛苦（无谓、徒劳、荒诞），接着指出了如此抽象的原因。除此之外，还可以通过研究者复核提升可证实性。例文2中，Lok就承担了这一职能。表4总结了诠释主义定性研究可信度的评价标准与具体操作。

表4 诠释主义定性研究可信度评价标准与具体操作

在诠释主义范畴下，Gioia方法论也具有相当的影响力（Gioia等，2022）。他与同事们提出了一套系统的、归纳式的构念提炼和理论构建方法，便于读者更认可研究者重现的研究对象感知的现实（即“可信性”）（Gioia等，2013）。该方法核心在于：在数据分析过程中，“假设研究对象与研究者都知道自己在做什么，并能够解释自己的想法与行为”，给予双方充分的发言权，并以可视化的“数据结构图”呈现（Gioia等，2013）。在一阶分析中，研究者以研究对象的话语体系对数据编码，在不进行任何抽象提取的情况下，让一阶概念充分涌现（Gioia等，2013）。研究者再去探寻一阶概念的异同，合并一阶概念至可管理的数量。二阶分析中，研究者针对一阶概念追问：“理论上，这在发生什么？”并基于理论基础与洞察将一阶概念抽象为二阶主题及更深层次的理论整合维度。当不同研究者分析不同时，研究者应重新讨论原始数据并最终达成一致。

（四）社会建构主义定性研究可信度评价标准

已有研究在评价社会建构主义定性研究时，一般沿用诠释主义的标准。本文为进行更细致的区分，选择以隶属于社会建构主义范畴的扎根理论研究为例，解读社会建构主义定性研究可信度的评价。扎根理论的提出者明确“欢迎读者以自己的方式灵活地使用扎根理论”（Charmaz，2006；Glaser和Strauss，1967）。因此，扎根理论研究可信度并不存在唯一公认的评价标准。本节结合Powell和Baker（2017）的论文（即例文3）对经典流派提出的可信性（credibility）和实用性（pragmatic usefulness）两个维度进行解读。

1.可信性的涵义及示例

可信性指研究结论系统、合理、准确地反映真实本质的程度（Glaser和Strauss，1967）。研究者往往通过数据收集、写作修辞、自身信念三方面提升可信性（Locke，2001）。

首先，在数据收集方面，学者应进行理论抽样确保充分的比较，同时也要通过多来源收集足够数据确保较强的数据密度。理论抽样指正在构建的理论决定了下一步该收集的数据（Suddaby，2006）。例文3强调了研究设计中的“理论抽样”（Powell和Baker，2017）。同时，由于例文3关注的是多创始人在创业初期的组织工作，因此当案例企业出现合并、解散等新的组织工作时，作者也依据理论抽样的原则，持续关注这些变化，并将合并后又解散的企业也纳入案例企业范畴。例文3也通过多来源收集足够的数据，在详细列举数据来源（直接观察、参与式观察、访谈以及文档、邮件等二手资料）外，还标注出收集每种数据的时间、相应的数量及作用（Powell和Baker，2017）。其中，作者提到花费722小时进行直接与参与式观察，形成了上百页田野笔记，体现了丰富的数据量。

其次，在写作修辞方面，学者一方面应注重提升理论概念的质量（即构建敏感性概念），另一方面也需要注重写作的方式。（1）敏感性概念自然生成于研究对象，帮助研究者领会人们为周围世界赋予的意义，能够“在使用者处理实际生活时，给予其一种参考感与方向感”（Blumer，1954）。换言之，合理的敏感性概念包含研究对象解释其世界的语词和想法。这一点在例文3中得到充分的体现。例如，“强调共性”（emphasizing commonalities）这个理论概念就来自于研究对象解释其世界的想法。案例企业Batik的联合创始人Jack认为新的创始人团队即便拥有不同的视角和兴趣，也仍然是“一群思想相似的人组成的社群”（Powell和Baker，2017）。其他理论概念也体现了这一特征。（2）注重写作方式指应以生动的方式向读者展示而非讲述理论观点或模型，同时应协助读者理解理论模型。生动指读者在理论模型的帮助下“几乎能够看见或听到研究对象”（Glaser和Strauss，1967）。为此，例文3每提出一个观点，都会在之后以实际故事或话语细节佐证。在协助读者理解理论模型上，Glaser与Strauss的建议是先向读者预示理论，再细致阐释，最后进行总结（Locke，2001）。例文3在阐述研究结论时也采用了这种方法。例文3关注的是多创始人的初创企业的组织认同与组织工作，因此作者在介绍结论前用相当篇幅介绍了“集体认同原型”这一对后续理论构建非常重要的构念及其内涵、分类等，并以访谈数据对构念进行解释，使读者了解必要的背景知识。在结论部分开头，作者也首先展示了他们构建的过程模型，并对过程模型的每个阶段进行了简要解释，再分节分段细节展示过程模型中的概念。这种方式尊重读者的认知习惯与基础，增加了读者理解理论模型的可能性。

最后，自身信念指研究者本身也应相信研究结论与理论模型。扎根理论认为，研究者也与研究情境交互，也能体验和感知研究对象的世界，因此也会相信理论模型（Glaser和Strauss，1967）。例文3中，作者在谈及为何选择认同视角进行理论构建时，向读者展示了田野笔记，称“他们何时能够停止谈论自己，开始去做点什么！”（Powell和Baker，2017）。这样的记录表明他们不理解为什么所访谈的创始人一直不厌其烦地表示自己是希望帮助别人的人。直到在随后的数据收集和分析中，作者才发现，这些创始人即便有很多的不同，但面对其他创始人谈论自己打算如何帮助别人时，都展现了惊人的包容。通过这个过程，作者也让读者相信他们自身也认同视角的合理性。

2.实用性的涵义及示例

实用性指读者（包含专家与外行）进入相同场域后能够运用研究结论的程度（Glaser和Strauss，1967）。提升实用性在于：理论模型与现实的匹配（fit）、可懂（understandable）、通用（general）以及可控（control）（Glaser和Strauss，1967）。

首先，匹配体现在理论与数据严丝合缝（Locke，2001），即“理论概念能够适用于数据，且被数据表示”（Glaser和Strauss，1967），通过持续比较实现（Glaser和Strauss，1967）。例文3中，作者正是通过比较创始人希望帮助他人这一相同点背后的不同，形成了两个对比的理论构念：一类创始人希望帮助“与我们连接的社群”；另一类创始人希望帮助“独立于我们的社群”（Powell和Baker，2017）。在形成上述构念之后，当再次发现有关创始人希望帮助何种社群的信息后，作者会将其与上述构念比对，并最终明确构念。

其次，可懂体现在与该领域相关的外行群众也能够理解理论模型（Locke，2001），即确保可信性中提到的“构建敏感性概念”。

再次，通用指理论模型也可以拓展至其他不同的条件和情形（Locke，2001）。这要求研究者在抽样时就考虑到。例文3中，Powell和Baker（2017）就明确表示样本“支持有意义的跨案例比较检验差异”。他们的9个案例，在组织工作（研究核心焦点）、对行业的预期等方面存在差异，便于拓展理论模型。

最后，控制指理论模型应帮助使用者对其遇到的情形具有控制力（Locke，2001），往往通过实践意义呈现。例文3中，作者写道，“如果深层且隐蔽的身份认同过程会影响初创企业的发展，那么这些创始人在出现冲突之前关注到这一过程可能是有用的。本研究开发的衡量创始人社会认同的工具就是有用的”（Powell和Baker，2017）。表5总结了社会建构主义定性研究可信度的评价标准与具体操作。

表5 社会建构主义定性研究可信度的评价标准与具体操作

Strauss和Corbin（1998）及Charmaz（2006）提出的标准本质相同，但更加具体。程序化扎根理论研究评价维度包括研究过程与经验基础。前者关注“基于何种原因、如何抽样？”“浮现的理论构念及其证据？”以及“理论构念间关系是什么？”等；后者则关注“概念是否具有系统性关联？”“理论构念是否具有概念密度”等（Strauss和Corbin，1998）。建构型扎根理论研究评价标准在经典流派提出的可信性与实用性两个指标基础上，增加了原创性与共鸣性两个维度。前者关注“理论构念是否新颖？”“分析是否对数据进行了全新的概念性呈现？”以及“研究如何挑战、拓展现有想法、概念或实践？”等；后者关注“理论构念是否刻画了研究对象的全貌？”“是否将个体生活与更大范围的集体或机构构建了联系？”以及“研究对研究对象或处于研究情境中的人们产生意义？是否为他们提供了更深的洞见？”等。

对比三类哲学范畴下定性研究可信度评价标准发现（详见表6），即便评价方式存在差异，但内核相似，如都非常关注构建理论的可推广性。只是三者的命名和理解不同。实证主义学者称为外部效度，关注研究结论适用于类似案例情境的程度，强调客观状态；诠释主义学者称为可转移性，关注读者基于研究者的深描判断研究结论适用其他情境的程度，强调读者感知；社会建构主义学者称为实用性，关注研究者和读者进入与案例类似情境后对其控制的程度，强调读者、研究者、情境的交互。本文认为，研究者都希望研究能够真实且解释力强，哲学基础的差异只决定研究者理解真实、提升解释力的方式和重点不同。

表6 三种哲学基础范畴下定性研究可信度评价标准的异同

四、结论与展望

定性研究对“讲好中国故事”的重要性越发凸显。准确理解并评估定性研究可信度具有关键意义。本文希望通过回溯定性研究历史、分析并讲解定性研究评估标准、预测未来趋势，解开定性研究学者对方法的困惑，搭建与定量学者沟通的桥梁，最终共同构建管理研究学术共同体，从而为提出中国管理学理论、在世界舞台发出中国声音贡献力量。

本文概述了定性研究发展历史，解读了三种不同哲学基础的定性研究的可信度，同时运用国际顶级期刊的相关论文，生动阐释了评价并提升实证主义、诠释主义和社会构建主义的定性研究可信度的标准和具体操作。不难看出，有别于定量研究可信度的可复制逻辑，定性研究可信度评价标准是多元的。实证主义定性研究的可信度评价标准类似于定量研究，主要来源于构念效度、内部效度、外部效度和信度；诠释主义定性研究的可信度评价标准则主要体现在可信性、可转移性、可靠性和可证实性；社会构建主义定性研究的可信度评价标准主要包括可信性和实用性两个方面，程序化和建构型扎根理论又在可信度评价上具有相应的独特性。对这三类哲学基础下的定性研究的发展、定位和评价标准的系统性介绍，以及论文实例的细致解读，能够更清晰地让学者们认知并把握可信度的内核。

而学者们认知的提升将会对中国定性研究的发展起到重要作用。目前，学者们对定性研究的认知程度参差不齐。具体体现为：（1）少部分学者认为只有诠释主义定性研究才能加深对社会的理解，才能体现定性研究与定量研究的本质区别。AMJ近3年发表的定性研究论文中多数为诠释主义定性研究。（2）大部分学者对定性研究的评价标准只有模糊感觉，无法运用标准评价特定研究的质量。这也是本文希望结合实例阐释定性研究可信度的初衷。（3）仍有极少数学者对定性研究持怀疑甚至敌对态度，坚信只有具有可拓展性的研究才是有意义的。

针对学者迥异的认知程度，本文在对不同哲学基础定性研究可信度评价标准的比较的基础上，提出以下对策。首先，定性研究学者应该更真诚地面对研究对象与读者。通过比较，本文发现“研究是否真实地反映现实”是三类哲学基础下定性研究都非常关注的问题。而区别仅仅在于大家对“如何真实地反映现实”存在不同理解。近两年，国际顶级期刊在发表定性研究论文时，也开始逐渐要求研究者更真实地展现研究方法设计与执行过程中细节。例如：Wei和Clegg（2020）论文的哲学基础是实证主义，但在第三部分“方法”中，作者详尽地描述了案例所处的情境、数据收集和分析的具体过程、三角/交叉验证的具体作用等。这些都是曾经实证主义定性研究论文不需要详细描述的。可见，不论哲学基础如何，增加细节展示、更加真诚地面对读者已经成为提升定性研究可信度不可或缺的方式。

其次，定性研究学者仍然应该尊重不同的哲学基础，在研究过程与写作中体现哲学基础的一致性。历史沿革让我们了解每种研究方法都有其产生的历史原因、所擅长研究的对象以及研究过程中的侧重点。如果在使用方法的过程中抛弃这些特点，就可能泯灭这个方法的优势。例如，民族志由于其贴近研究对象的数据收集方式，最早被用来研究“小众的”异乡文化（如Malinowski对新几内亚土著的研究），后来逐渐演化为用于探索不熟悉的场域（如de Rond和Lok对战地医生战争创伤的研究）。因此，我们在运用民族志进行研究时，应该明确这种方法更适用于探索非常规的、对于大多数读者而言陌生的文化，而不是大多数读者熟悉的场域。因此，在民族志研究写作中需要关注情境的深描，这样才能帮助不熟悉的读者加深对研究对象和情境的理解。情境化也因此成为在运用定性研究方法探索发展中国家商业现象时的重要考量（Plakoyiannaki等，2019）。

最后，本文建议，期刊编辑与审稿人应理解不同哲学基础下评价定性研究的标准，放下偏见，拥抱多元。只有这样，编辑才能为研究定位合适的审稿人，审稿人的心态才能更加开放，提出建设性意见。定性学者与编辑、审稿人拥有相同的认知基础，才能促进学术共同体更有效、更良性地运转，推动中国管理学界提出扎根中国实践、解决中国问题的管理学理论。

定性研究可信度释疑——从历史沿革与哲学基础谈起

一、引 言