刑事案件中准绳问题测试的测谎准确率

2019-07-12 06:51孙振玉张帆张飞霞罗蓉毛远毅胡泽卿顾艳
法医学杂志 2019年3期
关键词:测试人员结论违法

孙振玉,张帆,张飞霞,罗蓉,毛远毅,胡泽卿,顾艳

(1.四川大学华西基础医学与法医学院,四川 成都 610041;2.成都市公安局刑警支队,四川 成都 610000)

自1980年测谎技术引入我国以来,已经在案件侦查、反腐、保密筛查等领域得到了广泛应用。准绳问题测试[1](Control Question Test,CQT)是根据测试中受试者在回答准绳问题和相关问题时对应的生理指标的变化,判断其在回答相关问题时是否说谎,以达到识别犯罪、排除无辜的法律目的。但CQT的测谎准确率一直都是学术界和法律实务部门争论的焦点。

CQT测谎的准确率受到测试过程中许多因素的影响,既往对测试准确率的影响因素研究没有在实际案例中得到验证[2]。部分研究者[3]研究了民事欺诈和刑事诈骗案件中的测谎准确率,但样本量仅有27例和41例,很难反映不同种类刑事案件中CQT测谎准确率的差异。

目前,对实际案例的测谎准确率研究存在“金标准”和“银标准”两种研究方法[4]。“金标准”是法院对于案件的审理判决结论。MANGAN等[5]以受试者口供代替判决结论作为印证测谎结果的标准进行准确率的研究,而HONTS等[6]指出由于嫌疑人的口供主观性较强,明显存在印证依据的缺陷。“银标准”是以色列学者AVITAL GIONTON创造出的一种非标准化的测谎准确率研究策略。“银标准”仅在对案件的案情特点和证据材料的要求上与“金标准”存在部分差异[7-8]。

本研究以真实的刑事案件为基础进行回顾性研究,用办案单位的侦查结果印证测谎结论,在极为贴近“金标准”的情况下计算CQT法的准确率,在符合“金标准”条件的真实案例中分析不同受教育程度的受试者之间、不同违法类型的受试者之间的CQT测谎准确率是否存在差异。对两组数据进行整合,在最大程度上利用能够利用的案例,计算出CQT在刑事案件测试中的准确率。

1 对象与方法

1.1 研究对象

2006—2016年在成都市公安局心理测试中心进行心理测试的刑事案件。

纳入标准:(1)经侦查确证案情属实。(2)受试者自愿接受测试。(3)受试者生理状态正常且无精神疾病或高血压、心脏病等可能影响测试指标的疾病。(4)受试者人口学资料完整。(5)现有证据材料能够证明测试所涉情节,确定对每个受试者测试结论的正确与否;或能够证明案件只存在两个在测试所涉情节的供述完全相反的嫌疑人,且其中必有一人作案。(6)涉案人员均接受了CQT,测试图谱波形清晰稳定、测试结论明确。

按照纳入标准,共筛选出57起案件的104名受试者。对本次纳入的案例按受教育程度分为受教育程度≤6年(小学及其以下)、>6~9年(小学以上,初中及其以下)、>9年(初中以上)3组。

对本次纳入的案例按违法类型分为暴力违法组和非暴力违法组。暴力违法组55人,主要涉及杀人、故意伤害、强奸、抢劫等存在暴力手段的案件。非暴力违法组49人,主要涉及盗窃、诈骗、职务侵占、行贿等无暴力手段存在的案件。

1.2 研究方法

按参考文献[7]的研究方法选择4位测试经验丰富的测试人员对本研究中的受试者进行测试。其中1号测试人员为男性,侦查专业,从事测谎工作18年;2号测试人员为女性,侦查专业,从事测谎工作11年;3号测试人员为男性,医学专业,从事测谎工作6年;4号测试人员为女性,心理学专业,从事测谎工作9年。4位测试人员的评分者间信度在0.8以上。

使用DataPac_USBTM数据获取系统(加拿大Limestone Technology公司)采集受试者的各项生理指标:呼吸(呼吸暂停、呼吸频率变化、呼吸强度变化)、皮肤电(强度变化、持续时间)、血压。所采用的编题方法为CQT。

测试过程如下:

(1)测试人员熟悉案情,根据侦查需要确定测试要点(作案手段、作案工具、作案地点等)。

(2)进行测前谈话(包括了解受试者的基本信息,征得受试者的同意,向受试者介绍测试的原理),编制测试问题。

(3)在测试过程中采集皮肤电、胸式呼吸、腹式呼吸、血压变化,得到测试图谱。每个受试者均重复3次测试,每一次测试得到一张图谱。

(4)对图谱评分,得出测试结论。如果受试者在回答准绳问题时的生理指标比在回答相关问题时反应更强烈,得正分,表示诚实;如果在回答相关问题时比准绳问题反应更强烈,得负分,表示撒谎。如果准绳问题和相关问题之间具有非常显著的差异,那么评分为±2;如果二者之间具有较大的差异,评分为±1;如果二者之间没有明显差异,评分为0[4]。根据KIRCHER等[9]评分规则,对3次测试图谱的评分求和,总分大于+6分表示诚实,总分小于-6分表示撒谎,总分介于+6分和-6分之间表示无法得出结论。

(5)用侦查结论对测试结论进行印证,结论分为四种。真阳性:侦查结论证实嫌疑人实施违法,测试结论也表明嫌疑人实施违法,表示能够准确识别违法;假阴性:侦查结论证实嫌疑人实施违法,测试结论表明嫌疑人未实施违法,表示未能准确识别违法;真阴性:侦查结论证实嫌疑人未实施违法,测试结论也表明嫌疑人未实施违法,表示能够准确排除无辜;假阳性:侦查结论证实嫌疑人未实施违法,测试结论表明嫌疑人实施违法,表示未能够准确排除无辜。

MAO等[7]的研究中,涉及148起案件的296名受试者,其案件来源、测试人员、测试方法均与本次研究中使用的“金标准”一致,仅存在案情中涉案人数与证据材料的差异。MAO等[7]的研究结果仅得到了测谎准确率,并未计算出每种测试结论所对应的样本数。本研究通过样本量与准确率计算出MAO等[7]研究中每种测试结论(真阳性、假阴性、真阴性、假阳性)对应的样本数,并与本研究中每种测试结论的样本数相加,在两种条件下样本量求和的范围中计算CQT测谎的准确率。

1.3 统计方法

对受试者人口学资料中的年龄、受教育程度采用中位数、均值、标准差进行描述,对性别采用百分比进行描述。不同受教育程度的3组间受试者年龄比较采用方差分析,组间测谎准确率的比较采用χ2检验。不同违法类型的2组间受试者年龄比较采用独立样本t检验,组间测谎准确率的比较采用χ2检验。对整合后的测谎真阳性率和真阴性率的比较采用χ2检验。检验水准α=0.05。

2 结 果

2.1 一般情况

本次纳入的样本中,男性88名(84.62%),女性16名(15.38%);年龄为16~64岁,年龄中位数为33岁,平均年龄为(33.96±11.05)岁;受教育年数为0~19年,受教育年数中位数为9年,平均受教育年数为(8.20±4.02)年。

MAO等[7]的研究中,男性257名(86.82%),女性39名(13.18%);年龄为16~65岁,年龄中位数为31岁,平均年龄为(32.10±10.52)岁;受教育年数为1~16年,受教育年数中位数为9年,平均受教育年数为(8.16±3.01)岁。

对不同受教育程度组之间、不同违法类型组之间的一般情况进行统计学分析,表明其性别、年龄分布及违法构成差异无统计学意义。

2.2 以“金标准”计算的CQT测谎准确率

用侦查结论印证104名涉及刑事案件的受试者的CQT测试结论,其真阳性率为97.73%,假阴性率为2.27%,真阴性率为81.66%,假阳性率为18.33%(表1)。

2.3 受试者受教育程度对CQT测谎准确率的影响

从表2可以看出,不同受教育程度的受试者之间CQT测谎真阳性率的差异没有统计学意义(P>0.05),但真阴性率的差异存在统计学意义(P<0.05)。

表1 使用“金标准”作为评判标准的案例测试结果[例(%)]

表2 按受教育程度分组的CQT准确率[例(%)]

2.4 受试者违法类型对CQT测谎准确率的影响

按受试者的违法类型对其识别违法的准确率和排除无辜的准确率进行χ2检验,P均>0.05(表3),表明不同违法类型的受试者之间CQT测谎准确率的差异无统计学意义。

表3 按违法类型分组的测谎准确率[例(%)]

2.5 以“金标准”和“银标准”计算的CQT测谎准确率的比较与整合

MAO等[7]的研究中原来仅计算出了每种测试结论所对应的样本率,真阳性率、假阴性率、真阴性率、假阳性率分别为83.57%、16.43%、82.20%、17.80%。根据其样本总量可以计算出真阳性、假阴性、真阴性、假阳性结论分别对应的样本量是124、24、122、26。

本研究纳入的104名受试者与MAO等[7]的296名受试者案例在性别、年龄分布、受教育程度、违法构成方面差异无统计学意义。表4显示,分别以“金标准”和“银标准”计算的CQT测谎的真阳性率之间的差异有统计学意义(P<0.05),而分别以两种标准计算的CQT测谎的真阴性率之间的差异无统计学意义(P>0.05)。

将“金标准”和“银标准”的测试数据整合后,得到CQT测谎准确率(表5):真阳性率为87.00%,假阴性率为13.00%,真阴性率为82.20%,假阳性率为17.80%。对其真阳性率和真阴性率进行χ2检验,真阳性率和假阴性率的差异没有统计学意义(P>0.05)。

表4 “金标准”和“银标准”CQT测谎准确率的差异[例(%)]

表5 “金标准”和“银标准”整合后的CQT准确率[例(%)]

3 讨 论

既往的研究[10]多未考虑测试者的因素,如果测试者的经验不足,极有可能在测试题目的编制、受试者心理的把握等方面给测试结论带来不容忽视的影响。本研究中的4名测试人员具有丰富的测试经验,且具备现场勘验、预审等多方面工作的经验,他们的评分者间信度在0.8以上[7],能够最大程度上避免因测试人员经验不足而对测试结论带来的偏倚,为测试结论的可信度提供了有力的保障。

本研究结果显示,刑事案件中CQT测谎识别违法的效能可能不受受试者受教育程度的影响,但其排除无辜的效能却可能受到受试者受教育程度的影响。在实际案件的测谎过程中,其测谎结果主要取决于受试者面对相关问题时的情绪反应。真正涉及刑事违法的受试者由于关于违法过程的记忆深刻,心理现场的稳定性高,更加关注与案件相关的情节,担心谎言被揭穿而带来的刑事惩罚,测谎过程中其情绪反应较为明显[11],所以在测谎过程中更容易被识别。

从研究结果来看,受教育程度过低,不能准确地理解测前谈话中的内容,对于测试过程的配合程度不好,可能会因此出现紧张等情绪,导致被误认为“有罪”。受教育程度过高,虽然对测前谈话的内容理解到位,且配合程度较好,但其对于测试错误结果的担心程度更高,在焦虑的情绪支配下,同样也可能被误认为“有罪”。在无辜受试者中,文化程度的不同使其对测前谈话的理解会存在细微的差异,这些差异会导致在回答与案件相关问题时,产生紧张、焦虑等情绪反应的程度不同,仪器所采集到的生理指标变化的大小也会有差异[12-13],可能会引起测试评分的变化,导致假阳性结果的出现。

本研究结果显示,在刑事案件中,CQT测谎识别违法和排除无辜的效能可能不受测试人员及受试者违法类型的影响。苏彦捷等[3]以27名刑事欺诈嫌疑人为受试者研究了刑事案件中CQT测谎得出确定结论的概率为81.5%,其仅从能否得出确定结论的层面进行了讨论,并且与模拟违法、民事欺骗进行比较,认为测试刺激强度越大,有效性越大,但并未对结果的准确率进行研究。从本研究所涉及案件的违法类型来讲,不论是暴力违法,还是非暴力违法,其行为都已触犯刑法,有可能被判处刑罚。虽然因为违法类型的不同,最终面对的刑罚严重程度也不同,但在测试过程中受试者受到相关问题的刺激均是案件真实情节,并非不同案件所面临的不同法律后果。测试人员仅依据受试者对案件情节的生理指标变化,对其是否撒谎做出定性的判断[14],结论不会受到具体案件情节的影响。所以,我们可以认为在刑事案件中,CQT测谎的真阳性率和假阴性率不会受到受试者违法类型的影响。

以“金标准”计算的CQT测谎的真阳性率高于以“银标准”计算的CQT测谎的真阳性率,而分别以两种标准计算的CQT测谎的真阴性率之间则差异无统计学意义。笔者认为,其原因可能为:(1)本研究中以“金标准”计算CQT测谎准确率的样本量(n=104)与MAO等[7]以“银标准”计算CQT测谎准确率的样本量(n=296)存在较大差距,会对准确率的计算结果造成一定的偏倚。(2)由于“银标准”纳入的案件通过证据材料即可得出判断(同一案件的两个受试者中,必然有一个受试者撒谎,而另一个受试者是诚实的)[15]。测试人员在熟悉案情,并对第一个受试者得出测试结论之后,容易受到“非此即彼”思维定式的影响,得出与第一次相反的测试结论。两个方面的原因都有可能对测试结论带来不可忽视的影响。

刑事案件中,将“金标准”和“银标准”的测试数据整合后,计算出的CQT测谎准确率中真阳性率和真阴性率差异无统计学意义,即CQT测谎在刑事案件中识别违法和排除无辜的效能可能不存在明显差异。但仍然存在较高的假阳性率和假阴性率。相对于依靠经验和直觉判断谎言的准确程度而言,CQT测谎的真阳性率和真阴性率分别达到87.00%和82.20%,在侦查过程中已经能极大地帮助侦查人员提高侦查效率。但不可否认,其仍然存在较高的假阳性率,而且曾经确实有过因盲目相信测谎结论造成错案的教训[16]。国外研究结果[17]表明,“金标准”条件下CQT测谎的真阳性率(n=123)和真阴性率(n=117)分别为91.4%和65.8%。笔者认为,出现差异的原因在于国外的研究也包括了一些根据图谱评分无法得出准确结论的案例在内,而本研究所选取的测谎案例均能根据测试图谱得出“阳性”或“阴性”的结论,而且在样本量上也有了较大的扩充,且整合了“金标准”和“银标准”的测试结果得出的数据,应该更为客观,也更为准确。

在真实案件的测谎中,无辜受试者往往对案件的情况有一定的了解,或者基于对受害人的关心或对案情的好奇而对案件十分关注,或者通过道听途说、新闻媒体等方式对案情有一定了解[18]。因此,在测试过程中由于对案情的了解也有可能被误认为是“撒谎”。由于个体之间心理素质的差异,部分无辜受试者在测谎的过程中即便并不知晓案情,但由于对自己被误认为是嫌疑人的结果过于担心,产生了强烈的焦虑与恐惧情绪,在涉及案件相关问题时,生理指标也会产生较大的变化[19-21]。这也可能成为测试过程中出现假阳性的原因。

综合研究结果,笔者认为,测谎鉴定意见目前仅能在侦查阶段为侦查人员提供线索,而不能将测谎鉴定意见作为定案的依据。在没有形成完整证据链的情况下,办案人员不能盲目相信测谎意见,应尽量将假阳性结论对案件的影响降到最低,发挥测谎技术能够有效识别违法的优势,避免因假阳性结论造成错案。本研究仅仅是以成都市公安局心理测试中心在测谎实践中的案件为研究对象,只能反映该单位测试团队的整体测试水平。以后还可以在更大地域范围内扩大样本量,更准确地反映测谎技术在实际应用中的准确率,为测谎鉴定意见合法有效地应用于司法实践提供尽可能客观准确的数据支撑。

猜你喜欢
测试人员结论违法
由一个简单结论联想到的数论题
移动应用众包测试人员信誉度复合计算模型研究
刑事违法所得追缴的两元体系构造
一起多个违法主体和多种违法行为案件引发的思考
立体几何中的一个有用结论
这份土地承包合同是否违法?
浅析软件测试中的心理学应用
如何有效查处“瞬间交通违法”
结论
犯罪心理测试人员素质要求分析