论大数据背景下的民事证据禁止规则*

2019-02-10 00:03
关键词:民事数据挖掘证据

乔 茹

(辽宁大学 法学院, 沈阳 110036)

大数据的应用作为一种不可逆的社会趋势,得到了司法领域的高度重视。基于大数据的数据挖掘和数据分析所产生的客观证据,能否跨越民事证据禁止规则的藩篱为揭露案件的事实提供依据,值得我们思考。首先,数据挖掘和数据分析自其诞生之日起便存在侵犯个体法益的情形,如大数据挖掘对个体隐私权的侵害一直是国内外学界争论不休的焦点。其次,在民事证据禁止规则下,对于严重侵犯他人合法权益以及严重违背公序良俗的规定,在实务中很容易沦为只要当事人认为对方的取证行为“严重”侵犯了自己的合法权益,便适用民事证据禁止规则,将能够揭露案件事实真相的证据以合法形式排除。大数据的应用对程序法中证据规则的影响不可忽视,譬如电子证据是在科技与法律发展下合力催生出的证据形式,尤其是在电子网络纠纷、电子犯罪领域的应用中发挥着愈发重要的作用。该证据形式一经出现就引起了国际法学界的高度关注,关于它的立法实践、学术专著纷纷涌现。国外G8小组制定的一系列有关电子证据的标准是很有代表性的(1)G8由加拿大、法国、德国、英国、日本、意大利、俄罗斯和美国的相关研究人员组成,制定了一系列的电子证据标准,提出了经典的数字取证操作六原则。。

一、民事证据禁止规则概述

1. 证据禁止规则的由来

证据禁止规则是产生于德国刑诉法中的证据认证规则。德国学界将证据禁止具体细分为两种类型,即证据取得和使用的禁止[1]。符合两种类型中规定的具体情形的证据均不得在庭审中加以使用。按照我国通说的观点,证据禁止规则亦被称为非法证据排除规则,其最早出现于我国的刑事诉讼领域,民事诉讼领域的证据禁止规则产生较晚。但随着学界对民诉领域建立证据禁止规则的呼声日益高涨,最高人民法院终于在司法解释中确立了民事证据禁止规则。然而,民诉中的证据禁止规则相较于刑诉而言,无论从完备度还是丰富度来说显然要逊色很多。

2. 民事证据禁止规则的现状

证据禁止规则是否应用、怎样应用,在民事证据领域,一直是一个重要的研究课题。随着学界对确立民事证据禁止规则的呼声日渐高涨,最高人民法院于1995年3月出台的《关于未经对方当事人同意私自录音取得的资料能否作为证据使用问题的批复》(以下简称《批复》)以司法解释的形式确立了民诉领域的证据禁止规则。《批复》内容指明,只有合法取得的民事证据才能成为诉讼中的定案根据。《批复》进一步指明,不得将未经对方同意私自录制的谈话内容作为民事证据使用,因为该行为是不合法的行为。至此,证据禁止规则开始在我国民事领域崭露头角。这一《批复》的法律逻辑在于取得手段的违法,因触及特定的利益而不能作为证据使用,进而认定其不具备证据之合法性。显然,此处并未将非法证据与非法取证行为进行区分,但这一认定的内在逻辑在之后的司法实践中却得到了传承。

继《批复》之后,2001年《最高人民法院关于民事诉讼证据的若干规定》第68条规定了不具备证据合法性的两种情形:第一,侵害他人合法权益;第二,违反法律禁止性规定。通过上述两种方式取得的证据,要依法进行排除。之后2015年《最高人民法院关于适用〈中华人民共和国民事诉讼法〉的解释》(以下简称《民诉解释》)对民事证据禁止规则作出了进一步规定。该解释第106条在前述第68条的基础上增加了第三种情形,即以严重违背公序良俗的方法获取的证据也要排除。这是目前为止我国民事诉讼领域关于民事证据禁止规则的具体规定。我国民事领域的证据禁止规则与刑事领域的禁止规则相比不够完善,但鉴于司法解释是具有法律效力的法律规则,其在司法实践中是作为法官判案之根据存在的。

3. 关于民事证据禁止规则的理论争议

确立建构民事证据禁止规则在学界基本已经达成共识,但对该规则存续的基础理论仍有争议。有的学者出于对公民基本权利的保障指出,民事诉讼作为一种民事纠纷解决机制,旨在保障当事人的合法权益,践行秩序价值,片面地追求客观真实不符合民事诉讼设置的目的。而有的学者则认为,司法裁判是实现公平正义的重要举措,具有纯洁性。此外还有的学者认为,基于违法行为的否定性评价考量,借助违法行为获得证据,一旦被运用在诉讼活动中,等于变相鼓励当事人为获得胜诉而借助违法手段获取证据,因为违法手段较正当途径更容易获得证据[2]。

针对上述支持确立禁止规则的观点,陈桂明比较赞成考量公民基本权利,并将这种观点绝对化,认为其是民事证据禁止规则存在的基石[3]。换言之,他对民事领域建立证据禁止规则持肯定态度。李祖军在评价上述观点时认为,从诉讼活动的内在价值——程序公正的视角考虑是尊重和保障人权的体现[4],可见他也对民事证据禁止规则持肯定态度。在肯定民事证据禁止规则的基础上,由于民事诉讼涉及的是平等主体间的权利和义务,应该适用法无禁止即自由的原则。而民事证据禁止规则是为了约束相较于国家机关而言的“弱势”群体,其在收集和发现证据的能力上显然欠缺,如果采取“一刀切”的处理方式亦是不当的。我国目前的民事证据禁止规则其实相较刑事领域更为严苛,这一规定在大数据时代面临适用难题,大数据的特性无疑会对民事证据禁止规则形成新的挑战和冲击。

二、大数据对民事证据禁止规则的挑战

何为大数据?最早的定义来自Apache.org的项目Nutch:“更新网络搜索所需要进行批量处理或分析的大量数据”便是大数据[5]。但如同对“法学”的定义一样,对大数据的认识并未达成共识,存在多角度、多层次的界定。然而,对大数据规模性、高速性和多样性这三大特征的认知是毋庸置疑的[6]。也有学者认为,大数据是依确定目的挖掘、处理的大量不特定主体的数字信息[7]。大数据的产生对民事证据禁止规则提出了新的挑战,数据挖掘和数据预测本身就带有侵犯民事主体合法权益的性质,如果对其都加以排除,显然是与目前大数据趋势背道而驰的。大数据应用在现实生活中无处不在,尽管一些企业的数据挖掘或者政府的数据挖掘并不以获得证据为直接目的,但当民事纠纷发生时是可以从海量数据中获得与案件有直接关系的电子数据的,此刻大数据便不再是单纯的数据了,而是转变为能够无限接近案件真实的证据。

1. 数据挖掘

随着计算机技术的发展与数据统计挖掘技术的积累,一种被称为大数据研究的范式正逐步壮大为“科学帝国主义”研究范式的先锋,为实现以往实证研究难以在恰当时间内借助常规方法挖掘数据、分析数据的社会科学研究提供了可能[8]。而这一研究范式的基础环节之一就是数据挖掘,即一系列用于从大量储存的数字信息中提取情报的技术[9]。现今无处不在的数据挖掘已经以无形的方式存在于我们社会生活中,手机应用可以收集我们的购物信息、出行信息、交往信息;电脑网站可以记录我们浏览的信息。我们的衣食住行都被记录在电子数据中,不管是以我们知情的方式还是不知情的方式,抑或以我们同意的方式还是不同意的方式。不得不承认,大数据时代已经来临,这一不可逆的趋势在带给人们很大经济效益的同时,也难免会以侵害社会群体隐私权和知情权的形式而存在。美国隐私政策专家已经对数据挖掘的存在表示担忧,Dempsey和Flint指出,数据分析模型会引起极其严重的隐私权和民主权隐患,因为数据分析会监测无数人合法的日常生活[10]。

尽管数据挖掘侵犯了用户的隐私权,但是其所产生的经济效益和社会效益使得我们不能抹杀大数据对社会发展的积极作用。数据挖掘不仅在经济领域给市场主体带来了可期待利益,而且在国家安全方面也发挥着至关重要的作用。在美国,鉴于对恐怖主义的担忧,与自由利益(个人隐私权)相比,安全利益占了上风,因此采用数据挖掘技术迅速锁定恐怖分子是维护国家安全利益的重要保障。我们无法阻止数据挖掘的脚步,并且在司法实践中已经有所体现。例如“个人信息自决权”便是在德国宪法法院中提出的新概念,明确了个人享有披露、使用自身信息的权利[11],但个人隐私权的保障问题仍需要足够的重视。譬如,手机软件客户端等信息收集方会在客户初次使用时与其达成使用协议,即如需使用该应用必须同意授权客户端访问您的位置信息、联系人信息等,通过看似合法的契约形式,使用户让渡自己的个人信息数据。民法上将此称为个人对隐私权的放弃,但是用户并非应允客户端对此进行数据分析,或用于商业途径。为了使通过数据挖掘得到的一系列数据实现数据到合法证据的转变,并在民事诉讼中发挥积极作用,必须建立数据合法化的载体。而且,现有的民事证据规则也需要契合大数据时代的发展而变化,否则,基于数据挖掘所产生的客观证据无法在民事案件中发挥揭露案件真相的重要作用。为避免数据挖掘在民事司法领域丧失存续的空间,现有的民事证据规则需要进一步修订完善。

2. 数据预测

提到“预测”,大多数人认为预测的结果并不能等同于事实,具有不确定性。但是大数据预测是建立在数据挖掘和数据分析基础上的预测,具有强大的客观数据链支撑,预测结果几乎可以达到精准。例如,Facebook发送用户数据到Datalogix,Datalogix分析客户在商店中消费情况的数据,最终通过匹配使得Facebook上的广告发挥更大的效果。相似地,零售运营者像亚马逊和沃尔玛用复杂的模型基于消费者的优先行为进行购买品推荐[12]。再如,根据纽约时报的报道,美国塔吉特公司雇佣统计员详细检查已进行怀孕登记的妇女的购买记录,发现了一些潜在的模式,如在妊娠第二期开始的时候女性更喜欢购买无气味的乳液,在怀孕前20周选择购买钙、镁、锌等补品等。根据这一模式,当有女性购买特定商品符合既有数据模式时,塔吉特公司能够极其准确地预测出一个客户的怀孕状态和怀孕日期,而且这样的预测也得到了验证[13]。除了上述案例,数据预测还在其他领域,诸如医疗行业、国家安全监管、经济等领域发挥着积极作用,但这种积极作用却往往伴随着对用户隐私权及其他权益的侵害。

基于数据挖掘和数据分析得出的精准预测是大数据从在线交易、查询词条以及医疗记录到通讯网络、电网、移动电话等无数网民的互动和基础设施感应器中得到的,不仅数据收集的数量非常巨大,而且常常包含与个人生活密切相关的隐私内容。在线行为数据可能会揭示我们的医疗情况,如购买过关于乳腺癌存活率的书或浏览过XX病基金会的网页[14]。在大数据时代,人们的行为具有可预测性,社会生活更加透明,但这也加大了权利厘清的难度,如何保障个人信息安全将成为一个重点、难点[15]。如果采用“一刀切”的做法将大数据预测所得的证据材料一律禁止适用,那么不仅大数据在民事诉讼中的优势得不到发挥,而且不利于智慧法院的建设。在大数据已经成为社会必须接受的一种存在的情况下,必须给数据分析和数据预测以合法进入民事诉讼程序的通道,而此时民事证据规则就会面临挑战。

三、大数据下民事证据禁止规则的完善

我国目前的民事证据禁止规则不具有现实的可操作性,其未严格区分非法证据和非法取证行为。目前民事证据禁止规则的适用主要依靠法官的自由裁量权,更多地是从法官的主观认识角度评价非法证据能否适用。大数据时代的到来为建立一个较为客观的数据平台提供了可能,有利于规范法官的自由裁量,更好地保障当事人的合法权益。笔者认为,民事证据禁止规则应该限定的对象是非法证据而非非法取证行为,故对于非法取证行为可以通过介入诉讼救济的方式加以解决。非法证据不能简单地采取“一刀切”的方式加以排除,而应该明确其适用界限。

1. 建立司法数据库

建立民事领域的司法数据库是中共十八届三中全会通过的《关于全面深化改革若干重大问题的决定》中多处要求“加强数据平台建设”“推进部门信息共享”的有效回应[16]。尽管大数据时代下,数据因为“大”这一特色看似难以分析和应用,但是各大证据类型存在本质区别,是可以建立相应电子数据库的。当然,笔者比较赞成有学者提出的观点——数据库的建立有两种模式:一种是专门的证据数据库,由法院组织构建;另一种实际上是一种数据库调取平台,其包含的数据量远大于第一种模式,调取的数据需要进一步筛选和运用。前者是数据库的构建,由于具备专门性的特点,在维护上需要专门机关更多的投入[17]。

证据数据库模型的建立为民事证据禁止规则提供了基本素材,能够分析现有实务工作中可能运用该规则的情形,从众多个案中挖掘、分析出诉讼案件的证明过程和逻辑共性。这是在借鉴德国证据禁止理论的基础上进行的,从证据的取得、证据的使用两方面着力,伴随着数据挖掘和数据分析技术的深入发展,建立证据数据库的时机已经成熟。从数据库的海量数据分析可以得出一个客观标准,虽然这一标准并不能适用于所有的案件,但是针对同类案件可以让法官有明确的参考范围,在其指导作用下,能够在一定程度上将法官的自由裁量权置于合理的范围内。

大数据时代的到来催生了一种新的证据种类——电子证据。电子证据与传统证据不同的是:在识别上虽然部分电子证据包含的内容是可读的,但仍然有一些电子证据是不可读的(如元数据);电子证据容易被修改,且不容易被发现。因此必须认识到,同传统证据相比电子证据的不同之处只在于存储空间方面,而绝非证明机制方面[18]。建立数据库必须确保进入其中的数据源是未受到任何“污染”的,否则可以作为优势证据的电子数据也有可能成为阻碍诉讼进程的“元凶”。

2. 数据收集、使用的规制

大数据所背负的“非法”性主要在于其对个体权益的损害来自挖掘包含个体敏感信息的数据,以及在个人不知情或者未同意的情况下进行数据分析。换言之,进行数据收集和挖掘如果能够事先经过个体同意,则不会存在非法挖掘的问题。我国民法规定了个人信息权,即个人对自己的信息享有支配权,当个人决定将此信息让渡给数据挖掘者时,挖掘者就可以进行正当合法的数据挖掘。个人同意的内容包括是否需要做匿名化或者去识别化处理,如果违背个体所附的条件,同样属于非法的数据收集和挖掘。鉴于国家安全利益是个人私益的基础和保障,为了国家安全所进行的数据收集是利益权衡下的必然举措,故此处主要规制的是市场主体的收集行为,因为市场主体不可避免地具有逐利取向,为了获得更大的经济效益往往不惜将用户信息数据作为商品进行买卖和流通。

市场主体收集用户的信息并非简单地进行储存,因为储存并不能带来收益,往往还会给市场主体带来管理负担。市场主体收集的数据可能被用于各种用途,而用户对自己的数据将要被用于何种目的享有知情权和决定权。倘若医院收集患者数据时告知患者将对其数据进行匿名化处理并仅用于科研领域,想必患者会欣然同意。如果市场主体将收集来的数据用于其他用途,用户有权了解其个人数据在应用过程中是否处于安全状态,同时有权决定是否提供个人数据。当用户感觉个人数据在使用过程中存在潜在的不利风险时,其具有删除和撤销的权利。

非法取得证据并不会必然导致证据使用禁止,仅在违反证明对象禁止的情况下才适用证据禁止规定[19]。非法挖掘、收集得到的数据尽管并非我们所提倡的,但其仅仅是提供给当事人申请排除的机会,并不能必然导致证据不合法。非法收集数据所导致的侵害亦并非达到了法律规定的“严重侵害”,尤其是民事诉讼的价值追求在于定纷止争,并不绝对追求案件“真实”,这一点可以从民刑领域证明标准的不同看出。我国法律赋予公民的权利是多种多样的,包括民主权、人身权和财产权,如果认为当事人的取证行为侵犯了上述任何一项权利都应认定由此取得的证据不能被采纳,显然这是对民事诉讼证据合法性要求过高。此外,当事人的违法取证行为又有不同的类型,有些违法行为不仅严重侵犯了公民的基本人权,而且违法行为本身使证据的证明力受到了影响,如以肉体折磨或精神虐待的方式取得的证据;还有一些证据虽然侵犯了他人的权益,但是并没有影响证据的证明力。因此,对于前一种非法证据应当绝对地予以排除,后一种非法证据应当在法官自由裁量权范围内加以解决[20]。

不少法学家及富有经验的实务家一再强调,民事诉讼的胜负多取决于对事实的认定,而非取决于单纯的法律解释[21]。尽管司法过程与结果要完全再现客观事实是不可能的,但是“以事实为根据”必须以“法律事实”为根据。而法律事实必须以客观事实为基础,其越接近客观事实,司法就越公正[22]。特别是严格遵守用户自决原则时,大数据挖掘和预测所得的数据是更趋近于客观真实的证据材料。如此一来,大数据挖掘和预测并不会构成对民事证据规则的挑战,相反还会促进民事诉讼的进行。如果市场主体未经用户授权而收集并使用用户个人信息,则属于民事证据禁止规则调整的范畴,但是否排除适用还必须依照法官的自由裁量进行判断,不可简单地“一刀切”。

猜你喜欢
民事数据挖掘证据
民事推定适用的逻辑及其展开
论民事共同诉讼的识别进路
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
加强民事调解 维护社会稳定
对于家庭暴力应当如何搜集证据
手上的证据
手上的证据
民事保全:价值回归与平等保护
高级数据挖掘与应用国际学术会议