论科学证据的两种概率解释

2012-11-13 01:50方轻
关键词:可接受性概率论起点

方轻

(厦门市委党校哲学教研室,福建厦门361008)

用概率的理念与方法研究科学证据和确证问题在卡尔纳普之后受到许多学者的重视。可以把下面这个句子看作关于证据的最本质的一种概率陈述,它为证据研究引进了概率概念:

(a)在已知e的情况下,h的概率为r,即p(h/e)=r。

概率的计算规则是概率观念的核心部分。几乎所有的概率论者都认为在使用概率概念或方法时必须服从一些基本的概率计算规则。这些规则包括:

①0≦p(h/e)≦1;

②如果h和h’逻辑等值,并且e和e’逻辑等值,那么 p(h/e)=p(h’/e’);

③p(~h/e)=1-p(h/e);

④ p(h∨h’/e)=p(h/e)+p(h’/e)-p(h∧h’/e);

⑤ p(h∧h’/e)=p(h/e) ×p(h’/h∧e).

规则①规定了概率值必须在0-1之间浮动;规则②要求逻辑等值的假说在逻辑等值的证据的支持下获得同样的概率;规则③规定一个假说的矛盾假说的概率等于1减去这个假说的概率;规则④和规则⑤分别是关于两个假说的析取与合取的概率计算规则。这五条规则被认为是概率计算的基础,所有从p(h/e)=r的形式发展而来的概率计算及其解释都应该满足以上这些计算规则。

一、科学证据的两种概率定义

(一)“正相关”定义

证据的“正相关”定义是基于概率的证据定义或证据与假说概率之间关系的最常见的形式,几乎所有在研究证据问题时涉及到概率分析的哲学家都会采用或赞同这一定义。所谓正相关,是指证据与假说的概率之间的正相关。这种以正相关为核心的证据定义可以表述为:

(b)e是h的证据当且仅当在已知e的情况下的h的概率大于未知e的情况下的h的概率,即p(h/e)>p(h)。

具体而言,在证据与假说的概率之间,如果e改变了h的概率,那么e与h是相关的;如果e提高了h的概率,那么e与h之间的相关是正相关,e是确证h的证据;如果e降低了h的概率,那么e与h之间的相关是负相关,e是否证h的证据。由于通常人们在说“e是h的证据”时,都是指“e是确证h的证据”。因此,我们可以直接把第一种证据概率观中的证据定义称作证据的“正相关”定义。

我们可以把e与h之间的负相关转变为e与~h之间的正相关,因此,把(b)中的h用~h代替,该定义同样适用:

(b1)e是~h的证据当且仅当在已知e的情况下的~h的概率大于未知e的情况下的~h的概率,即p(~h/e)>p(~h)。

由于证据和假说之间的关系通常都会受到理论背景或附加信息的影响,因此有些概率论的证据分析会把这一因素考虑进去,从而把证据的第一种概率定义作如下变化:

(b2)相对于特定的b,e是h的证据,当且仅当p(h/e∧b)>p(h/b)。(b泛指理论背景)(b2)是(b)的延伸,它表明相对于特定的理论背景,如果e的存在提高了h的概率,那么e是h的证据。

同样,我们可以把(b2)中的h用~h代替,得到:

(b3)相对于特定的b,e是~h的证据,当且仅当p(~h/e∧b)>p(~h/b)。

由于p(~h/e∧b)>p(~h/b)当且仅当p(h/e∧b)﹤p(h/b),因此(b3)表明相对于特定的理论背景,e是~h(即否证h)的证据,当且仅当e的存在提高了~h的概率(即降低了h的概率)。

(二)“高概率”定义

除了“正相关”之外,还有第二种证据的概率定义,即所谓的证据的“高概率”定义。虽然由于在规定高概率的起点时会产生分歧,导致这种定义的普遍性不及“正相关”定义,但是它仍然具有相当的合理性,并且受到卡尔纳普的青睐。

我们可以把证据的“高概率”定义表述如下:

(c)e是h的证据,当且仅当p(h/e)>k。(k是高概率的起点)。

一般来说,作为高概率的起点是一个固定不变的数值。虽然卡尔纳普提倡从“高概率”的角度定义证据,并且在他看来应该有一个固定的、单一的k的值存在,但是,他并没有为高概率的起点规定一个明确的值。后来的一些哲学家,如阿钦斯坎,提议根据0≦p≦1的概率规则,把高概率的起点定为1/2,并且设定这个k值对于所有涉及证据评估的语境都适用。因此,第二种证据的“高概率”定义可以表述为:

(c1)e是h的证据,当且仅当p(h/e)>1/2。一般的概率论认为一个假说非真即假(本文最后一部分将表明这种观点是有问题的)即p(h)+p(~h)=1,也就是说,如果选择k=1/2,那么p(h/e)>1/2当且仅当p(~h/e)<1/2。因此,第二种证据的“高概率”定义也可以表述为:

(c2)e是h的证据,当且仅当e使h的概率超过~h的概率,即p(h/e)>p(~h/e)。

以上提及的两种证据的概率定义体现出两种不同的证据概率解释,正如卡尔纳普所说:第一种定义侧重于证据效用的相对意义,即证据使假说“更稳固”或“更可接受”;第二种定义侧重于证据效用的绝对意义,即证据使假说“稳固”或“可接受”。在实际研究中采用哪一种定义或概率观更合适?这个问题对于不同的研究者有不同的回答。一般来说,主要对证据或确证问题进行定性研究的学者更多地采用“正相关”解释,而热衷于对证据或确证问题进行定量研究的学者则会在同时采纳两种观点的基础上对其中一种更加偏爱。

二、“正相关”与“高概率”的运用

(一)科学证据中的“比较级”

所谓科学证据中的“比较级”问题即具有以下形式的证据陈述:

(1)e对于h而言比对于h’而言是更强的证据。

(2)对于h而言,e比e’是更强的证据。

首先,以证据的“正相关”定义为基础,即以“e是h的证据当且仅当e提高了h的概率”的概率观为基础,可以认为,如果e对于h而言比对于h’而言是更强的证据,那么e使h提高的概率必须超过e使h’提高的概率。形式化表述为:

(1’)e对于h而言比对于h’而言是更强的证据,当且仅当p(h/e)-p(h)>p(h’/e)-p(h’)。同理,如果e比e’是h的更强的证据,那么e使h提高的概率必须超过e’使h提高的概率。形式化地表述为:

(2’)对于h而言,e比e’是更强的证据,当且仅当p(h/e)-p(h)>p(h/e’)-p(h)。

其次,以证据的“高概率”定义为基础,即以“e是h的证据当且仅当e使h的概率超过1/2(或其他较高的概率值)”的概率观为基础,可以认为,如果e对于h而言比对于h’而言是更强的证据,那么就要求e使h达到的概率超过e使h’达到的概率。这种解释可以形式化表述为:

(1”)e对于h而言比对于h’而言是更强的证据,当且仅当p(h/e)>p(h’/e)>1/2。

同理,如果对于h而言,e比e’是更强的证据,那么就要求e使h达到的概率超过e’使h达到的概率。同样,e或e’必须首先满足各自是h的证据,即满足p(h/e)>1/2和p(h/e’)>1/2,并可形式化表述如下:

(2”)对于h而言,e比e’是更强的证据当且仅当p(h/e)>p(h/e’)>1/2。

只需通过简单的数学计算,上述两种证据定义的概率观对“比较(级)的”证据陈述的解释实际上存在着(1’)=(1”)和(2’)=(2”)的关系。这说明,虽然两种概率观对证据的定义有所不同,但是将它们的思想用于解释同一证据与不同假说或不同证据与同一假说之间的关系时,所得到的结果是一致的。两种证据的概率解释在本质上是不矛盾的。

(二)科学证据的“可接受性”

当“可接受性”作为一个描述某种特征或属性的词语被用于形容一个假说时,人们通常认为会有两种结果出现:假说具有或不具有可接受性。这种定性的描述受到高概率论者的欢迎。因为,对假说进行“非是即否”的可接受性判断,暗示了一个概率的分界点(即高概率的起点)的存在。“高概率”的支持者会这样解释:如果证据使假说具有高概率,或者说使假说的概率超过了某个高概率的起点,那么假说即具有了可接受性;反之,如果证据没有使假说具有高概率,或者说没有使假说的概率超过某个高概率的起点,那么假说不具有可接受性。

“正相关”理论的支持者不喜欢“可接受性”的说法,因为他们不愿意或认为不可能在假说所具有的概率中找出一个明确的分界点。这些概率论者更欢迎一种相对模糊的说法——“可接受性程度”。他们认为:如果证据使假说的概率比没有该证据存在时更高,那么证据就使假说具有了更高的可接受性程度;如果证据无法使假说的概率比没有该证据存在时更高,那么该证据就没有使假说具有更高的可接受性程度。

其实两种证据的概率观解释证据的“可接受性”也是不矛盾的。

首先,概率论对“可接受性”(或“可接受性程度”)的解释通常可以从概率与可接受性(或可接受性程度)之间的关系上来把握。这一关系可以通过图1直观地表现出来。

图1 “可接受性”与概率的关系

在图1中,横轴表示概率,并且0≦p≦1;纵轴表示可接受性(程度);k表示可接受性要求达到的概率起点(即高概率起点)。从图1中至少可以看出概率论对可接受性(程度)的以下几个解释要点:

(d)存在一个高概率的起点k。

虽然(d)看上去似乎是“高概率”一派所主张的,但是,即使“正相关”概率观没有明确提出需要一个高概率起点,甚至反对设立这样一个高概率起点,但是实际上,这个作为界限的起点还是存在的或必需的。“正相关”的支持者可能会把可接受性理解为与假说的概率值从0到1变化正相关的假说可接受程度的变化,但事实上没有任何一个“正相关”概率论者会赞同某个假说只要具有非0的概率或可接受程度,它就是可接受的;他们也不会认为一个信息只要能够使假说的概率非0,它就是这个假说的证据。如果按照严格意义的“正相关”概率观,科学就将成为“无门槛”或“低门槛”的:证据之为证据,只需使假说从极度荒谬上升为一般荒谬;假说之所以更稳固或更可接受,也只需找一个比自己更不稳固或更不可接受的假说作为陪衬。因此,高概率的起点是可接受性概率解释的必要前提。

(e)假说h可接受当且仅当它的概率高于k。对于概率论者而言,高概率不仅是证据之为证据、假说“(更)稳固”或“(更)可接受”的必要条件,也是充分条件。(e)除了表明“当且仅当h的概率高于k时,h是可接受的”,还暗示了“当且仅当h的概率低于k时,h是不可接受的”。概率论者认为,为假说设立一个高概率的“门槛”能够避免一些太弱的或不相干的证据对假说产生虚幻的、干扰性的影响。如果没有k作为分界点,那么证据与假说的关系将只能通过“正相关”原则来解释:e是h的证据当且仅当h依靠e(与b的合取)时比不依靠e(仅依靠b)时更可接受;也可以解释为:e是h的证据当且仅当h依靠e(与b的合取)时比不依靠e(仅依靠b)时更非不可接受。这两种“正相关”的概率解释可以理解为把图1中的曲线分割开来加以描述:前者描述了横轴以上的属于“可接受”部分的曲线,后者描述了横轴以下属于“不可接受”部分的曲线。这就为弱的或不相干的证据提供了存在的依据:e可以不用使h达到“可接受”,甚至不用使h变得“更可接受”,而只需简单地使h“更非不可接受”。可以通过一个例子看出这种确认证据的原则会产生怎样的结果。作为热力学第二定律的一个著名宇宙学推论,“热寂说”(h)预言了:“宇宙在遥远的将来有一个不可避免的静止和死亡状态。”假设有两种情况,情况e1:“宇宙现在处于一种活动和非死亡的状态;”情况e2:“宇宙现在已经处于静止和死亡状态。”由于e2和h显然是矛盾的,也就是说 p(h/e2)≡0,因此p(h/e1)>p(h/e2)必然成立。根据“正相关”概率观,这个恒成立的不等式表明e1比e2提供了更多的理由相信h。也就是说,由于e1比e2提供了更少的理由不相信h,因此,e1是h的证据;由于“宇宙现在处于一种活动和非死亡的状态”是“宇宙在遥远的将来有一个不可避免的静止和死亡状态”的证据,这显然是很荒谬的。

(f)当假说h的概率等于k时,假说既非可接受,也非不可接受。

由于无论是倾向于“正相关”还是倾向于“高概率”的概率观,很少有学者为k赋以一个明确的值(k=1/2的观点只是少数情况下的权宜之计),因此,在概率论者那里,几乎不存在p(h/e)=k的情况,因此,对于“当p(h/e)=k时h的可接受性如何”的概率解释是悬而未决的。

(g)假说的可接受性原则上不会达到绝对可接受或绝对不可接受。

即使有少数概率论者认为存在证实性证据或毁灭性证据,它们可以使假说的概率达到极限值,即p(h/e)=0或p(h/e)=1,但是,更普遍的观点是:由于假说的概率难以达到极限值,因此假说在可接受性上难以达到相应的极限,即绝对可接受或绝对不可接受。

其次,“可接受性”(或“可接受性程度”)的概率解释还可以从根据假说的概率对假说的可接受性进行的等级划分上来理解(如图2)。

图2 “可接受性”的分级表示

图2中的横轴表示概率,并且0≦p≦1;纵轴表示可接受性等级;k表示高概率起点。在图2中,可以看出以下几点:

(h)假说的概率在0-1之间被划分为不同的等级(区间)。

有些概率论者会把假说的可接受性划分为不同的等级,划分等级的依据就是假说的概率的高低。因此,这里实际上存在两次等级的划分:第一次是为假说的概率划分等级,形成连续的等级区间,第二次是依据假说概率的等级为假说的可接受性划分等级。例如,图2 中以0、k’、k、k”、1 为界限把假说按概率高低分为四个连续的区间:(0,k’)、(k’,k)、(k,k”)、(k”,1)。k’、k”的作用与 k 基本相同——都是作为概率级别的某个分界点,但由于重要性上的不同——k可为假说定性,k’、k”只能对假说进行程度说明,因此,如果我们可以认为k是一级的高概率起点,那么k’、k”则是二级的高概率起点。与k的赋值情况相同,概率论者几乎都回避了给k’、k”这样的二级高概率起点一个明确的值,为了便宜行事,有时会效仿k的赋值为k’、k”取一些折中的数值,如1/4、3/4等。

(i)根据假说h的概率所属的不同区间,假说的可接受性被划分为不同的等级。

表示假说概率的横轴被划分出几个连续的区间之后,就可以在纵轴上相应的位置划分出几个不同的可接受性等级。如图2所示,可接受性等级包括可接受的等级和不可接受的等级。我们可以说:概率在(k,k”)区间内的假说,属于较低的可接受等级(或级别1);概率在(k”,1)区间内的假说,属于较高的可接受等级(或级别2);概率在(k’,k)区间内的假说,属于较低的不可接受等级(或级别-1);概率在(0,k’)区间内的假说,属于较高的不可接受等级(或级别-2)。

(j)没有规定假说h的概率等于分界点值时,即p(h)=0或k’或k或k”或1时,假说的可接受等级情况。

(j)实际上是(c)与(d)的综合,原因也大致相同:一方面,k、k’、k”的值并不确定,另一方面,极限状态几乎不可能达到。

图2是一个梯级函数曲线示意图。虽然假说的概率覆盖了从0到1所有可能出现的概率值,但是可接受性等级却只有4个(级别1、级别2、级别-1和级别-2),即使加上概率论没有做出解释的几个分界点和极限值的可接受性等级归属,可接受性级别的个数还是有限的。这就可能造成这样的结果:两个不同的假说,虽然拥有不同的概率,但被归入同一个可接受级别。这种情况就如同两个学生的考试成绩分别为86分和99分,如果根据“85分以上为优秀”的等级划分,则这两个差距明显的成绩仍然被归入同一级别。为了实现对可接受性的等级划分,以牺牲较小概率差别为代价,是概率解释难以两全的必然选择。因此,只有综合图1和图2所包含的所有概率解释要点,才能够比较全面地把握对假说可接受性的概率解释。不难发现,实际上图1和图2是相通的:只需将图2中的级别数量无限增加,就可以使图示从图2中的那个梯级函数曲线变成图1中的那条平滑连续的函数曲线(如图3所示)。

图3 “可接受性”等级无限增加的过程

三、“正相关”与“高概率”的局限性

“正相关”与“高概率”不仅给科学证据做出了两种直观明确的定义,并且能够清晰简洁地揭示科学证据研究中的许多具体问题。然而,“正相关”和“高概率”对科学证据的定义本身却存在着不可弥补的缺陷。

(一)“正相关”不是证据的充要条件

即使在概率解释上正相关概率论者不得不默认有必要在证据与假说的关系中设立一个特定的高概率起点,但是,他们的核心观点仍然是:证据之为证据,必须能够使假说的概率在出现证据之后有所提高,即证据必须与假说的概率正相关。对于正相关概率观,人们很容易就会提出这样的疑问:是否提高了假说的概率,就可以成为假说的证据?此外,是否要成为假说的证据,必须提高假说的概率?

设想这样一种情况:汤姆生在1897年前后做了1 000次“阴极射线通过磁场”的实验,其中999次的实验结果是“阴极射线通过磁场时不发生偏转”,1次的实验结果是“发生偏转”。后来,汤姆生发现,在之前的999次实验中,有900次存在诸如“玻璃瓶中真空指标严重不达标”等技术失误,因此,他否定了这900次实验结果的有效性。因此,现在的情况是:100次有效的实验结果中,99次“阴极射线通过磁场时不发生偏转”,1次“发生偏转”。如果(根据逻辑等值原则)直接以“阴极射线通过磁场时发生偏转”的实验结果预期代替“阴极射线带电”作为汤姆生的假说,则有如下关系:

b:在第一时间段里,汤姆生一共做了1 000次“阴极射线通过磁场”的实验,其中999次“阴极射线不发生偏转”,1次“发生偏转”。

e:在第二时间段里,汤姆生否定了999次“不发生偏转”的实验结果中的900次实验结果的有效性,剩余的99次“不发生偏转”和1次“发生偏转”的实验结果继续维持有效性。

h1:阴极射线通过磁场时发生偏转。

h2:阴极射线通过磁场时不发生偏转。

在这个例子中,假说的概率分配、以及在证据基础上的概率变化是这样的:

p(h1/b)=1/1000

p(h2/b)=999/1000

p(h1/b∧e)=1/100

p(h2/b∧e)=99/100

从概率上看,e的出现使h1的概率从1/1000变为1/100,整整提高了10倍。根据“正相关”概率观,由于p(h/b∧e)>p(h/e),所以,e完全有资格成为h1的证据。但是,我们是否就可以因此认为e是h1的证据呢?在面对1/1000或1/100这样实在不可谓高的概率值时,如果没有对“真理往往掌握在少数人手里”的坚强信念,恐怕很少人会选择肯定的答案。因此,e提高了h1的概率并不是e是h1的证据的充分条件。

如果从e与h2的关系上看,我们甚至发现,e提高了h2的概率不是e是h2的证据的必要条件。与h1相比,e的出现对h2的影响相对小一些,它使h2的概率从999/1000变为99/100,也就是说p(h2/e∧b)﹤p(h2/b)。如果根据“正相关”原则,e降低了h2的概率,那么e不仅不是h2的(确证)证据,而且应该成为h2为假的证据,即反对h2的证据,或者在该例中直接成为支持h1的证据。但是,实际的情况是,e即使使h2的概率有所减小,可从绝对值上看,h2的概率(无论是999/1000还是99/100)始终对h1的概率有着压倒性的绝对优势。以p(h2/b∧e)和p(h1/b∧e)之间的悬殊来看,真理的天平依然是倾斜向h2一方的,e仍然被大多数人看作是支持h2的。于是,e提高h2的概率不再是e是h2的证据的必要条件。

上面这个例子表明:有可能存在某个事实或陈述提高了假说的概率,但却没有成为假说的证据,而某个事实或陈述减小了假说的概率,但它却仍然被认为是这个假说的证据。

(二)“高概率”不足以使证据之为证据

那么,“高概率”是否是证据之为证据的必要条件或充分条件呢?本文认为,“高概率”是一个事件或信息成为假说的证据的必要条件,但不是充分条件。如果没有高概率的起点设置,那么炼金术士的信念将因其比柏拉图的哲学理念更像科学而堂而皇之地成为科学;如果没有高概率的起点设置,那么宇宙现在没有热寂将仅仅因为它没有与将来的热寂发生矛盾而成为热寂说的证据。因此,证据是假说达到高概率是证据之为证据的必要条件。那么,问题就被集中到了:高概率是证据之为证据的充分条件吗?

众所周知,1919年5月29日,爱丁顿拍摄到了日全食时由于太阳重力使光线弯曲而导致太阳附近行星的位置发生了改变。这一观测事实被作为爱因斯坦相对论的重要证据载入史册。假设:

e1:1919年5月29日发生日全食。

e2:1919年5月29日,爱丁顿观测队在发生日全食时拍摄到了太阳附近的星光发生了1.7秒的偏转。

h:引力场会使光线发生偏转。

在这个例子中,我们把那种普遍被科学家接受的观点当作已知的,即e2使h达到了高概率,或p(h/e2)>1/2。根据“高概率”概率观,e2是h的证据。这是没有问题的。在前一个式子的基础上,我们可以得到p(h/e1∧e2)>1/2。根据“高概率”观点,我们将会得到“e1∧e2,即e1和e2的合取是h的证据”。这就有问题了。因此,即使p(h/e1∧e2)>1/2,也不可以说“e1是h的证据”或“e1和e2的合取是h的证据。因为e1虽然是一个事实,并且看上去和e2的发生有着直接的关系,但是e1不仅与h没有直接的因果关系,也与e2中对h起确证作用的实质成分“太阳附近的星光发生了1.7秒的偏转”没有因果关系。因此,e1只是一个与h不相干的事实,即使p(h/e1∧e2)>1/2,也不能够说e1是h的证据,或e1∧e2是h的证据。也就是说,只有在p(h/e1∧e2)>1/2并且e1和e2都各自对确证h做出了贡献时,才可以说e1或e2、或e1和e2的合取是h的证据。通过这个例子,本文想表明的是:即使p(h/e1∧e2)>1/2时,“e1∧e2是h的证据”也可能不是成立的,因此,“高概率”不是证据之为证据的充分条件。

[1]Peter Achinstein.The book of evidence[M].New York:Oxford University Press,2001.

[2]PAUL K.Moser.Knowledge and Evidence[M].New York:Cambridge University Press,1989.

[3]R.Carnap.Logical Foundations of Probability[M].Chicago University press,1950.

[4]GLYMOUR C.Theory and Evidence[M].Princeton university Press,1980:64.

猜你喜欢
可接受性概率论起点
法律论证理论对提高裁判可接受性的启示——基于“昆仑燃气公司案”的分析
数学实验在概率论与数理统计中的教学应用
注重裁判理由的可接受性——“寄血验子”案的法律解释分析
浅谈《概率论与数理统计》课程的教学改革
弄清楚“起点”前面有多少
起点
我的“新”起点
新年的起点
论指导性案例制度的冗余与亏空——兼驳“同案同判”与“裁判可接受性”
论《概率论与数理统计》教学改革与学生应用能力的培养