如何准确理解与表述泊松定理

2015-12-16 03:42翟明娟
长治学院学报 2015年5期
关键词:重数伯努利二项分布

翟明娟

(长治学院 数学系,山西 长治 046011)

如何准确理解与表述泊松定理

翟明娟

(长治学院 数学系,山西 长治 046011)

文章明确了对泊松定理条件中“事件A在一次试验中发生的概率与试验次数有关”的准确理解;指出产生误解的原因,因而对泊松定理的重述很有必要。最后,给出泊松定理的准确表述,并进一步说明现有部分教材中的泊松定理是重述的泊松定理的一种特殊情形。

伯努利试验的特征;泊松定理;特例

1 引言

泊松定理是概率统计中的一个重要定理,在二项分布的近似计算中应用广泛。但现有教材对该定理的叙述不准确,不利于学生对其正确理解。如茆诗松等编著的普通高等教育“十一五”国家级规划教材[1]《概率论与数理统计教程(第二版)》中的泊松定理的表述为:在n重伯努利试验中,记事件A在一次试验中发生的概率为pn(与试验次数n有关),如果当时n→∞,有npn→λ,则

该定理中“事件A在一次试验中发生的概率为pn(与试验次数n有关)”的这一叙述不仅不准确,而且很容易误导学生,使学生对二项分布中的参数p产生错误理解:认为二项分布中事件A的概率p是变化的,即随着试验次数n的变化而变化。

教材[2]中的泊松定理的表述与教材[1]中的表述完全相同。另外,普通高等教育“十一五”规划教材[3]-[5]中对泊松定理的表述与上述表述略有不同,虽然没有明确说明事件A在一次试验中发生的概率pn与试验次数n有关,但仍隐含“事件A在一次试验中发生的概率pn与n有关”。学生对这些教材中所表述的泊松定理不仅难以理解,而且容易与二项分布的正确理解发生冲突,形成学习过程中不应该有的一个障碍。

泊松定理讲述的是二项分布与泊松分布具有如下关系:当二项分布中的两个参数n较大同时p较小时二项分布的极限分布为泊松分布。泊松定理的这一结论完全正确,但学生对定理的条件中的部分表述难以理解:记事件A在一次试验中发生的概率为pn,括号中特别注明事件A的概率与试验次数n有关。学生在学完二项分布之后,认为在某个n重伯努利试验下产生的二项分布的两个参数n和p是不变的;即只要n重伯努利试验做完,n和p就确定了,就是不变的两个常数。尤其是事件A在一次试验中发生的概率p是不变的,即不管做了几重的伯努利试验,也不管A事件在第几次试验中,其发生的概率都是同一个数p,是不变的,即p不会随着试验次数n的变化而变化。而从现有教材对泊松定理的表述中很自然地认为:事件A在一次试验中发生的概率pn与试验次数n有关,随试验次数n变化而变化,不再具有不变性。这样不就矛盾了吗?到底哪一种理解对?哪一种理解错?如果错,错在什么地方?应如何纠正?

要正确回答以上几个问题,需要从二项分布的定义和产生二项分布的伯努利试验的特性等方面来入手。

2 n重伯努利试验中的二项分布

教材[1]对二项分布的定义为:如果设X为n重伯努利试验中A事件出现的次数,则X的分布列为:P(X=k)=Cnkpk(1-p)n-k,k=0,1,…,n;称此分布为参数为n,p的二项分布,记作B(n,p)。从该定义可得二项分布的应用场合为:n重伯努利试验中事件A出现的次数。既然二项分布的应用场合为n重伯努利试验中事件A出现的次数,那对伯努利试验的判别就很关键,因为只有在伯努利试验中才能产生服从二项分布的变量。

2.1 n重伯努利试验及其特征

如果n个试验E1的任一结果、E2的任一结果、……、En的任一结果都是相互独立的事件,则称此n个试验相互独立。如果这n个独立试验还是相同的,则称其为n重独立重复试验。如果在n重独立重复试验中,每次试验的可能结果为两个:A或A¯,则称这种试验为重伯努利试验[1]。比如一个班级有N个同学,某次统计学期末考试有M个同学及格。从该班级中有放回观测n个同学的成绩,每次抽取一位同学并观测其成绩是否及格,共观测n次,则该试验就可以看作是一个n重伯努利试验。因为对于每次抽中的学生,均观测其成绩是否及格,则此次试验为重复独立试验;又因为每次试验的可能结果为两个:不是及格就是不及格;因此观测每个同学的成绩是否及格就是做一个n重伯努利试验。

通过上例,伯努利试验的特性可概括为:结果具有对立性、概率具有不变性、试验具有独立性[6]。对立性是指每次观测结果仅有两个A与A¯,如在上例中则为:每次抽中同学的成绩要么及格(A),要么不及格(A¯)。不变性是指事件A在每一次试验中出现的概率都是相等的,是指每次抽中的同学及格的概率都是若A表示“第i次抽中同学的成i绩及格”,i=1,2,…,n,则有P(A1)=P(A2)=…=P(An)= P(A)=p。独立性[2]是指各次观测的结果互不影响,即n次观测中的任意某一次或某几次的观测结果不影响其它任意某一次或某几次的观测结果,比如上例中不管第i次抽中的同学是否及格都不影响第j次抽中的同学是否及格;即有:等。

具体问题中可利用上述三个特性来判断n次观测是否是一个n重伯努利试验。例如:某生产车间有n台独立工作的同类型机床(该类型机床的故障率为p),每台机床均生产同样的产品。现对该车间进行检修就是一个n重伯努利试验。因为对每台机床来说要么出故障,要么没故障(对立性)、每台机床出故障的概率都为p(不变性)、第i台机床是否出故障不影响第j台机床是否出故障(独立性)。因为共检查n次,所以此次检修中该车间出故障的机床数服从参数为n,p的二项分布B(n,p)。

2.2 二项分布中参数的性质

由上所述可知事件A发生的概率p具有不变性,这个不变性具体体现在三方面:一是不管这个伯努利试验做了多少重,是10重还是20重;二是不管在第几次试验中,在第1次试验中还是在第5次试验中;第三,不管A事件在某次试验中是否发生,其概率p均是不变的。概率p的不变性正是伯努利试验所具有的独立重复特性的外在表现。教材中虽然没有给出参数的这种性质的明确表述,但在给出重伯努利试验的概念和二项分布的定义之后所举的例子中均体现了这一点,学生的潜意识里均认为p是不变的。

3 泊松定理的准确表述

3.1 对泊松定理的误解及产生误解的原因分析

再返回看泊松定理有关事件A的概率的叙述:记事件A在一次试验中发生的概率为pn,与试验次数n有关。表面看来,这与二项分布中事件A在一次试验中发生的概率具有的不变性是相互矛盾的,学生也常常针对教材中这两处“自相矛盾”的地方提出异议。究其原因,是由于学生对二项分布的应用场合不清楚,即对n重伯努利试验的特征认识不清以及泊松定理本身的表述不准确而造成的,尤其是泊松定理本身对“事件A在一次试验中发生的概率与试验次数有关”这一表述不准确极易误导学生造成的。

因为对泊松定理“在n重伯努利试验中,事件A在一次试验中发生的概率pn与试验次数n有关”中的“n重伯努利试验”存在如下三种理解:第一,n重伯努利试验为相同重数的不同的伯努利试验序列。此时,事件A不同,则事件A的概率也就不同。比如一次抛掷一枚骰子,共抛n次的第一个n重伯努利试验中,设事件A表示“每次抛掷后出现的点数为1点”,则在一次抛掷一枚硬币,共抛n次的第二个n重伯努利试验中,设事件A表示“每次抛掷后正面朝上”这一随机事件,则在这两个相同重数的不同伯努利试验中,由于事件A是不同的事件,导致了事件A在一次试验中发生的概率是不同的,表面看来不再具有不变性,但这种情况下事件A在一次试验中发生的概率的不同与二项分布中事件A在一次试验中发生的概率的不变性并不矛盾。也就是说,按照这种理解,泊松定理中“事件A在一次试验中发生的概率pn与试验次数n有关”与二项分布中事件A在一次试验中发生的概率的不变性本质上是不矛盾的;但此时导致p变化的原因并不是像教材[1、2]中所述的“与试验次数有关”,导致变化的原因是由于伯努利试验本身是不同的,与试验次数n毫无关系。

第二,n重伯努利试验为不同重数的不同的伯努利试验序列。此时,同样由于事件A本身不同,则事件A的概率p也就不同。比如一次抛掷一枚骰子,共抛n1次的第一个n1重伯努利试验中,设事件A表示“每次抛掷后出现的点数为1点”这一随机事件,则在一次抛掷一枚硬币,共抛n次的

2第二个n1重伯努利试验中,设事件A表示“每次抛掷后正面朝上”这一随机事件,则在这两个具有不同重数的不同伯努利试验中,同样由于不同的伯努利试验中事件A是不同的事件导致了事件A在一次试验中发生的概率是不同的,表面看来不再具有不变性。巧合的是,在这种情况下,事件A在一次试验中发生的概率表面看来确实与试验次数有关,即与伯努利试验的重数有关。但实质上这和第一种情况下事件A在一次试验中概率的不同是由于相同的原因造成的,都是由于伯努利试验是不同的试验才表现为事件A发生的概率不同。即在这种理解下,泊松定理中“事件A在一次试验中发生的概率pn与试验次数n有关”与二项分布中事件A在一次试验中发生的概率的不变性本质上不矛盾,但教材中泊松定理对伯努利试验的表述应该为一系列不同的伯努利试验序列(该序列中每个试验的重数可以相同,也可以不同),而不是一个伯努利试验。

第三,n重伯努利试验为不同重数的相同的伯努利试验序列。事件A在一次试验中发生的概率p是不变的,这与泊松定理中的“事件A在一次试验中发生的概率pn与试验次数n有关”就是一个矛盾。比如一次抛掷一枚骰子,共抛10次的第一个伯努利试验中,设事件A仍表示“每次抛掷后出现的点数为1点”这一随机事件,则在一次抛掷一枚骰子,共抛20次的第二个伯努利试验中,则事件A的概率是不变的,与伯努利试验的试验次数n没有一点关系。因此,在这个不同重数相同伯努利试验所产生的不同的伯努利试验序列中,由于事件A是同样的事件,其在一次试验中发生的概率具有不变性,在这种情形下,泊松定理中“事件A在一次试验中发生的概率pn与试验次数n有关”与二项分布中事件A在一次试验中发生的概率的不变性就是矛盾的。

3.2 泊松定理的准确表述

由上所述,对泊松定理中“事件A在一次试验中发生的概率与试验次数有关”的三种理解中,只有第二种理解是完全正确的,第一种理解虽然避开了本质矛盾,但和第三种理解一样都难以逾越“事件A在一次试验中发生的概率与试验次数有关”这一理解障碍。另外,从教材内容衔接角度上看,尽管教材中的“自相矛盾”只是表面现象,非本质问题,不能因此判定教材中泊松定理的表述是错误的,但至少是不准确的,容易产生像如上所述的第一和第三种情况的误解,故对泊松定理的重述很有必要。那又应该怎样重述?

对于泊松定理的准确表述应基于以下三点:一是为避免出现如上所述的第三种误解,事件A应明确是不同伯努利试验下的事件,事件不同其概率pn自然不同;二是为避免出现如上所述的第一种误解,不同的伯努利试验应该用不同重数表示,这样学生对事件A在一次试验中发生的概率pn的变化原因的理解就不会产生分歧:是由于伯努利试验本身的不同造成的,与伯努利试验的次数无关;三是考虑到泊松分布当参数λ充分大时其极限分布为正态分布这一结论,应强调λ不应太大,否则二项分布的极限分布为正态分布,而不是泊松分布了。

综上所述,泊松定理应表述为:有一系列的伯努利试验序列:在第i个n(ini为正整数)重的伯努利试验中,每次试验只有两个结果Ai和表示事件Ai在一次试验中发生的概率,Xi表示此ni重的伯努利试验中事件出现Ai的次数,则Xi~B(ni,pi),i=1,2,……,n,……。当随机变量序列{Xi}的参数列{(ni,pi)}(i=1,2,……,n,……)满足

即泊松定理的实质是:当二项分布的两个参数满足:第一个参数ni充分大,且此时两个参数的乘积nipi不太大时,其极限分布为参数为nipi的泊松分布。该定理的证明和现有教材中的证明类似,只需将现有教材证明过程中的n换成ni,pn换成pi即可,不再赘述。

3.3 教材中的泊松定理是重述的泊松定理的一个特例

在3.2中所述的泊松定理中,令ni=i,则此定理为教材[1]-[5]中所述的泊松定理。进一步,若理解了泊松定理的实质,记二项分布的两个参数仍为n,p,则重述的泊松定理就是教材[7]中所述的泊松定理。因此,教材[1]-[6]中的泊松定理只是重述的泊松定理的一种特殊情形。

4 结论

泊松定理给出特定类型的二项分布和泊松分布的关系,在二项分布的近似计算中应用广泛。但多数教材对于泊松定理的相关表述不准确,学生对此不仅难以理解,而且容易与二项分布的正确理解发生冲突,形成学习和应用过程中不应该有的一个障碍。鉴于此,文章首先指出多数教材对该定理的相关表述不准确,容易产生误解;其次借助于n重伯努利试验的特征及对教材中泊松定理相关表述的三种理解基础之上,明确了泊松定理的条件中“事件A在一次试验中发生的概率与试验次数有关”的准确理解;同时指出产生误解是由于泊松定理的叙述不准确造成的,从而对泊松定理的重述很有必要。最后,给出泊松定理的准确表述,并进一步指出现有教材[1]-[6]中的泊松定理是文中重述的泊松定理的一种特殊情形。

[1]茆诗松,程依明,濮晓龙.概率论与数理统计教程(第二版)[M].北京:高等教育出版社,2011,93—99.

[2]魏宗舒.概率论与数理统计教程[M].北京:高等教育出版社,1983,65—66

[3]盛骤,谢式千,潘承毅.概率论与数理统计教程(第四版)[M].北京:高等教育出版社,37—38.

[4]韩旭里,谢永钦.概率论与数理统计[M].上海:复旦大学出版社,2006,38—39.

[5]杨振明.概率论(第二版)[M].北京:科学出版社,2004,66.

[6]翟明娟.概率统计中有关超几何分布的一个误解[J].统计与决策,2014(03):26—28.

[7]沈恒范.概率论与数理统计教程(第四版)[M].北京:高等教育出版社,2003,47—48.

(责任编辑 赵巨涛)

O212

A

1673-2015(2015)05-0061-04

2015—08—13

翟明娟(1976—)女,山西运城人,副教授,主要从事统计方法及其应用方向研究。

猜你喜欢
重数伯努利二项分布
二项分布与超几何分布的区别与联系
C3型李代数的张量积分解
微分在代数证明中的两个应用
关于伯努利方程的一种新解法
深度剖析超几何分布和二项分布
概率与统计(1)——二项分布与超几何分布
A3型李代数的张量积分解
以较低截断重数分担超平面的亚纯映射的唯一性问题
二项分布参数的E-Bayes估计及其应用
一种伯努利原理研究的实验装置