通过随机变量刻画随机现象加深理解随机思想(续)

2022-07-12 12:29程海奎章建跃

数学通报 2022年2期

程海奎章建跃

(1.河北师范大学数学科学学院 050024; 2.人民教育出版社课程教材研究所 100081)

4.4 二项分布与超几何分布

二项分布是最常见的一种离散型分布，19世纪以前的概率统计可以说就是二项分布的天下.我们知道，保险业是最早应用概率论的领域，在有关保险的问题中涉及大量的二项分布计算问题.另外，在很长时期内，统计方法在社会问题中的应用主要限于人口统计，特别是出生的男、女婴儿的性别比例问题，这是一个典型的二项分布问题.

就像函数中的基本初等函数一样，二项分布是离散型概率模型的代表，其研究的整体架构是：

背景——n重伯努利试验的特征——二项分布模型——应用.

超几何分布的研究也有类似的架构.

4.4.1 抽象 n重伯努利试验的特征

在抽象n重伯努利试验的特征时，要特别关注“重复”和“独立”这两个关键词的含义.“重复”是指每次试验的条件完全相同，且事件A的概率保持不变；“独立”指的是各次试验的结果互相不受影响.

教学中，应通过创设情境、提出问题，引导学生开展n重伯努利试验特征的抽象活动：每个问题中的伯努利试验是什么？定义“成功”的事件为A，那么A的概率是多大？重复试验的次数是多少？各次试验的结果是否独立，如何判断？关注的随机变量是什么？下面通过5个实际问题情境的分析，讨论如何引导学生思考的问题.

(1)掷一枚质地均匀的硬币10次, 恰好有4次正面朝上的概率是多少？

(2)图2是高尔顿板的示意图.将小球从顶端放入，小球下落的过程中，每次碰到小木钉后都等可能地向左或向右落下，最后落入底部的格子中.求小球落入从左到右第3号格子内的概率.

图2

(3)(随机游动问题)如图3，一个质点在随机外力的作用下，从原点0出发，每隔1s等可能地向左或向右移动一个单位，共移动8次.求质点回到原点的概率.

图3

(4)1000名中学生购买了“意外伤害保险”，假设一年内出险的概率为0.001，那么一年内恰好2人发生意外伤害事故的概率是多少？

(5)袋子中有4个红球，6个白球，从中不放回地抽取4个，那么其中有2个红球的概率是多少？

将问题的思考结果列表如下：

问题编号伯努利试验事件AP(A)重复试验次数n各次试验是否独立关注的随机变量X1掷硬币正面朝上0.510是正面朝上的次数2小球下落的方向向右下落0.510是小球向右下落的次数3质点移动方向向右移动0.58是质点向右移动的次数4观察个人是否出险发生意外0.0011000是发生意外的人数5摸球试验摸到红球0.45否摸到红球的个数

其中问题1，2，3虽然情境不同，但试验的本质特征完全相同，都可以归为重复掷硬币试验.关于试验独立性的判断，有时是根据实际问题情境来判断(问题1和问题4)，有时是合理的假定(问题2和问题3)，问题5由于是不放回摸球，所以各次试验的结果不独立，不满足n重伯努利试验的特征.

4.4.2 二项分布分布列的推导

人教A版采用由特殊到一般的方法，推导二项分布的分布列.先设计探究栏目，引导学生考虑特殊情形，以3次射击为例，求中靶次数X的分布列.借助树状图，表示事件{X=k}，利用概率的加法公式及独立事件的乘法公式求P{X=k}.接着思考射击次数为4时，如何表示事件{X=k}？如何求P{X=k}? 最后由特殊到一般地得到X的分布列.

在这个过程中，用到了事件的表示、概率的运算法则、组合计数等知识，以及由特殊到一般的推理方法.教学中要让学生充分经历这个探究过程.

我们还可以类比二项式定理的推导过程，直接从一般情形推导X的分布列：

设每次试验，“成功”用1表示，“失败”用0表示，则n重伯努利试验的样本空间为

Ω={x1x2…xn|xi=0，1；i=1，2，…，n}.

可以得到如下结果：

求a+b()n的展开式求P(X=k),k=0,1,…,n根据多项式乘法,展开式共有2n项,每一项都是一些a与b的乘积,次数为n.样本空间包含2n个样本点(基本事件),每个样本点都是长度为n的由1和0构成的数组.根据组合计数原理,包含k个a、n-k个b的项akbn-k共Ckn项,合并同类项得展开式的一般项为Cknakbn-k.事件X=k{}包含所有的有k个1、n-k个0的样本点,共有Ckn个.由独立性条件,每个样本点的概率均为pk(1-p)n-k,由概率的加法公式得P(X=k)=Cknpk(1-p)n-k.a+b()n=∑nk=0Cknakbn-k.∑nk=0Cknak(1-p)n-k=(p+(1-p))n=1.

4.4.3 二项分布与超几何分布的联系与区别

超几何分布主要用于不放回简单随机抽样中概率的计算，其中对抽取的每个个体只考虑是否具有某种特征.例如，抽取的产品是否合格，选择的学生代表是男生还是女生，观察某电子产品的使用寿命是否超过5000小时等等.对于不放回简单随机抽样，每次抽取时条件不同，且各次抽取的结果不独立，不满足n重伯努利试验的特征.

我们可以用摸球试验来描述超几何分布模型特征.

袋子中有大小相同的N个球，其中有M个红球，N-M个白球，不放回随机摸出n个球，设X表示摸出的n个球中红球的个数，则X所服从的分布称为超几何分布.

问题100个球中有40个红球，60个白球，采用有放回和不放回两种方式随机抽样，分别抽取20个球，设X为这20个球中红球的个数.采用有放回随机抽样，显然X服从二项分布B(20, 0.6)；采用不放回抽样，由于各次抽样结果之间不相互独立，不符合n重伯努利试验的特征，可以根据古典概型求X的分布列.

无论采用有放回抽样还是不放回抽样，每次抽取一个个体，都是一个伯努利试验，区别在于有放回抽样时各次试验结果相互独立，而不放回抽样各次试验结果不独立.

摸球方式X的分布E(X)D(X)有放回摸球二项分布 B(n,p)npnp(1-p)不放回摸球超几何分布h(N,M,n)npnp(1-p)N-nN-1

(1)对应同一个摸球模型，两个分布的均值相同，但超几何分布的方差较小，反映超几何分布概率更集中于均值附近.

样本容量有放回抽样P|Xn-0.4|≤0.1()不放回抽样P|Xn-0.4|≤0.1()n=200.74690.7988n=400.85470.9399n=600.91420.9936n=800.94841

可以发现：用样本中红球的比例估计总体中红球的比例，在相同的样本容量误差限定下，不放回抽样估计的可信度要高；同时，两种抽样方式，样本容量越大估计的可信度越高.

4.5 由误差模型构建正态分布模型

正态分布是概率论中最重要的一种分布.一方面，正态分布是自然界最常见的一种分布，例如，测量误差，射击时弹落点的分布，人的生理特征的尺寸(身高、体重等)，自动流水线生产的各种产品的质量指标(如零件的尺寸、袋装食品的质量)等，都近似服从正态分布.一般地，若影响某一数量指标的因素很多，而每个单一因素影响又非常微小时，则这个指标近似服从正态分布.另一方面，正态分布有许多优良性质，许多分布可用正态分布来近似，统计中的一些重要分布可以通过正态分布来导出.因此在理论研究中，正态分布十分重要.

4.5.1 如何刻画连续型随机变量的分布

现实世界中多数随机变量可分为离散型随机变量和连续型随机变量.我们知道，一维几何概型是一个连续型分布模型.考虑到学生的认知基础，课程标准不再要求学生学习几何概型，而且不要求对连续型随机变量做一般研究，只要求通过误差模型，借助于直方图的直观，了解服从正态分布的随机变量，知道连续型随机变量.

由于对连续型随机变量不进行严格定义，所以教学中通过典型随机试验，直观认识连续型随机变量的特征很有必要.这类变量的主要特征有：

(1)取值不能一一列举；

(2)取值充满某个区间(整个实轴)；

(3)取每个单点值的概率都为0；

(4)不能使用分布列来描述其概率分布规律，在实际应用中，主要关注的是变量的取值落在任意区间内的概率.

4.5.2 如何建立正态分布模型

必修课程中，我们用频率分布表整理数据，用频率直方图直观描述连续数据的分布，这给构建连续分布模型提供了重要的思路.人教A版建立正态分布模型的过程如下：

(1)对误差随机变量X进行观测，获得误差样本数据；

(2)借助直方图的直观，描述样本数据的分布规律；

(3)根据频率与概率的关系进行直观想象，得到一条钟形曲线；

(4)对这条曲线的特征作出描述：在x轴上方，具有对称性且曲线与x轴围成的面积为1.

上述过程可以用图4表示.由此就可用任意区间[a,b]上对应的曲边梯形面积表示概率P(a≤X≤b)，只要给出曲线对应的解析表达式(密度函数)，就完成模型的构建过程.这是由经验分布模型过渡到理论模型的数学建模过程.

图4

接着考察密度曲线的特征，参数对密度曲线的影响及意义，通过正态分布的3σ原则，加深对正态分布的认识.

必须注意的是：

(1)由于中学数学知识的限制，正态分布的许多结论无法严格证明或直接计算.例如，密度曲线与x轴围成的面积为1，概率P(a≤X≤b)的计算，3σ原则的证明，连续型随机变量的均值和方差的严格定义等.教学中可以借助数学软件加以弥补.

(2)就像各种基本初等函数一样，正态分布也是一个理论模型，现实中的一些变量一般只是近似服从正态分布.对于有的随机变量，可以通过观测获得样本数据，根据直方图的形状大致判断是否服从正态分布.例如，人教A版统计必修中给出的100户城市居民家庭月用水量数据，其直方图明显不符合正态分布；又如，我们经常假设学生的考试成绩服从正态分布，这需要试卷试题数目、难度系数的分布、各题的区分度等都符合一定要求的条件下，这个假定才合理.

下面举一个不服从正态分布的连续型随机变量的例子.

例在近似计算中，需要按规定的精度对实数进行四舍五入，如果对任意取得的一个实数四舍五入保留整数，那么舍入误差X是连续型随机变量.请问，X服从怎样的分布？

对任意得到的n个实数，四舍五入保留到整数，误差的取值范围为[-0.5,0.5]，直方图如图5所示：

图5

观察直方图，可以发现，随着样本容量的增大，X的取值落在每个小区间内的频率(小矩形的面积)都在0.1附近波动.所以推测X取值于任何长度为0.1的区间内的概率为0.1，称X服从区间上[-0.5,0.5]的均匀分布.可以用密度函数

描述X的概率分布.如图6所示，我们有

图6

5 在解决实际问题的过程中渗透随机思想

概率研究随机现象的规律性，为人们从不确定性的角度认识客观世界提供重要的思维模式和解决问题的方法.所以概率教学应以理论联系实际为导向，利用概率知识解释客观事实，解释某些规则的合理性，进行风险决策，使学生在解决实际问题的过程中领悟随机思想，提高数学抽象、数学建模等素养.下面举例说明概率的实际应用.

例1为了比较甲、乙两种新药哪种更有效，进行动物试验方案如下：每一轮选择两只白鼠对药效进行对比试验，随机选取一只施以甲药，另一只施以乙药.一轮的治疗结果得出后，再安排下一轮试验，当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时就停止试验，并认为治愈只数多的药更有效.约定：对于每轮试验，若施以甲药的白鼠治愈且施以乙药的白鼠未治愈，则甲药得1分，乙药得-1分；若施以乙药的白鼠治愈且施以甲药的白鼠未治愈，则甲药得-1分，乙药得1分；若都治愈或都未治愈，则两种药都得0分.

设甲、乙两药的治愈率分别为0.5和0.8，若甲药和乙药在试验开始时都赋予4分，pi表示“甲药的累计得分为i时，最终认为甲药更有效的概率”, 求p4并根据p4的值解释这种试验方案的合理性.

从直观分析，甲药的治愈率明显低于乙药，但经过多轮试验，事件A=“甲药比乙药多治愈4个”是有可能发生的，如果A的概率很小，说明试验方案合理，如果事件A的概率较大，则说明试验方案不合理.概率决策不可能做到百分之百正确，只要发生错误的概率可控制在一个较小的范围内就是合理的.

容易计算，每轮试验甲药得分X的分布列为

X-101P0.40.50.1

由全概率公式得

pi=0.4pi-1+0.5pi+0.1pi+1，

i=1，2，…，7，p0=0,p8=1.

例2设某种疾病的自然痊愈率为20%.在有关部门批准后，某医院把一种新药给患有这种疾病的10位病人服用，试验方案为：若这10个病人中至少有6个治愈了，则认为这种药有效，提高了治愈率；否则认为这种药无效.

如果新药的确有效，把治愈率提高到了80%，求通过试验却认定该药无效的概率p，并根据p值的大小解释试验方案是否合理．

将10人服用新药视为10重伯努利试验.在每次试验中，每位病人痊愈的概率为0.8，且每个人是否痊愈是相互独立的.设X表示这10个人中痊愈的人数，则X～B(10,0.8).设事件B=“经过试验该药被认定无效”，事件B发生等价于{X≤4}.

≈0.0064.

由题意，新药有效.当痊愈的人数不超过4人时，认定新药无效，此时做出了错误的判断.因为概率p很小，所以试验方案合理.

思考：在问题2中，如果给100位病人服用，结果至少有40人痊愈了，这种新药是否有效？

假设新药无效，由于该疾病的自愈率只有20%，根据频率的稳定性，100人大约有20人左右痊愈.现在至少有40人痊愈了，因此直观判断新药是有效的.

对这个问题，应该如何进行严格的数学描述呢？

设100个人服药后治愈的人数为X，假设新药无效，则X～B(100,0.2).那么100个人至少有40人痊愈的概率为

≈3.61×10-6.

依据小概率原理，这么小概率的事件认为是不会发生的，一旦发生了，则认定假设“新药无效”是一个错误的判断，所以认为新药有效.

6 教学建议

6.1 通过典型实例帮助学生理解概念, 培养数学抽象素养

在本单元中，条件概率、随机变量、随机变量的均值和方差等都是不容易理解的概念，教学中要通过典型的、丰富的、学生熟悉的问题情境，引导学生经历具体实例的分析到共性特征的归纳再到本质特征的抽象的完整过程，使抽象概念建立在具体背景的基础上.

(1)对于条件概率的概念，可以按如下步骤展开教学：

先选择从2×2分类的总体中抽样的问题，使学生认识到附加事件A发生的条件下，试验的样本空间缩小了，即事件A发生的条件下，事件B的条件概率本质上是在缩小的样本空间A上求事件B发生的概率；

再引导学生考虑一般的古典概型，进一步认识条件概率的意义；

最后从特殊到一般，归纳出条件概率的定义.

从这个抽象过程中，可归纳出求条件概率的两种方法.

对随机事件的独立性与条件概率之间的关系，也要采用先直观描述再进行数学推理的方法.

(2)引入随机变量概念，将随机试验的样本点数量化，建立样本空间到实数集的对应关系，这是对随机现象的进一步抽象，为利用丰富的数学工具全面、系统地研究随机现象的规律性提供了新方法．对离散型随机变量概念的教学，应结合典型的随机试验，引导学生建立样本空间，根据需要建立样本点到实数的对应关系，在共性分析的基础上归纳概括出随机变量的定义．同时，要让学生通过用随机变量的关系式表示随机事件，用分布列描述变量的概率取值规律，充分理解基于随机变量及其分布解决实际问题的一般方法．

(3)随机变量的均值与方差都是度量性概念，度量性概念一般因比较而产生.教学中可选择有关比较的问题情境，例如为比较两名运动员的射箭水平，从n次射箭命中环数的均值出发，根据频率稳定到概率的原理，引入随机变量均值的概念．

总之，对于随机变量这样抽象程度高的概念，多举例子，通过例子帮助学生理解，这是基本的教学策略.

6.2 引导学生经历抽象随机试验的特征、推导分布列的过程

在二项分布、超几何分布、正态分布的教学中，要通过设计恰当的问题情境，让学生经历归纳概括随机试验的特征、推导分布列的过程，从而理解每一种分布的本质特征，这对学生在面对实际问题时能否正确选择概率模型起着关键作用.

(1)二项分布的教学

可以通过不同背景的随机试验，引导学生思考：

问题中的伯努利试验是什么？

定义“成功”的事件为A，那么A的概率是多大？

重复试验的次数是多少？各次试验的结果是否独立？关注的随机变量是什么？

对于分布列的推导，可以借助树状图，利用事件的关系与运算、概率的加法公式、独立事件的乘法公式、排列组合等知识，由特殊到一般的方式展开.

(2)超几何分布的教学

要借助有放回抽样和不放回抽样的对比，重点是判断各次试验结果是否独立.可以让学生思考：

建立二项分布和超几何分布模型的过程与建立古典概率模型的过程有什么不同之处？

实际上，古典概率模型是根据试验的特征，用定义的方式规定了事件的概率计算公式；二项分布是根据试验的特征，利用概率的加法公式与乘法公式推导出分布列，而超几何分布是一个特殊的古典概型.

(3)正态分布的教学

从描述误差数据的分布引入，首先应引导学生认识误差随机变量的取值不能一一列举，不能用分布列描述其概率分布，从而使他们认识到寻找新的工具来刻画变量的概率分布的必要性.在问题的引导下，从频率分布直方图，过渡到分布密度曲线，根据密度曲线的特征，建立用分布密度函数刻画概率分布的正态分布，在此过程中使学生体会由经验模型建立理论模型的思想方法.

6.3 在一般观念指导下研究相关性质，培养直观想象和推理能力

本单元内容基于随机变量描述随机现象，侧重概念、模型.在对相关性质的教学中，要注意一般观念的指导作用，运用类比、从特殊到一般、直观想象加计算验证等方法，培养学生的推理能力.例如：

(1)对于条件概率的性质，根据条件概率是缩小样本空间上的概率的意义，可得其具有和概率相同的性质——非负性、规范性、可加性等，再由条件概率的定义进行验证．

(3)对于随机变量均值和方差的性质，可以先根据数字特征的意义以及随机变量的实际意义猜想结果，再计算验证.可以引导学生类比函数性质(单调、最值、对称)，观察二项分布的各种不同的概率分布图，猜想二项分布有哪些性质，再进行证明.

6.4 加强与信息技术的融合，加深对概率分布的理解

二项分布、超几何分布、正态分布有关概率的计算、概率分布图或正态密度曲线的绘制等都需要借助信息技术工具来完成.例如，利用电子表格或GeoGebra软件计算二项分布和超几何的分布列，了解二项分布与超几何分布的区别与联系；通过随机模拟试验，了解样本均值(方差)与随机变量的均值(方差)的关系；利用正态分布随机数函数产生随机数，绘制频率分布直方图，了解正态分布的特征；利用GeoGebra软件计算正态分布相关概率等等.(续完)