基于最大熵原理的人口预测模型的最优控制

2014-07-22 01:07戴晓娟
赤峰学院学报·自然科学版 2014年7期
关键词:信息熵原理人口

戴晓娟

(宁夏师范学院 数学与计算机科学学院,宁夏 固原 756000)

基于最大熵原理的人口预测模型的最优控制

戴晓娟

(宁夏师范学院 数学与计算机科学学院,宁夏 固原 756000)

本文提出一种基于最大信息熵的人口预测模型,该模型以熵函数作为目标函数,以已知数据的各阶统计距作为约束条件,通过最大化熵来预测人口的发展状况.并通过现有数据,对我国未来人口分布做了相应的预测.

最大熵;预测;模型;最优控制

1 引言

人类社会发展到今日,面临着一系列严峻的挑战,诸如战争与和平、生态失衡、人口爆炸、环境污染、资源短缺等.其中尤为突出是人口问题,因为人口的发展影响和制约着经济的发展,而经济的发展则关乎社会的进步,人类的文明,它们之间是相辅相成的.

以中国为例,由于我国是一个人口大国,我们所面临的人口问题,不仅有人口数量控制的问题,更重要的是面临着复杂的人口流动、管理、保障和发展的问题.在这一过程中,如何遵循以人为本的科学发展观,遵循经济规律和人口变动规律,最大限度的实现社会公正,是新时期人口发展和管理面临的新课题.正确认识人口变动特征,则是解决人口问题的前提.

根据全国第六次人口普查数据的显示,我国人口有如下显著特点:

(1)人口增速减缓,经济社会发展推动生育率的进一步下降

(2)“未富先老”人口老龄化加剧

(3)城市化水平提速,中国已经进入城市人口快速增长期

(4)出生人口性别比例失衡,制约经济发展和社会稳定

(5)流动人口成正增长趋势,影响社会的发展

此研究报告说明,人口老龄化速度加快,高龄趋势明显,这显然也会影响到将来的人口发展.因此我们建立偏微分方程对我国将来的人口数量作出更加合理的估计.即假设人口的数量不仅和时间t有关,还与年龄x有关.

其中t>0为时间,x为人的年龄,均为连续变量,p(x,t)为人口密度函数,μ(x,t)为死亡率,F(x,t)为给定时刻t年龄小于x的人口分布函数.这个连续型人口发展方程描述了人口的演变过程,从这个方程确定出的密度函数可以直接得到各个年龄的人口数,即人口分布函数.

本文在此模型的基础上提出一种基于最大信息熵的人口预测模型,该模型以熵函数作为目标函数,以已知数据的各阶统计距作为约束条件,通过最大化熵来预测人口的发展状况.

2 最大信息熵原理

2.1 基本原理

熵最初来源于热力学.在哲学和统计物理中被解释为物质系统的混乱和无序程度.信息论则认为它是信息源的状态的不确定程度.所谓熵增加原理,是指孤立系统向着微观状态最混乱的方向变化,直到熵达到最大.

1948 年,香农把波尔兹曼熵的概念引入信息论并把熵作为度量一个随机事件的平均不确定性.因此,信息数量的大小,可以用被消除的不确定性的多少来表示,而随机事件的不确定性的大小可以用概率分布函数来描述.

如果随机变量为离散型,X的取值为xi,i=1,2,…,n,xi出现的概率为,则包含其中H是p1,p2,…,pn的信息量为的连续函数,当且仅当p1=p2=…=pn时,H取最大值.

如果随机变量X是连续分布的,其分布密度函数为p(x),X熵定义为

基于熵的定义,可以直观地说明最大熵分布原理:使其熵在一些约束条件下达可以到最大值,即

maxH(X)=-R∫p(x)logp(x)dx

式中,μn为第n阶原点矩,其值可由样本数据计算出来,N为所用原点矩的阶数.

2.2 求解方法

最大熵分布就是在保证样本的统计特性条件下通过调整p(x)使熵H达到最大.现用经典的变分法求解目标函数的极值问题.

引入拉格朗日乘子λ0,λ1,…,λn,令

3 最大信息熵在人口预测模型中的应用

3.1 模型选取

由于偏微分方程考虑了年龄对人口增长的影响,能够更精确地描述人口年龄的结构及发展趋势,故选取我国1990年到2010年的人口数据.

鉴于模型(1)属二维概率分布,有两个变量,所以取时间为任意固定值,密度函数的变化决定人口的分布.我们首先来确定时刻t年龄为x的人口死亡率μ(t,x),由于现阶段由于医疗水平等条件的限制,可以近似地认为在一定时期内人口死亡率是保持不变的,即认为μ(t,x)仅仅是年龄x的函数μ(x).利用提供的数据进行数据拟合,得到的年龄与死亡率之间的函数关系为:

3.3 根据特征值矩阵求出各个约束条件,应用最大熵原理求出特征估计的分布函数,得到一个预测的人口分布函数pi,根据式(1),(2)可得

其中x为人口的年龄变量,是预测问题的变量.通过调整p来使得熵最大,并采用拉格朗日乘子法来求解此问题.

式(10)就是最大熵概率密度函数的解析形式.将式(10)代入式(3)可得

整理后可得

把(9)式代入(6)式,即可得到此人口的概率密度函数确定的最大熵.再把(5)与(9)式代入(1)式,可得到人口的结构预测和人口分布结果.

4 实例研究

通过以上所述模型的建立过程及相应的算法,运用历年的统计数据,借助Matlab软件对我国人口分布作中长期(2020年~2050年)预测,求得以下结果:

图1

图2

由图1可以看出,我国人口结构老龄化进程加速,在2050年左右达到高峰,随机趋稳.图2得出,到2020年乡镇人口大批涌入城市,城市人口饱和.除此,还可以看出,在实现稳定低生育水平的前提下,由于人口基数大,未来相当一个时期人口还将持续增长,但由于计划生育政策的执行使我国人口得以控制,在40到50年以后将达到零增长.

5 结论

利用最大熵原理分析人口密度函数,从而确定人口分布函数,得到的对未来人口结构和分布的预测情况.我国人口的年龄变化是一种随机事件,最大熵方法确定的被测量分布是含有最少主观假定的分布,因此用最大熵原理来预测其分布是可靠的.

〔1〕朱雪龙.应用信息论基础[M].北京:清华大学出版社,2001.

〔2〕沈世镒,吴忠华.信息论基础与应用[M].北京:高等教育出版社,2004.7.

〔3〕徐宗学.熵极大识别准则及其应用[J].武汉水力电力学院学报,1987.

〔4〕马力,张学文.最大熵原理与概率分布函数[M].数理统计与应用概率,1993.

〔5〕冯利华,张萍.基于最大熵原理的台风统计预报[J].海洋科学,2003,27(3):47-51.

〔6〕朱成骐,孙宏斌,张伯明.基于最大信息熵原理的短期负荷预测综合模型[J].中国电机工程学报,2005(l0):1-6.

〔7〕李环,高全胜,李育武,周静.中国人口增长的状态空间预测模型 [J].武汉工业学院学报,2009,28 (1):101-105.

O232

A

1673-260X(2014)04-0016-03

本文系校科研项目(YB201347)

猜你喜欢
信息熵原理人口
《世界人口日》
人口转型为何在加速 精读
基于信息熵可信度的测试点选择方法研究
了解咳嗽祛痰原理,有效维护健康
平均场正倒向随机控制系统的最大值原理
人口最少的国家
1723 万人,我国人口数据下滑引关注
化学反应原理全解读
一种基于信息熵的雷达动态自适应选择跟踪方法
通信原理教学改革探索