浅谈生物学和生态学中的信息

2021-03-18 09:27李冉周长发
中学生物学 2021年11期
关键词:生态学生物学信息

李冉 周长发

摘要 通过对熵、信息等概念原义、起源与内在逻辑的梳理和浅显化解释,发现生物学中的熵既可抽象、定性地描述生物有机体各层次的有序性存在状态,也可定量计算和表述有机体各系统组成成分的多样性与数量比率,因而它可显示和表达有机体内稳态、生态平衡以及生物多样性指数。对信息与香农熵的准确理解与把握,是在宏观层面理解和表述生物及其存在状态的基础。

关键词 熵 信息 香农多样性指数 生物学 生态学

中图分类号 Q-49

文献标志码 E

信息是生物学、生态学中的重要概念,常与“物质、能量”相提并论,如在介绍生态系统定义、生态平衡以及生物体内稳态时用到的“信息(负)反馈”等。然而,对于“信息”这一抽象概念,许多文献将其具体化或泛化、甚至公式化,从而给理解与讲授带来一定的困难。下面试图从其起源、本质含义的角度,对“信息”概念以及它在生物学、生态学的应用作一浅显介绍,以帮助理解、方便教学、加深记忆。

1熵与信息的含义

1.1物理学中的熵

基本的物理定律认为,在一个孤立或封闭系统中,即与外界没有能量与物质交换的系统中,如果给予足够长的时间,这一系统空间中的分子最终将是均衡的或均一的。例如,向一个盒子中注入两种颜色的气体,或向一瓶水中放入一粒糖块,时间足够长后,这一盒子中任一空间位置的空气颜色都是一样的、瓶中任何一点的水都是同样甜的。假如把任一空间中的分子混乱程度或均一程度看作一个量,称为熵(entro?py),就可以认为,在一封闭系统中,其熵值最终会变得最大,即其组成分子会变得极其均匀或均一。

由此可见,物理学中的熵可看作是一个封闭系统混乱程度或均一程度的宏观衡量指标或定性表述。那么,它能否被定量描述呢?

1.2统计学上的熵

假定有一个盒子,其被中间一个带有很多小孔的极薄隔板分为左右两半,盒子中有4个可以随意漂移的小球,隔板几乎不能限制任一小球的移动。那么,这四个小球(可以想象为是4个空气分子)在盒子中的分布就有5类16种可能(表1)。这五类状况的数量占比分别为1/16、4/16、6/16、4/16、1/16。可以称这五类分布中的任一类为盒子中分子分布的宏观态,而它对应的每一种可能为一种微观态,如第二种宏观态(3个小球在左、1个小球在右)就有4种微观态,它出现的可能为4/16。

出现概率越小的宏观态事件,表明系统的分子数量越多,总体宏观态越多样,系统也越混乱。若将本例中的4个分子变成8个,出现1个分子在左、7个分子在右这一宏观态的概率为8/256,它明显小于4个分子时1个在左、3个在右的概率(4/16)。而将0~1之间的数值取对数后,也是数值越小其对数越大。因而可用公式S=KlogW来表示熵(宏观态)及其概率(微观态比率)之间的关系。式中S为熵,K为常数,W为概率。例如,本例第二种宏观态4个分子的混乱程度可设为S2,它的熵值就可表示为S2=Klog4/16。当然,也可令常数K等于1,它不会改变公式的本来意义,只会涉及到系数或数值大小的调整。

在此假设下,上述5种宏观态出现的总体概率=

1/16×4/16×6/16×4/16×1/16。它们总体熵值为:S总=lo(g1/16×4/16×6/16×4/16×1/16)

=log1/16+log4/16+log6/16+log4/16+log1/16=S1+S2+S3+S4+S5.

可见,熵值总和等于各成分概率之积。

总之,从统计学的角度可以看到,熵是可以衡量和計算的,只要知道密闭空间中所有分子的可能分布或分布概率。

然而,由于任一空间中的空气分子数量极大,要想知道它们所有的概率或分布状况几乎不可能。因而,从无限可能的统计学角度来衡量熵值在现实中几乎没有应用价值。那么,在有限可能中是否可以呢?

1.3信息学上的熵

香农(Shannon,1948)提出,在一个有限多样概率事件中,当所有事件发生的概率均等时,其总体不确定性最大。这相当于上例盒子中只有有限数量的空气分子,它们分布的最大可能性是在盒子中均匀分布(因此种分布的概率最大)。这时盒子中的空气最混乱,熵值也最大;而对每个空气分子而言,它们在所有空间中出现的概率也是均等的。因而,各事件发生的概率乘以该概率的对数之和,其数值也最大。即可用下式来表达系统的总体不确定性:

式中的H代表多样性指数或不确定性指数,pi为i事件的发生概率或i成分的数量比率,s为事件或成分总数。

例如,从4个不同颜色的球中随机选取一个,其概率为1/4。选取4次,每次选取小球的事件都相互独立,那么H=-(4×1/4×log21/4)=2。这里由于是在选取小球,事件肯定会发生。而在统计学或信息学上,某一事件除了有选取的概率(如这里的1/4),还有发生的概率(这里是1)。还可换种选取办法:当选择一个小球后,就将其移走而不再放入盒中。那么选取4次特定颜色小球的概率分别为1/4、1/3、1/2、1。用香农的理论或从统计学角度看,这些事件之间是有联系的,上一个事件发生后会影响下一个事件的发生概率。这时,本次选取过程的总体不确定性变为:

H=-(1/4×log21/4+1/3×log21/3+1/2×log21/2+1×log21)=1.53.

可见,这时系统总不确定性降低了0.47。在香农看来,系统的不确定性之所以能够降低,是因为它吸收了“信息”(因为通过第一次的选择,就可提高对下一次选择的猜测准确率,以致最后一次就可确认所选择小球的颜色,就是因为有了前面三次选择后的信息,从这个角度看,信息就是消除系统不确定性的东西或因子)。而其减少的0.47就可看作是信息或信息大小。

结合统计学的熵及其计算公式,可以看出,香农所谓的系统不确定性就相当于有限概率、有限数据条件下的“熵”,因而可将信息学上的熵称为“信息熵”或

“香农熵”。在本质上,它与统计学上的熵、物理学上的熵是相同的。不过,物理学中的熵是从小往大看的(即认为系统的熵总是增加的),而信息学中的熵是由大往小看的(即认为在没有信息时,熵最大;而具备或输入信息后,系统的熵就变小)。因而,物理学上的熵指示或衡量的是系统的混乱无序程度,而信息学上的熵指示或衡量系统的有序规律程度(因为它总是小于原始的信息熵);当信息熵最大时(这时系统最混乱),其与物理学上的熵意义相同。

另外,当一个系统变得有序时,它就需要从外界获得信息并减少信息熵。因而,它获得的信息或减少的信息熵就相当于它减少了的混乱程度或熵值。故从这个角度看,信息就可看作是“负熵”,其值就等于改变的信息量。Wiene(r1948)明确提出:“正如一个系统中的信息量是它的组织化程度的度量,一个系统的熵就是它无组织程度的度量;前者正好是后者的负数。”

以上是对物理学中的热熵、统计学上的概率熵以及信息学上的香农熵所作的浅显介绍。实际上,它们的表达式都为数学公式且是可相互推导的。

2香农熵引入到生物学中的过程

前文已述,孤立系统的熵总是趋于最大。然而,生物却是开放系统,其内部是高度有序的,并且在生长发育过程中会变得更加有序,因而可以认为生物体的熵是逐渐变小的。这是因为生物体不断从外界吸入能量与物质。从宏观上看,也就是生物体从外界吸收进熵值较低的物质,在消化吸收的过程中,让它们变得更无序,增加它们的熵值,从而减少或保持自身的低熵状况。或者,有机体需要从外界不断吸收“负熵”以降低自身的熵值。薛定锷(Schr?dinger,1944)在《生命是什么》一书中就明确提出:有机体以负熵为生。或者不那么悖谬地说,新陈代谢的本质是使有机体成功消除了它活着时不得不产生的所有熵。Rosenblueth等(1943)、Wiene(r1948)在提出反馈以及控制论时,都认为生物在不同水平上也可看作是一个可自我调节的稳定系统。而有机体的稳定状态必须要不断通过吸收信息(或称为“负熵”)才能得以实现。

以上的研究或文献就将信息熵或香农熵引入了生物学。

3香农熵引入到生态学中的过程

3.1香農熵引入生态系统生态学

Odum(1953)提到,在一个自然生态系统或群落中,由于能量与无机物(如水和各种元素)在其内部经食物链、食物网的不断传递,最终会形成一种稳定状况,即生态平衡。MacArthu(r1955)认识到生态系统中的能量在传递时,因有损耗,故它通过不同的食物链流动会对群落稳定性产生不同的结果,即能量流动时的“选择”会对结果有影响。也就是如果食物网越复杂,能量传递的可能性与路径就越多样,每条路径传递的能量或物质就越少、所占比例也越小,能量在生态系统中传递的复杂程度或不确定性就越高,其熵值也就越大。如果某条食物链受损,生态系统用以修复的代价也越小,系统越稳定。反之,如果生态系统中的食物链路径越少,系统的有序性就越高、组织程度也越大,其熵值也就越小。可见,生态系统中能量传递的多样性或复杂性与香农理论上的不确定性有内在的联系,故可将香农提出的数学公式或香农熵引入到生态系统稳定性研究中。这就将信息概念以及信息论引入到生态学。

不过,由于生态系统的复杂性、食物链与食物网的多重性和交叉性,想准确研究生态系统能量流动的“选择性”或“路径多样性”是十分困难的,详细测量能量在不同食物链中的传递过程及其数值也是不可能的。故可以认为,MacArthur提出了一个很好但应用价值很小的观点。不过,假如把生态系统分为无机环境、生产者、消费者和分解者,用信息量表达它们各自的有序状态(借用香农对于信息量的定义和公式),就可从宏观上把握生态系统内部各成分之间的相互影响过程,即各成分的“信息量”或“香农熵”会相互影响或相互反馈。由于能量与物质在生态系统内部不同营养级之间传递时,它们的路径是单向的,不能双向传递或影响,因而香农熵或信息量的引入,可明确生态系统负反馈机制的作用规律与模式。

3.2香农熵作为生物多样性指数

从纯数学的角度看,香农熵公式说明,如果一个统有多种成分、且各成分出现的机率一致或每种成分所占的数量比率完全相同,则此系统的香农熵值最大,任何改变(成分数量减少、或各成分比率改变)都会使香农熵值变小。一个生物群落是由多个物种组成的(物种数量可称为多度),当它们数量比率(称为均度)均等时,该群落由于包含多个物种且它们的数量分布较接近,也即群落的多度与均度都相对较好,这一群落的物种多样性或生物多样性较高,反之就较低。基于此,群落的生物多样性与香农公式也有内在的联系性与相关性。Margalef(1957)认识到此点,建立了群落生态学中的香农多样性指数(或称为香农-威纳多样性指数)。目前,它是生态学中应用最广的指数之一。

4引入香农熵对于生物学和生态学的意义生态学由于研究对象的多样性、研究课题的复杂性,往往缺少定量的描述工具。而香农熵与香农公式的提出与推广,使得生态学在群落、生态系统较宏观的层面上有了可以借助的数学工具。它大大提高和加深了生态学对机制、过程、状态的描述能力和预测能力,从而使生态学成为了一门较为精细的独立学科。

根据控制论和系统论,任何具调节能力、平衡能力的系统都可用“熵变”来描述它们组成成分之间的相互作用。生物活细胞、生物体、种群、群落以及生态系统都具有调节与平衡能力,因而也可用熵来描述它们组成成分之间的、成分状态改变所造成的双向影响与相互作用,这比使用能量或物质更加合理与明确,因为它们往往是单向输送的,不可双向传递。同时,信息量往往指代了某成分、系统的有序状态,它可随着营养级的提高而提高,而能量、物质在从低级向高级流动、传输时往往都是逐级减少的。故相比于它们,信息可更好地描述负反馈机制、自平衡的实现。

能量和物质都可精确测量,且与生物个体的生物量密切相关;而信息为抽象的宏观概念,与生物种类、个体数量、出现机率相关,故将信息概念和信息理论引入到生物学、生态学研究中,不仅多了一个有用的描述术语,更可以将研究的课题从较为静态固定的质量、能量角度深化到较为动态的概率、频率层面,从较为确定的物质称量层面提高到较为不确定的数量统计层面,从而使生物学、生态学跟上了信息学步伐,也将它们从主要定性描述的古老学科逐渐发展成为可以定量计算的现代学科。

参考文献:

[1]蔡明泽,李文娟,周长发.生态系统信息不可具体化为刺激[J].中学生物学,2021,37(1):3-5.

[2]韩博平,范航清.生态系统中信息流初探[J].广西科学院学报,1992,(2):26-31.

[3]何西培,何坤振.信息熵辨析与熵的泛化[J].情报杂志,2006,25(12):109-112.

[4]黄沛天,胡利云.对负熵、信息熵和熵原理等概念之厘清[J].现代物理知识,2004,16(3):21-23.

[5]李鹤龄.信息熵、玻尔兹曼熵以及克劳修斯熵之间的关系——兼论玻尔兹曼熵和克劳修斯熵是否等价[J].大学物理,2004,23(12):37-40.

[6]王鹤颖,张敏,周长发.生态系统营养信息辨析[J].中学生物学,2019,35(9):3-4.

[7]许洪昌.生态系统中的信息[J].生态学杂志,1986,5(2):49-52.

[8]张玉梅,王學水.玻尔兹曼熵和克劳修斯熵的关系[J].江西科学,2005,23(5):602-604.

[9] MacArthur R. Fluctuations of Animal Populations and a Measure of Community Stability[J]. Ecology,1955,36(3):533- 536.

[10] Margalef R. La teoria de la informacion en ecologi[a J]. Mem. Real Acad. Ciencias Artes Barcelona,1957,3(2 13):373-449.

[11] Odum E P. Fundamentals of Ecology(1st ed.)[J]. Saun?ders,Philadelphia,1953.

[12] Rosenblueth A,Wiener N,Bigelow J. Behavior,Purpose andTeleolog[y J].PhilosophyofScience,1943,(10):18-24.

[13] Schr?dinger E. What Is Life[J]. Cambridge:University Press,1944.

[14] Shannon C. A mathematical theory of communication[J]. Bell System Technical Journal,1948,27(3-4):379-423,623- 656.

[15] Wiener N. 1948. Cybernetics:Or control and communica?tion in the animal and the machine[M]. New York:Wiley and Sons,1948.

猜你喜欢
生态学生物学信息
谷稗的生物学特性和栽培技术
初中生物学纠错本的建立与使用
初中生物学纠错本的建立与使用
生态学视野下的幼儿园环境创设探析
辽西地区油松造林的生态学探讨
论生态型课堂教学环境的构建
PEDF抗肿瘤的生物学作用
健康信息
健康信息(九则)