基于GA-BP神经网络的雨生红球藻生长趋势预测

2022-11-11 03:49崔世钢石兰婷张永立李欣颀张靖宇
安徽农业科学 2022年20期
关键词:雨生红球藻青素

崔世钢,石兰婷,张永立,何 林,李欣颀,张靖宇

(天津职业技术师范大学,天津 300222)

虾青素是一种酮类胡萝卜素[1],比其他天然抗氧化药物具有更强的抗氧化活性。虾青素能够对多种疾病起到辅助治疗的作用,能够抑制肿瘤生长、保护中枢神经系统、预防心脑血管疾病等,因此广泛用于食品、医药和化妆品[2-4]。雨生红球藻在特定的胁迫条件下可以快速积累虾青素,最大积累量可达其干细胞重量的1%。近年来,国内外对于大量生产虾青素的研究已经逐渐向培育雨生红球藻靠拢[5]。

侯奇等[6]建立了预测李斯特菌生长的二级BP神经网络模型。由于雨生红球藻生长周期长,而且与大多数微生物不同,其生长状态分为2个阶段,不同阶段生长条件也不相同,因此很少有可供参考的客观数据。特别是在试验过程中需要消耗大量的时间对雨生红球藻的生长状况进行观测,但其生长趋势依旧很难预测,导致反复试验消耗大量的人力物力依旧不容易得到好的培养效果。因此建立雨生红球藻生长趋势的预测模型,对提高雨生红球藻生产效率的研究提供重要的参考。鉴于此,根据影响雨生红球藻生长的主要环境(pH),建立基于遗传算法的BP神经网络模型,并对雨生红球藻生长状况进行试验验证。

1 雨生红球藻

雨生红球藻(Haematococcuspluvialis)是一种生活在淡水中的单细胞绿藻,其生长状态分为细胞大量增殖阶段和虾青素积累阶段。在环境适宜营养充足的条件下,该细胞主要呈现绿色并处于游动状态,此时繁殖迅速,虾青素含量少。当生存环境恶劣时,为了保证正常生长游动细胞的鞭毛退化,细胞停止游动,为了保证正常生存开始大量积累虾青素,细胞逐渐变为红色[7-8]。

根据雨生红球藻的生长特性,国内外的学者提出了2阶段生产方式的生产模式:第1阶段是对藻细胞进行大量的增殖(也被称为细胞增殖阶段);第2阶段是胁迫雨生红球藻细胞快速积累虾青素(也被称为虾青素积累阶段)。大量研究表明,雨生红球藻的生长需要很多适宜的条件,如温度、光照强度、生存环境的营养成分、pH等,其中pH是关键因素之一。雨生红球藻培养过程中,pH的范围将直接影响藻类细胞的生长和虾青素的积累[9]。相关研究表明,当扩培阶段的藻液处于弱碱性(pH=7.0~9.0)时,光合作用效率大幅提高,藻细胞大量增殖。当诱导阶段的藻液pH为7.0~8.0[10]时,虾青素积累最快[11]。

2 遗传算法以及BP神经网络

BP神经网络(Back Propagation Neural Network)是一种多层前馈神经网络,可以通过误差的反向传播来修正层间的参数。通过输入和期望输出,学习需预测的数据样本。通过输入层将数据传递给隐藏层中的各个神经元,通过计算得到预测的输出值,若预测值与实际值相减的误差不满足预测的精度,则输入层将所得的误差返回,从而修改各层之间的权阈值,使得到的预测输出与实际输出之间的误差逐渐减小,直至满足预测所需的精度。其学习规则采用梯度下降法,以此来得到目标函数的最小值,常用于解决复杂的非线性模型。

雨生红球藻的生长环境参数与生长情况之间存在着非线性关系,因此采用对非线性函数具有最佳逼近性和全局最优性能的神经网络来预测雨生红球藻的生长条件。该研究将雨生红球藻的培养时的pH作为神经网络的输入量,其他环境变量保持不变,将试验测得的生长状态数据作为神经网络的输出量,建立雨生红球藻在不同pH生长状态预测模型。其拓扑结构如图1所示。

图1 BP神经网络结构

遗传算法(Genetic Algorithm,GA)起源于生物进化论,它是模拟自然界生物进化过程中优胜劣汰的一种优化算法。将种群和DNA的概念引入需要优化的参数中,形成参数种群编码,按照适应度函数对遗传信息进行选择、交叉、变异等操作,从而实现对个体的筛选。保留具有优秀基因的个体,淘汰适应度差的个体。种群不断地迭代、循环直至得到满足条件的最优解[12]。

BP神经网络主要由信息前向传播和误差反向传播组成。信息前向传播指的是待预测数据经过输入层传递到隐藏层中,在隐藏层通过对阈值和权值进行计算得到输出结果。将预测结果和实际值做差得到预测的误差值,将误差值传回隐藏层,并通过误差函数对权值和阈值进行更新,不断重复上述2个过程,最终得到理想的参数[13-15]。

3 GA-BP神经网络模型

由于BP神经网络是采用梯度下降法来对相应的参数进行优化,因此在优化的过程中会因为初值的选取出现局部最小值的问题,这样不仅训练时间长,收敛速度也慢。因此,由于遗传算法具有良好的全局寻优能力,故采用其对BP神经网络进行优化,从而找到最优的权值和阈值,提高预测模型的准确率。

3.1 BP神经网络的建立

3.1.1设定初始参数。网络的训练方法采用梯度下降法。最大训练次数epochs为2 000,学习率μ=0.005,目标误差0.000 01。

3.1.2确定隐含层节点数。BP神经网络选取结构为3层,分别是1个输入神经元、5个隐含神经元和1个输出神经元,分别对细胞和数量进行预测。其中,隐含层神经元数量根据式(1)确定为5个,并经过验证可达到最佳的预测效果。

(1)

式中,n、l、m分别为输入、输出以及隐含层节点数量,α取1~10的整数。

3.1.3转移函数的选取。隐含层的传递函数采用Tanh函数,值域为(-1, 1)。其定义为:

(2)

输出层的传递函数采用Sigmoid函数。其函数定义见式(3):

(3)

3.2 遗传算法优化BP神经网络将遗传算法的3类遗传算子与BP神经网络的权值与阈值结合以来,通过对数据进行训练,找到最优的参数,进而达到对雨生红球藻的生长趋势的精准预测。其模型建立步骤如下:

3.2.1种群初始化。种群的个体是BP神经网络的所有权值和阈值,对个体采用实数编码。编码采用二进制表示,长度为:

S=n×m+m+m×l+l

(4)

种群的规模要根据实际问题进行选取,才能使遗传算法的优化性能达到最好。因此,初始种群为15。

3.2.2适应度函数。通过编码个体得到BP神经网络的初始权值和阈值,以BP神经网络训练得到的输出与实际输出之间的绝对误差E推出个体适应度值fi。

(5)

式中,BP神经网络的预期输出和实际输出分别为yi、oi。根据适应度函数,期望输出和实际输出的误差越小,适应度函数越大。

3.2.3选择操作。从种群中选择优秀个体作为繁殖后代的母体。方法采用轮盘赌选择法。主要思想是每个个体被选中的概率与适合度成正比。即:

(6)

3.2.4交叉操作。交叉操作是遗传基因重组的过程,以便将当前的最优基因传到下一代并获得新的个体。从群体中随机选择2个个体进行配对,根据交叉概率pc=0.2交换2个个体的部分基因。从而获得2个具有新基因的个体。将随机选取的个体ω1、ω2在第k位基因的交换如下:

(7)

式中,b为[0,1]的随机数。

3.2.5变异操作。变异操作相当于生物学上的基因突变,根据变异概率pm=0.1对第i个个体的第j个基因gij进行变异,随机产生优秀的生物个体,丰富种群的多样性。其变异方法如下:

(8)

式中,b1为随机数,d为当前迭代次数,Dmax为最大进化次数,gmax为基因gij的上界,gmin为基因gij的下界。

GA-BP神经网络算法流程见图2。

图2 GA-BP神经网络算法流程

4 试验与数据采集

4.1 试验方法与设计雨生红球藻藻种(Haematococcuspluvialis,FACHB-712)购于上海光语生物科技有限公司藻种库。藻种培养基选用BG11培养基,按照藻液∶培养基=1∶2的比例进行配比。采用直流驱动的单色光照,光照黑暗时间对比为12 h∶12 h,每天测量一组数据。

细胞增殖阶段培养基pH分别为7.5、8.0、8.5,将配制好的藻液放置到光照强度为20 μmol/(m2·s)且温度为室温的光生物培养架上。

4.2 样本数据采集每次从试验样本中取出15 mL藻液,在超净工作台进行取样以及数据测量,共测量70 d增殖试验的藻细胞半径和数量。测量第35天的数据后,在锥形瓶中加入200 mL BG11培养基,为藻的进一步增殖提供所需的营养物质。

4.3 数据预处理由于需要预测的藻细胞数量和半径具有不同的数量级且差异较大,会影响网络的预测结果,因此需要对原始数据进行归一化处理。采用Matlab的mapminmax(x)函数对数据进行归一化处理,使处理后的数据范围在[-1,1],其转换公式为:

(9)

式中,x为藻细胞数据的初始值,xmax为藻细胞数据的最大值,xmin为藻细胞数据的最小值,ymax、ymin为参数,可自己设定也可默认为[-1,1]。经过归一化处理的数据,在预测结束后需要进行反归一化,将数据恢复到正常值,该研究反归一化采用postmnmx函数。

5 结果与分析

采用Matlab作为预测的平台,利用Matlab自带的函数实现神经网络的搭建。将收集到的70 d试验数据作为预测的训练集和测试集,前60 d为训练集,后10 d为测试集。为了得到不同pH下细胞平均半径和细胞数量变化趋势,采用BP和GA-BP神经网络分别对pH=7.5、8.0、8.5进行预测。预测结果如图2~4所示,部分预测数据如表1、2所示。

表1 BP神经网络部分预测结果

图3 pH 7.5时细胞增殖阶段藻细胞的生长趋势

图4 pH 8.0时增殖培养阶段藻细胞的生长趋势

图5 pH 8.5时增殖培养阶段藻细胞的生长趋势

采用平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差(root mean square error,RMSE)对预测模型性能进行评价。

(10)

(11)

其评价结果如表3、4所示。从上述试验可以看出,GA-BP神经网络的MAPE和RMSE均低于BP神经网络。因此,可以得出GA-BP神经网络预测的准确率较高。

表3 GA-BP和BP神经网络预测半径评价结果

表4 GA-BP和BP神经网络预测数量评价结果

6 结论

通过对雨生红球藻在不同pH下的生长状况数据进行训练,得到了根据时间预测藻细胞生长趋势的模型。从训练结果看,在不同pH下,GA-BP神经网络对10 d数据的预测结果精确度高于90%,且较合理地预测出了藻细胞的生长趋势,说明网络架构已达到预期效果。

该模型的使用一方面可以快速得出雨生红球藻在一定时间内的生长状况,克服其周期长的问题;另一方面能够更节省人力物力,在试验前通过模拟预测,可以得到单变量环境对雨生红球藻生长状况的影响,方便研究人员更好地找到最适合藻细胞生长的环境值,在培养过程中能够更节省时间避免过多的重复试验,也能够大大降低试验的失败率。

猜你喜欢
雨生红球藻青素
真菌Simplicillium lanosoniveum DT06 对雨生红球藻生长与脂类合成的影响
6000倍抗氧化能力,“完爆”维C!昶科将天然虾青素研发到极致
虾青素在设施草莓上的应用效果
利用低温等离子体刺激雨生红球藻生长和虾青素积累(2020.2.28 中国科学院)
雨生红球藻对面包烘焙品质的影响
球藻沉浮的秘密植物
聚球藻硅质化作用初探
反相高效液相色谱法检测鲫鱼组织中的节球藻毒素
雨生红球藻在水产养殖中的应用
天然虾青素在卤虫体内的代谢积累研究