巨型脂质体制备过程的多参数寻优算法

2016-08-13 16:32高敏夏煦坤关帅奚磊陈国荣利节
科技资讯 2016年5期
关键词:遗传算法

高敏 夏煦坤 关帅 奚磊 陈国荣 利节

摘 要:针对巨型脂质体制备过程中影响参数较多且相互影响,人工试验寻找最高巨型脂质体产量的参数值较难的问题,设计了一种多参数寻优算法,运用反馈神经网络算法(BP)对已有试验数据进行学习与训练预测在已有参数限制下的最高巨型脂质体产量,根据已预测的最高巨型脂质体产量利用遗传算法(GA)寻找各参数的最优值。仿真实验结果表明,该多参数寻优算法能够预测比人工试验更佳的巨型脂质体产量更高的参数值。

关键词:巨型脂质体制备 多参数寻优 遗传算法 反馈神经网络算法

中图分类号:TP391.4 文献标识码:A 文章编号:1672-3791(2016)02(b)-0115-04

Multi-parameter Optimal Algorithm for Preparation of Giant Vesicles

Gao Min Xia Xukun Guan Shuai Xi Lei Chen Guorong Li Jie

(Chongqing University of Science & Technology,Chongqing,401331,China)

Abstract:The parameters influent giant vesicle preparation are related with each other, where optimal parameter values are hard to get through man-made methods. Therefore, a multi-parameter optimal algorithm is proposed. Back Propagation (BP) is utilized for learning and training the experiment data to gain the prior quantity of giant vesicles under the existing conditions. According to the predicted amount, Genetic Algorithm (GA) is employed for the optimal value of each parameter. The simulation results show the algorithm played better than man-made method to get the giant vesicles.

Key Words:Giant vesicles preparation;Multi-parameter optimization;Genetic algorithm;Feedback neural network algorithm

脂質体是一种人工膜。在水中磷脂分子亲水头部插入水中,脂质体疏水尾部伸向空气,搅动后形成双层脂分子的球形脂质体,直径25~1 000 nm不等。脂质体可用于转基因,或制备的药物,利用脂质体可以和细胞膜融合的特点,将药物送入细胞内部,具有重要的经济和社会意义[1]。因此,脂质体的制作近年来得到了大量关注[2-8]。巨型脂质体是粒径大于1,电形成法是现有较好的制备巨型脂质体方法[9]。电形成法通过电场作用实现制备,在制备过程中影响巨型脂质体数量的参数较多,如何确定各参数的最优值获得巨型脂质体数量最多是一个研究热点[10]。

该研究拟针对在整个制备过程有多个参数影响巨型脂质体产量的问题,提出了一种多参数寻优算法,结合了GA的寻优和BP神经网络的系统拟合特点,对少量试验数据进行分析、学习与训练,获得各个参数的最优值,以获得巨型脂质体产量最高,解决人工大量试验寻找最高巨型脂质体产量的参数值,提高巨型脂质体制备过程的效率。

1 算法设计

1.1 遗传算法

遗传算法(Genetic Algorithms,GA)是一类模拟自然界的选择遗传机制的算法,具有较好的鲁棒性,能够实现全局搜索。GA属于迭代算法,每一次迭代时生成一组解,初始化时解的值是随机生成的,在每次迭代过程中,通过进化和继承获得一个新解,通过目标函数评判此解是否为最优解[10]。GA的运行步骤有以下几步。

步骤1:随机产生一定数量的初始种群,每个个体代表了染色体的基因编码,并采用二进制编码。

步骤2:计算每个个体的适应度,判断是否符合优化准则,如符合则结束算法,不符合则进入步骤3。

步骤3:依据适应度选择再生个体,适应度低的个体最有可能被淘汰适应度高的个体被选中的概率高。

步骤4:将个体的基因编码进行交叉和变异操作,生成新个体,得到新代的种群,返回步骤2。

1.2 多参数寻优算法

GA可以通过获取最优目标函数值来得到每个参数值最优值,即最优解。但GA对初始种群一般采用二进制编码,过于简单导致在实际运行过程中存在一定的误差。因此,该文提出的多参数混合优化算法将BP网络的权值和阈值按一定顺序连起来,形成一个实数数组,作为遗传算法的一个染色体,然后再进行选择、遗传、变异操作。同时,将BP网络的输出值与期望值的均方误差函数作为遗传算法的适应度,以提高GA的优化性能。具体的工作流程图如图1。

通过文献分析和实验发现,影响脂质体制备的参数有:芯片结构、脂质比例、脂质浓度(PC)、脂质浓度(Chol)、脂质体积、缓冲液浓度(Suc)、缓冲液浓度(NaCl)、电压、频率、持续时间,共10个参数。一组值包含了10个参数各1个值,被看作一个种群的一个个体。通过对10个参数值的学习与训练后,获得参数间的内在关系,GA的目标函数为巨型脂质体个数最大化。通过得到最大的目标函数值,来获得每个参数的最优值。

2 實验分析

2.1 数据来源

通过实验采集135组数据,数据特征见表1,制备环境为无菌环境。使用制备设备为自制设备。由于实验所用芯片只有一种自制芯片,所以,芯片参数这次不纳入分析范畴,共9个参数值。

影响巨型脂质体产量的参数多,参数间的相互影响较为严重。从实验数据的特征来看,决定巨型脂质体产量的9种参数值在实验过程中数值波动较大,最大值比最小值甚至达到500倍,单纯靠人工经验通过大量实验不同参数值来最大化巨型脂质体产量需要耗费大量的精力,且试验只能进行有限次,不一定能够找到巨型脂质体产量最高的试验条件。

2.2 仿真实验结果分析

根据135组的9个参数值和对应的巨型脂质体产量确定BP神经网络结构,把9个参数值作为输入数据,巨型脂质体产量作为输出数据训练BP神经网络,训练后的网络可以预测一定试验条件下的试验结果。然后把试验9个参数作为遗传算法中种群个体,把网络预测的试验结果作为个体适应值,通过遗传算法推导最优试验结果(巨型脂质体产量)及其对应试验参数值。

2.2.1 BP神经网络预测效果分析

BP神经网络预测模型是该文所提出的多参数优化算法的一个重要环节,决定了GA的寻优精度,换句话说,BP神经网络预测模型的训练精度决定了最终预测的巨型脂质体最高产量是否为试验可及范围。仿真实验过程中BP神经网络预测模型运算效果见图2和图3所示。在训练BP神经网络过程中,每次均在135组数据中随机取35组数据进行学习与训练,避免陷入局部最优的预测值。在图2中,虚线为实际试验所得的35个真实数据连接线,实线为BP神经网络预测模型运算的预测数据连接线。从图2可清楚地看出,除第5、21、30、33这4个点有微弱的偏差(几乎可忽略)外,该BP神经网络能够根据9个参数值准确预测出巨型脂质体产量,保证了多参数优化算法预测的最大巨型脂质体产量的准确性。

图3为BP神经网络的作为GA的适应度的变化曲线,图中可清晰可见,在第5代左右时GA的适应度基本不变,保障了根据BP神经网络预测出的最大巨型脂质体产量寻找对应的9个参数值的稳定性,降低了寻优误差。

2.2.2 多参数寻优算法分析

对试验数据进行多参数优化运算9次,该算法预测的最优巨型脂质体产量和对应的9个参数值如表2所示。仅从巨型脂质体产量数量来看,都能大于1 000以上,每次模型预测的最优巨型脂质体产量不一样的原因是试验数据量太少,使得BP模型的精确度不能达到100%。但从结果来看,已经比人工试验的巨型脂质体产量数量高了1倍以上。

从表2数据可见,9个影响巨型脂质体产量的参数值之间关联度紧密,不能从简单的线性关系描述。例如:第一组巨型脂质体产量与第二组巨型脂质体产量仅相差2个,但是查看9个参数值,并没有整体递增或递减的趋势,其中第一组的脂质比例、脂质浓度(PC)、脂质体积、电压、持续时间比第二组大,而脂质浓度(Chol)、缓冲液浓度、频率却增加,难以用简单函数关系描述9个参数间以及与巨型脂质体产量的关系。因此,再一次验证仅靠人工经验试验寻找巨型脂质体产量最高的最优参数值的难度巨大,通过多参数优化混合算法更有助于寻找巨型脂质体产量最高的最优参数值。

为了更便于观察本优化算法的优势,对优化后的最优参数值和预测的巨型脂质体产量数量进行了曲线表示,见图4和图5。

从图4可以看出,9个参数值的最优预测值波动都较小,在一定可接受范围内,与纯人工试验相比的参数幅度已经非常低了。虽然9次模型运行所预测的巨型脂质体产量都不一致,但是都在1 000~1 500之间波动(见图5),波动幅度在可接受范围内。

在试验中获得的最大实验结果为508,对应的实验条件为[5 6 1.2 30 200 30 8 10 2]。在实验数据的基础上,采用GA+BP多参数优化算法寻优,选择的BP网络结构为4-100-1,遗传算法的迭代次数是300次,种群规模是20,交叉概率为0.4,变异概率为0.2。最终得到最优实验结果为1465,对应的实验条件为[14.507 14.708 0.739 66.494 89.794 23.759 14.411 906.288 2.142],该结果为最优实验条件的选择提供了参考价值。

3 结语

该文针对巨型脂质体制备过程中影响巨型脂质体产量的参数多的难点,提出了一种多参数寻优算法,根据已有人工试验获得的135组参数值和巨型脂质体产量数据进行学习与训练,预测在已有条件下巨型脂质体产量的最高值,并寻优获得对应的9个参数值,为巨型脂质体试验奠定了良好基础。

在仿真实验过程中,分析发现9个参数值之间具有一定的耦合关系,难以用单调函数描述,因此,人工试验寻找最佳参数值以得到最高巨型脂质体产量的难度非常大。结果分析表明,该文所提出的算法能够预测得到较好的巨型脂质体产量,为下一步巨型脂质体制备提供了强有力的理论依据, 大大缩短了人工试验的时间和难度。

参考文献

[1] Natsume Y,Toyota T..Out-of-equilibrium dynamics of molecular assembly [J].Chemistry Letters,2013,42(3):295-297.

[2] DAAN Vorselen,WOUTER H Roos,FRED C Mackintosh, GIJS Jan Lodewijk Wuite.The role of the cytoskeleton in sensing changes in gravity by nonspecialized cells [J].The FASEB Journal,2014,28(2):536-547.

[3] ERI Yoshida.Giant vesicles prepared by nitroxide-mediated photo-controlled/living radical polymerization-induced self-assembly[J].Colloid and Polymer Science, 2013,291(11):2733-2739.

[4] KENSUKE Kurihara,MIEKO Tamura,SHOHDA Koh-ichiroh,TARO Toyota,KENTARO Suzuki,TADASHI Sugawara.Self-reproduction of supramolecular giant vesicles combined with the amplification of encapsulated DNA[J].Nature Chemistry,2011(3):775-781.

[5] NESTOR López Mora,JESPER S.Hansen,YUE Gao, ANDREW A.Ronald,ROXANNE Kieltyka,NOAH Malmstadt,ALEXANDER Kros.Preparation of size tunable giant vesicles from cross-linked dextran(ethylene glycol) hydrogels[J].Chemical Communications,2014(50):1953-1955.

[6] Bhatia Tripta,Husen Peter,Brewer Jonathan,etal.Mouritsen.Preparing giant unilamellar vesicles (GUVs) of complex lipid mixtures on demand:Mixing small unilamellar vesicles of compositionally heterogeneous mixtures [J].Biochimica et Biophysica Acta (BBA)- Biomembranes,2015,1848(12):3175-3180.

[7] TAKASHI Kuroiwa,RYOJI Fujita,ISAO Kobayashi, KUNIHIKO Uemura,MITSUTOSHI Nakajima,SEIGO Sato,PETER Walde,SOSAKU Ichikawa.Efficient Preparation of Giant Vesicles as Biomimetic Compartment Systems with High Entrapment Yields for Biomacromolecules[J].Chemistry & Biodiversity,2012,9(11):2453-2472.

[8] 王振宇,王琼,王萬刚,等.用于巨型脂质体制备及收集的微流控芯片研究[J].分析化学,2015,43(8):1113-1117.

[9] 张施令,彭宗仁,杜进桥,等.RBF神经网络与NSGA-II混合算法用于±1 100kV穿墙套管3维电场模拟及内屏蔽结构优化[J].高电压技术,2014,40(6):1847-1857.

[10] 王瑞琪,李珂,张城慧.RBF神经网络与NSGA-II混合算法用于±1 100kV穿墙套管3维电场模拟及内屏蔽结构优化电网技术[J].高电压技术,2011,35(12):183-189.

猜你喜欢
遗传算法
面向成本的装配线平衡改进遗传算法
基于多层编码遗传算法的智能车间调度方法研究
基于遗传算法对广义神经网络的优化
基于遗传算法对广义神经网络的优化
基于遗传算法的临床路径模式提取的应用研究
基于遗传算法的临床路径模式提取的应用研究
遗传算法在校园听力考试广播系统施工优化中的应用
物流配送车辆路径的免疫遗传算法探讨
遗传算法在机械优化设计中的应用研究
遗传算法的应用