基于ANFIS的一类免疫聚类建模方法的研究

2013-11-05 12:39冯苹苹屈宝存
当代化工 2013年9期
关键词:免疫系统抗原聚类

冯苹苹,屈宝存,李 烨

(辽宁石油化工大学 信息与控制工程学院, 辽宁 抚顺 11300)

复杂的不明确的现实系统是一个多输入多输出系统,具有强时变、强耦合及非线性等特征。为了对控制系统进行有效的合理的控制,需要确定其精确的数学模型。

自适应模糊推理系统(ANFIS)是利用神经网络的学习能力来逼近模糊推理系统的设计,ANFIS是一种基于有效输入输出数据的一种算法。成功获得一个高可靠性和强鲁棒性的ANFIS网络在很大程度上依赖于过程变量的选取及用于训练的有效数据对。神经网络的缺点在于如果用于训练的数据对不充足或者是没有得到有效训练时会缺乏泛化能力。通过合理选择数据点的范围及选择合理的用于神经网络训练的数据对将会克服这一困难。应用交叉验证达到数据的优化,该方法的优点在于能够将测试过程简化并且得到信息的最大化。

1 自适应神经模糊推理系统(ANFIS)建模算法

ANFIS采用自适应模糊网格法先确定模糊网格,后利用负反馈优化网格,该方法的不足之处是随着输入变量的增加,导致的模糊规则数成指数倍的增长,致使学习难度增加[]1,为克服这种问题,本文选用的衍生出来的ANFIS模型来优化隶属度函数、模糊规则、数据的选取从而节省计算时间和减小均方根误差。

1.1 ANFIS的结构

基于模糊推理的自适应网络将神经网络的自学习能力和模糊推理系统结合起来,假设系统有两个输入,输出为f(图1)。

图1 模糊推理机制Fig.1 Fuzzy inference mechanism

则T-S模型中得到两条模糊规则如下:

其对应的ANFIS的模型结构,如下图2所示。

图2 ANFIS的模型结构Fig.2 The structure of ANFIS

ANFIS模型的各层功能:

第一层:每个节点为自适应节点,对应的节点的传递函数为:

式中, j=1,2;i=n×m;O1为隶属于模糊集Aj的隶属度[1]。

根据需要选择参数化隶属函数 µAj(xj),本文选择高斯型函数:

式中,dj和Oj为前提可变的参数。

第二层:该层计算每条输入规则的激励强度,一般情况采用乘法:

式中,j=1,2;i=1,2。

第三层:将每条规则的激励强度归一化。

第四层:根据下面的公式计算每条规则对输出的线性作用,公式为:

第五层:计算所有规则的总输出:

ANFIS模型采用混合学习算法,即对非线性参数采用反梯度下降法进行训练,用递推最小二乘法调节线性参数。在每次学习算法中,先固定前提参数[1],采用递推最小二乘法调整结论参数;然后计算出的数据的输出误差,从输出节点反向传入到输入节点[2],进而并对前提参数进行调整和优化。

1.2 模糊结构辨识问题

ANFIS网络属于局部逼近网络,与BP网络相比还存在一定的差距,另外,T-S模糊模型要求线性的划分输入空间,所以对于较为复杂的非线性空间,要获得较好的辨识效果,会致使规则数的增加。

针对上面提出的研究ANFIS的难题,更需要对输入数据寻求好的聚类方法,然后对输入空间进行合理的划分,找到合适的规则数;提供恰当的初始网络参数值,减小其陷入局部极小的可能性,提高网络的逼近效果,这就是模糊结构辨识的问题。

2 基于人工免疫的聚类算法

2.1 免疫聚类算法分析

基于脊椎动物免疫系统的人工免疫系统是对自然免疫系统的模仿,同生物进化过程不同的是,脊椎动物的免疫系统是产生合适的抗体并且消除抗原的演化过程。免疫系统的主要功能是识别体内的所有细胞是自己或是异己,然后进一步确认异己细胞激活免疫系统。抗体与抗原的相互结合,使免疫系统产生记忆细胞,并将同抗原的接触记忆下来。在人工免疫原理的聚类算法分析中,抗原为需要聚类的数据,聚类中心视为免疫系统的抗体,对数据对象的聚类相当于免疫系统产生抗体、识别抗体,最后产生出最佳抗体的过程[3]。该聚类算法的动态流程图如下图3所示。

Fig.3 The dynamic flow chart of artificial immune图3 免疫聚类算法的动态流程图clustering algorithm

(1)定义需要聚类的输入数据X[n]为抗原,n为输入数据对的个数。

(2)在数据集Xi[i=1,2,…,n]中随机选取k组数据,产生k个聚类中心,即在该空间中产生了k个抗体,抗体用来识别及捕获临近空间的抗原。

(3)计算反应抗原与抗体、抗体与抗体之间相似度的亲合力及个体更新,选择欧距氏离为亲和力指标,定义抗原的分组判断函数为:

这里uij是向量Xj属于ki(i=1,2,…,k)的程度,它的值在0和1之间。在每次分组时根据亲和力属于不同的 ki(i=1,2,…,k)。

(4)根据aiNer免疫网络中有向搜索来寻找抗体优化的方法,由公式 K=K-α(K-X)及计算出的亲和力的大小来重新选择最佳抗体[5]。其中K代表抗体,X代表抗原,α代表学习率。

(5)根据抗体抑制理论:当新抗体产生时,保留每组中的最优秀抗体并清除其它所有不佳抗体。

反复进行上述(1)—(5)的步骤,直到满足设定的目标要求。

3 仿真实验

为了验证本文中所提方法的有效性,引用文献[5]中的一个函数的逼近问题的例子,函数式为:

其中输入变量x和y都定义在上,每个变量都按均匀的概率密度函数随机的产生,函数产生 400个输入输出对作为训练数据。试验中,如下所述设置各个学习参数:最大训练步数为3 000,学习率为0.003,惯性系数为0.51,合成时刻的误差,目标误差,预设阈值。

先利用人工免疫聚类算法对数据进行聚类,当聚类数为15时函数的有效值最大,因此建立的初始模糊规则库中包含15条模糊规则。接着按照所需算法调整规则参数和网络权值,为进行网络结构的优化,当计算误差小于合成误差时,除掉那些影响最小的节点,以获得更好的控制规则数目和网络参数,达到函数的最佳逼近效果。

图4 函数逼近结果Fig.4 Function and it's approximation results

4 结 论

从生物处理信息的机制中感受启发,借助其较强的学习、记忆及自适应调节的能力,把人工免疫系统的原理应用于数据聚类分析的研究中,用来提取和优化模糊规则的数目,从而进行模糊辨识。该方法提供的初始化方案为克服ANFIS网络自身的缺陷提供了一个有效的途径。

[1] 王洪瑞,张永兴,刘聪娜.基于ANFIS的机器人系统建模的研究[J].控制工程,2010,9(1):55-58.

[2]童树鸿, 沈 毅,刘志言.基于聚类分析的模糊分类系统构造方法[J].控制与决策.2001,16(11):737-744.

[3]张利平,吴秀玲.基于人工免疫的聚类算法的图像检索技术研究[J].情报探索,2010,18(2):18-21.

[4]王莉.人工免疫的图像聚类算法的研究[D].太原:太原理工大学,2007:38-42.

[5]陈文清.基于免疫机理的水泥生产工艺故障智能诊断方法的研究[D].武汉:华中科技大学,2011:17-31.

[6]郝敏.基于模糊聚类算法的自适应模糊神经网络研究[D].哈尔滨:哈尔滨理工大学,2007:12-17.

猜你喜欢
免疫系统抗原聚类
身体的保护伞——免疫系统
一类具有抗原性的肿瘤-免疫系统的定性分析
保护好你自己的免疫系统
基于K-means聚类的车-地无线通信场强研究
Staying healthy
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
梅毒螺旋体TpN17抗原的表达及纯化
结核分枝杆菌抗原Lppx和MT0322人T细胞抗原表位的多态性研究