简析基于概率预测的网络数学模型建构

2018-08-22 11:24刘文昊

东方教育 2018年20期

关键词：类别变量概率

刘文昊

摘要：数学结构作为客观世界数量关系与空间形式的反映是有规律的。概率模型构造法为证明解题提供了新的途径。概率的研究起源于实际生活问题，目前广泛应用于各领域。概率论的发展凝结了数学家的心血。概率论在数学模型建立中有着重要的地位。

关键词：概率预测；网络数学模型

一、预测模型的建立

交叉概率预测就是依据某些事件间的相互影响进行分析，当某一事发生时其他事件受影响发生变化的方法。事件间相互影响关系常用矩阵形式表达，各事件变化程度用概率值描述。因此此法称为交叉影响概率法。

移动平均法是一种简单的适应模型，算术平均不能反映数据的变化趋势，原始数据可能是零散的。移动平均法克服了上述弱点。以N=5为例：

移动平均法重要的是移动周期N的选择，N为数据点数。

移动平均修匀后方差随N加大减少，N越大，对原始数据修匀力越强。

二、概率生成模型的网络数据分类

本节描述网络数据分类方法，探讨网络的概率生成模型，将未知类别节点的类别作为模型潜在变量，将网络视为模型观察变量，通过求解模型计算潜在变量取值，得到未知类别节点类别。

1.类别传播分布

网络概率生成模型是描述网络生成的概率模型。网络由节点间的边组成，网络概率生成模型需描述网络中边的生成过程，因此建立网络模型生成关键是给出2点间边的概率。

同质性程度高的网络中，大多相连节点类别相同。类别相同点间有边的概率较大，可用2节点描述边的概率。低同质性网络大多相连节点类别不同，2点间有边概率不因类别相同增大。本文考虑2节点相邻结论对2节点间有边概率的影响。若点Vi邻节点属Lc，点Vi有与类别Lc节点相连的趋势。Vi邻点中，属类别Lc的点越多趋势越强，本文用点Vi邻点类别与点Vj描绘点Vi与点Vj有边概率。点Vj类别是Lc，点Vi邻点属类别Lc点越多。点Vi与点Vj概率越大。

设有K各类别，点Vi有Ni邻点，Ni邻点有Nic各点的类别是Lc，点Vi邻点属类别Lc比为Nic/Ni记θic，向量为点Vi 的类别传播分布。记θi。

一点类别分布由点邻点类别决定，点类别传播分布表现点邻点属各类别的概率。点Vi类别传播分布中类别Lc对应分量θic大，说明Vi邻点属类别Lc概率大。如点Vj连类别是Lc，θic越大，点Vi与点Vj相连概率越大。本文就点Vi类别传播分布与点Vj类别描述点Vi与点Vj间有边的概率。点Vi与点Vj 间有边概率为点Vi类别传播分布在点Vj 类别的分量。

2.基于类别传播分布网络概率生成模型

网络数据用无向图G=表示。E是边集合，V是点集合，yi为点Vi类别索引。若点Vi类别索引为yi 则Vi类别为Ly，若点Vi与点Vj间有边，则Wij=1，否则为0。

网络概率生成模型是描述网络生成过程的概率模型，网络由点间边组成，可将边作模型观察变量。通过描述网络中边的生成描述网络生成。本文概率生成模型将类别传播分布作模型参数。用类别传播分布描述边产生概率。点Vi与点Vj间边概率为Vi的类别传播分布在类别Lyj上的分量θiyj，2点间有边概率依赖其中一点类别。网络中存在部分未知类型的点。本文模型中将未知类别点类别作潜在变量。产生边前通过均匀分布抽取潜在变量取值。得到未知类别点类别。利用类别分布描述边生产概率。

在有N点与K点类别网中，从a为参数产生每点类别传播分布。对每未知类别点从[0，K-1]上均匀分布中产生整数，将其作该点类别索引。对点Vi与点Vj间边，从伯努利分布中产生。参数为点Vi的类别传播分布在类别Lyj上的分量θiyj

網络生成过程

y表示未知类别点类别索引组成的集合。联合概率分布为未知类别点是潜在变量，类别传播分布是参数，网络中边是观察变量，模型求解即通过观察变量计算潜在变量与参数取值。

用吉布斯采样方法需得到潜在变量后验概率，本文模型后验概率为其中y-u表示除点Vu外所有点类别索引。

结论：本文提出给予概率生成模型网络数据分类方法，提出传播分布概念，用以表现节点相邻点属各类别概率，用类别传播分布提出描述网络生成过程的概率生成模型。通过求解模型得出未知类别点的类别。

参考文献：

[1]郑炜，张科，汪芳等.概率预测的网络数学模型及其应用[J].计算机工程与应用，2014.45（18）：59-61，69.