利用LEMNA解释深度学习在网络安全的应用（上）

2019-04-18 09:34郭文博徐军

中国教育网络 2019年3期

文/郭文博徐军

近年来，深度神经网络在网络安全应用上展现出强大的潜力。截至目前，我们已经看到深度神经网络在恶意软件聚类、逆向工程以及网络入侵检测中取得了很好的效果。尽管如此，由于神经网络的不透明特性，安全从业人员对其使用依旧十分慎重。具体而言，深度神经网络可能是由大量的数据集训练而成并且存在上百万个神经元。这种高度的复杂性使得我们很难理解神经网络的某些决策，从而导致了诸如无法信任神经网络以及无法有效判断神经网络的错误等问题。

为了增强神经网络的透明性，研究者们已经开始探索新的方法来解读神经网络的分类结果。然而，这些方法难以用于解释在安全领域的深度学习。一方面，已有的方法主要是用于解释深度学习在图像分析领域的应用，被解释的模型通常是Convolutional Neural Networks (CNN)。但在安全应用方面，比如逆向工程和恶意软件分析领域，通常我们使用具有更高扩展性及更强特征关联性的模型，比如Recurrent Neural Networks (RNN)或者Multilayer Perceptron Model (MLP)。到目前为止，没有解释模型可以被用于RNN；另一方面，现有的方法通常有较低的解释精度。对于拥有模糊边界的应用而言，比如图像识别，相对较低的解释精度是可以接受的。但是对于安全应用，比如二进制分析，一个字节的解释偏差也会导致严重的误解或者错误。

在这项工作中，我们尝试构建一种新型的、具有高解释精度的模型用于安全应用。此方法属于黑盒方法，并且通过特殊的设计来解决以上难题。给定一个输入样本x以及一个分类器（如RNN），我们尝试去发现那些对于归类x起重要作用的关键特征。从技术上而言，对于x附近区域的决策边界生成局部拟合。为了提高拟合的精确度，该方法不假设分类器的决策边界是线性的，也不假设不同的特征之间是独立的。相反，我们借用混合回归模型来近似非线性的局部决策边界，同时通过fused lasso来加强解释精度。这样的设计一方面提供了足够的灵活性来优化对于非线性决策边界的拟合，另一方面fused lasso可以很好地抓住不同特征之间的依赖性。为了更加方便的阐述，我们将这个方法称为LEMNA (Local Explanation Method using Nonlinear Approximation) 。

图1 机器学习解释示例

为了验证解释模型的有效性，我们利用LEMNA来解释深度学习在安全方向的两个应用：PDF malware的聚类以及在二进制代码中寻找函数边界。在这两个应用中，聚类器分别是通过10000 个PDF文件以及2200个二进制程序来训练的。它们都达到了98.6%以上的精度。我们将LEMNA用来解释聚类结果并且开发了一系列的指标来验证解释的正确性。这些指标表明在这些分类器以及应用中，LEMNA显著的优于已有的解释方法。在准确度评估之外，我们还展示了安全分析员和机器学习开发者将如何从解释结果中受益。

这项工作主要带来以下几个贡献:

1.设计并且开发了LEMNA, 它是一种专门用于解释安全应用中的深度学习的方法。该方法结合混合回归模型以及fused lasso，提供高精度的解释结果。

2.在两个不同的安全应用上评测了LEMNA，包括PDF恶意软件聚类，以及二进制代码的函数边界确定。我们提出了一系列的指标来评估我们解释结果的精确度。实验显示LEMNA显著优于现有的解释方法。

3.论证了解释模型的实际应用。不论是二进制代码分析，还是恶意软件检测，LEMNA都阐释了为什么聚类器会做出正确的或者错误的决定。同时还开发了一种简单的方法来自动将我们得到的启发变成修正模型错误的可行方案。

表1 可行方法的必要特征

解释模型设计

解释模型LEMNA

为了实现以上的目标，我们设计并且开发了LEMNA。总体而言，将目标聚类器当成一个黑盒子，通过模型拟合来推导解释。为了提供高精度的解释，LEMNA需要一种全新的设计。首先，引入 Fused Lasso 来处理特征间的依赖关系。然后，将Fused Lasso 融入到一个混合线性模型中，以此来拟合局部非线形的决策边界，从而支持复杂的安全应用。接下来，讨论设计背后的原理，将讲述如果将这些设计整合成一个单独的模型，以此来同时处理特征依赖以及局部非线性。最后，介绍如何利用LEMNA来得到高精度的解释。

Fused Lasso是一种通常用来获取特征依赖的惩罚项，能有效处理像RNN一类深度学习中的特征依赖。总体而言，Fused Lasso迫使LEMNA将相关/相邻的特征组合起来产生有意义的解释。接下来介绍具体的细节。

为了从一个集合的数据样本中学习一个模型，机器学习算法需要最小化一个loss function L(f (x),y)。这个函数定义了预测结果和真实结果的不相似程度。比如说，为了从N个样本中学习到一个线性回归模型 f (x)= βx + ϵ，一个学习算法需要使用Maximum Likelihood Estimation (MLE) 来最小化如下的方程式：

其中， Xi是一个训练样本，被表示成一个多维的特征向量（x1, x2, …, xM）T。Xi的标签表示为 yi。向量 β=（β1，β2, …,βM）包含了这个线性模型的系数，而‖ ·‖是L2范式，来度量模型预测和真实结果中间的不相似程度。Fused Lasso是可以作为惩罚项引入学习算法中的任何损失函数。以线性回归为例，Fused Lasso表示为对于系数施加的约束：

当一个学习算法最小化损失函数的时候，Fused Lasso 强制使得相邻特征间的系数之间的差距在一个S范围内。因此，这个惩罚项驱使一个学习算法对于相邻的特征赋予相同的权重。这可以被认为是驱使一个学习算法聚合一组特征，然后根据特征群组来解释模型。安全应用，比如时间序列分析和代码序列分析，通常需要使用RNN来对特征之间的依赖性进行建模，由此得到的聚类器依据特征的共存来做出分类决策。如果我们用一个标准的线性回归模型（比如 LIME）来得到一个解释，将无法正确的拟合一个局部决策边界。这是因为一个线性回归模型将特征独立对待，无法捕捉到特征依赖。通过在拟合局部决策边界的过程中引入Fused Lasso, 我们期待得到的线性模型有如下形式：

在上面的形式中，特征被群组起来。因此，重要的特征有可能被选取成一个或多个群组。具象的对这个过程进行建模的LEMNA可以推导出精确的解释，尤其是RNN所做出的决策。我们通过图1中的情感分析的例子来解释这个思路。通过引入Fused Lasso, 以及一个回归模型考虑相邻的特征（比如，一个句子中的相邻单词），当我们推导解释时，模型不再简单地抓住单词 “not”，同时我们还能精确的抓住短语“not worth the price”来作为情感分析的解释结果。

Mixture Regression Model 使得我们可以精确的拟合局部非线形决策边界。如图3右边所示，一个混合回归模型是多个线性模型的组合。它使得拟合更加有效：

在上面的公式中，K 是一个超参数，代表着混合模型中线性部件的总个数。πk表示的是对应的部件的权重。

给定足够的数据，不论一个聚类器有着线性的还是非线性的决策边界，该混合模型都可以近乎完美地拟合这个决策边界（使用一个有限集合的线性模型）。因此，在深度学习解释的问题中，这个混合回归模型避免了前面提到的非线性问题，从而得到了更精确的解释。为了更好的阐释这个思路，我们使用图3中的例子。如该图所示，一个标准的线性拟合无法保证输入x 附近的样本仍然在线性局部空间内。这可能轻易导致一个不精确的拟合以及低精度的解释。如图3右边所示，用一个多边的边界来拟合局部决策边界（每一条蓝色的直线代表了一个独立的线性回归模型）。其中最好的拟合是穿过数据点 x 的红线。我们的拟合过程可以产生一个最好的线性回归模型来定位重要的特征。

模型构建

我们把Fused Lasso作为正则项加到mixture regression model中，为了估计模型的参数，需要求解如下的优化方程：

其中f是regression mixture model，β是参数。为了求解这个优化方程，我们需要使用期望最大算法（E-M）。为了使用EM算法，可以把模型等价改写为如下形式：

其中π，β，σ2是需要估计的参数。首先我们随机初始化参数，然后重复进行EM算法的E步和M步直到算法收敛。下面我们简单介绍一下具体算法。

从公式中可以看出，y服从一个由K个Gaussian distribution组成的distribution。每个Gaussian有自己的mean（β）和variance （σ2）。在每一次迭代中首先进行E步，我们把每个样本点分配到一个Gaussian。这里使用的分配方法就是标准的EM算法的E步。完成E步后，根据新的数据分配结果，我们使用每一个Gaussian自己的数据来更新它的mean和variance。更新variance的方法和标准EM相同，但是因为加了Fused Lasso的正则项在mean上，所以更新mean相当于求解如下优化方程：

重复E步和M步直到模型收敛，进而输出模型参数。

如何使用本文提出的模型解释神经网络的结果？具体而言解释过程分为以下两步：近似局部的决策边际和生成解释。

给定一个输入样本，生成解释的关键是近似深度学习模型的局部决策边际，从而获知聚类该样本的重要特征。为了实现这个目的，我们首先生成一组人工样本，然后使用这些数据来模拟目标模型的局部决策边际。有两个可能的方法来实现模拟：第一种是使用一个混合回归模型进行多类分类；第二种是对每一个类使用一个混合回归模型。考虑到计算复杂度，我们使用第二种方法。

如前所述，对于一个给定的样本点，我们的解释是抓取目标模型聚类该样本时依据的重要特征。首先通过上述方法得到一个混合线性回归模型（mixture component）。这个线性回归的参数可以被视为特征的重要性。具体来说，我们把拥有大系数的特征作为重要的特征，同时选择最重要的一小组特征作为解释。

需要注意的是，虽然LEMNA是为了非线性模型和特征相关性设计的，但这并不意味着LEMNA不能解释其他的深度学习模型（MLP和CNN）。事实上，LEMNA是可以根据所解释的深度学习模型调整的。比如，通过增加fused lasso的超参数S，我们可以放松这个正则项，进而使LEMNA适用于假设特征独立的深度学习模型。

利用LEMNA解释深度学习在网络安全的应用（上）

相关背景

问题定义

解释安全应用

解释模型设计

解释模型LEMNA

模型构建