基于监督抽检数据的肉类食品安全风险分析及预测

2019-03-02 06:12李笑曼臧明伍赵洪静王守伟张凯华张哲奇
肉类研究 2019年1期
关键词:肉制品合格神经网络

李笑曼,臧明伍,*,赵洪静,王守伟,李 丹,张凯华,张哲奇

(1.北京食品科学研究院,中国肉类食品综合研究中心,北京 100068;2.国家市场监督管理总局食品审评中心,北京 100070)

肉与肉制品是高营养价值的重要日常消费食品,也是具有较高安全风险和隐患的食品之一。随着我国居民对食品安全要求的不断提高,我国食品监督抽检和风险监测力度也不断提升。2015—2017年,我国分别公开17.2、25.7、23.3 万批次监督抽检数据,抽检种类覆盖肉、乳、粮等大宗日常消费品、加工食品及特殊膳食食品等30余类[1]。海量的监督抽检数据为研究食品安全现状与问题、提高食品安全监管针对性和预见性提供了重要基础数据。发达国家和地区基于食品安全监管数据构建了成熟的食源性疾病、食品污染物等监测与预警信息系统,包括国际食品安全当局网络(international food safety authorities network,INFOSAN)、全球环境监测系统/食品污染物监测与评估规划(global environment monitoring system-food contamination monitoring and assessment programme,GEMS/Food)、欧盟食品与饲料快速预警系统(rapid alert system for food and feed,RASFF)及美国食源性疾病主动监测网络(Food Net)等[2-3],其实践表明,基于数据分析的食品安全监测与预警可以有效将监管前移,实现食品安全的源头防控和主动预防。

目前,国内对食品风险预警的手段限于数理统计、典型病例通报等,对于大量农业食品检测数据的深入分析与应用缺乏有效的手段[4]。事实上,对食品抽检监测数据中存在的问题进行分析和建模,可以更好地理解和识别不安全风险和因素,进而达到风险预警和预测的目的[5-7]。人工神经网络(artificial neural network,ANN)计算模型是基于生物神经网络结构和功能建立的具有学习和自适应性的计算模型,是管理系统仿真研究的重要方法[8-9]。目前已有学者建立了ANN简化模型,进行食品安全预警研究和因素的拟合分析,开发了能够识别食品生产供应链中检测数据异常值的神经网络数学模型,进行及时监控和预警[10],或利用国内有关农产品质量安全检测的大量数据,选择神经网络算法构建模型和组合模型,指导实际的食品质量安全抽样工作[11]。基于BP(back propagation)神经网络的食品安全预警方法可以有效识别、记忆食品危险特征,并能够对实际食品安全检测数据样本进行有效预测[12-14]。

本研究以2015—2017年肉类食品国家公开监督抽检信息为基础,运用IBM SPSS Modeler软件构建基于肉与肉制品监督抽检各类属性指标与不合格项目数据的3 层BP神经网络预测模型,重点分析当前肉类食品安全现状与风险类型,并对模型进行有效性验证,为我国肉类食品安全问题分析与风险预警提供理论依据,并为食品安全数据的进一步深入挖掘提供参考。

1 数据来源

2015—2017年,国家食品药品监督管理总局在官方网站共发布5 554 期食品安全抽检信息公告,本研究选取来源于2015—2017年国家食品药品监督管理总局直属系统公开发布的54 期、共18 378 批次肉与肉制品监督抽检信息,数据涵盖肉制品、畜禽肉及副产品等各产品类型,同时包括监督抽检合格与不合格产品的名称、生产企业、生产日期、检验项目、检验结果、标准值、商标和规格型号等原始信息,所得到的数据如表1所示。依据肉与肉制品细类划分为畜肉、禽肉、畜内脏、禽内脏、酱卤肉制品、熟肉干制品、速冻调制肉制品、熏烧烤肉制品、熏煮香肠火腿制品、腌腊肉制品和其他肉制品11 个产品类型。“风干肉”产品生产企业所在省份如在北方通常记为“熟肉干制品”,如产地为南方或产品名称为“风干肠”则记为“腌腊肉制品”,其余产品均依据相应产品包装所标注的信息划分产品细类。

2 肉类食品安全风险

2.1 微生物指标不合格与食品添加剂不符合规定

基于以上肉类食品安全监督抽检数据得到的546 条不合格数据信息,由图1可知,微生物(非致病)指标不合格和食品添加剂不合规定的肉及肉制品占比分别达42.3%和24.9%。其中,熟肉制品面临较高的微生物不合格风险。

由图2可知,微生物指标不合格主要集中在熟肉制品中的酱卤肉制品、熟肉干制品、熏煮香肠火腿制品、熏烧烤肉制品及腌腊肉制品中。菌落总数是主要的微生物不合格评价指标。湖南、四川、重庆等地区的酱卤肉制品、内蒙古和四川的熟肉干制品的菌落总数不合格情况较严重[15]。熟肉制品和即食生调制肉制品中致病微生物较多,主要风险包括单核细胞增生李斯特氏菌、金黄色葡萄球菌和沙门氏菌等,共存在6 批次污染。单核细胞增生李斯特氏菌、金黄色葡萄球菌等致病菌通常在一般烹煮温度下可被杀死,但在冷藏温度下仍然可以缓慢生长。引发熟肉制品微生物污染问题的原因较多,熟肉制品通常能够通过加热杀灭大部分微生物,但由于酱卤肉制品和熟肉干制品加工过程中有时会添加酱料、胡椒碎等辅料,这些辅料的制作过程中没有灭菌,因此最后制成的熟肉制品微生物指标较高,尤其是在夏季生产的产品,由于可能会影响风味等原因,一些酱卤肉制品及熟肉干制品没有进行二次杀菌[16]。东北地区熏煮香肠火腿制品,如红肠的微生物指标不合格情况仍然偏多,这主要是由于红肠等产品的真空包装条件通常未能达到要求,安全指标控制、冷链运输条件未能满足,长时间与空气接触极易滋生微生物,特别是在夏季,容易出现菌落总数超标问题。

熟肉制品不合格统计中拥有较高占比的为食品添加剂不符合规定。由图3可知,山梨酸作为防腐保鲜剂广泛应用于酱卤肉制品生产加工过程中,2015—2017年共有山梨酸不符合规定产品67 批次,占比57.3%。酱卤肉制品的不合格情况涵盖鸡肉、鸭肉、猪肉、牛肉制品及多种风味肉制品,如“酱卤、蒜香、泡椒、烧烤、黄焖”肉制品。防腐剂及着色剂亚硝酸盐不符合规定产品占比14.5%,着色剂胭脂红不符合规定产品占比8.5%。部分腌腊、酱卤肉制品加工过程中添加了防腐剂以抑制肉毒菌的生长,甚至在原料肉中注入亚硝酸盐,以延缓肉类的微生物腐败现象,此类情况在夏季生产、散装加工肉制品和餐馆菜肴中较为常见。由图4可知,抽检肉与肉制品的大肠菌群和菌落总数不合格批次夏季最多,山梨酸、亚硝酸盐等食品添加剂不符合规定的情况全年均有,在夏季也有增多趋势。

2.2 其他指标不合格

由图5可知,酱卤肉制品中禁用兽药及畜禽肉中的兽药残留风险也较为突出。莱克多巴胺的残留不合格主要来自于散称酱卤食品及批发市场;克伦特罗、呋喃唑酮代谢物及沙丁胺醇等禁用兽药分别主要检出自畜肉及内脏、禽肉和熏煮香肠火腿制品。2017年我国肉及肉制品中禁用兽药检出情况有所改善,但畜内脏、禽内脏中仍检出克伦特罗和特布他林,同时检出五氯酚酸钠共计4 批次。熟肉制品的兽药残留情况较好,2015—2017年抽检时未出现不合格。土霉素、地塞米松及磺胺类等药物是畜禽肉兽药残留的主要成分。用于食用的农产品中农兽药残留超标及禁用兽药问题主要是由于种养殖环节甚至流通环节为促进动物生长、提高饲料转化率而违规滥用或故意添加化学类药物。

由图6可知,我国以熏煮香肠火腿及腌腊肉制品为主的熟肉制品面临较多的品质不达标问题。酸价超标产品最多,共计18 批次,其中腌腊肉制品13 批次,占比达72.2%,产地集中在广东、湖南、江苏及浙江等地区。过氧化值不合格情况在腌腊肉制品中也较为突出,占比达58.3%,这些产品大多来自于网络抽检食品或缺少包装的散称食品。肉制品中的脂肪水解产生游离脂肪酸,尤其是传统腌腊肉制品,在非熟制条件和具有活性的脂肪酶作用下,在产品生产后游离脂肪酸含量仍可能继续升高,继而导致酸价升高。脂肪含量越高,脂肪越容易被氧化,过氧化值也越高[17]。

其次是蛋白质指标不合格产品,共计12 批次,其中熏煮香肠火腿制品占比达91.7%。蛋白质、淀粉等指标不合格不排除存在个别食品生产经营者以次充好、偷工减料,甚至违法掺杂使假的情况。河北、黑龙江、江苏等地区生产的熏煮火腿产品蛋白质指标不合格率超过54%。

肉及肉制品中金属元素污染物不合格集中在总抽检批次公开较多的2015年,不合格项目包括镉、铅、铬元素含量,共计16 批次产品,其中铅元素不合格达10 批次,在凤爪、板筋及牛肉干产品中检出较多。此外,镉元素不合格产品全部为驴肉制品。这些金属元素污染物主要与环境污染、生产企业原料把关不严有关[18]。

3 肉类食品监督抽检数据挖掘与预测模型

3.1 BP神经网络方法

BP神经网络是应用最广泛的一类神经网络,Hecht-Nielsen[19]的万能逼近定理曾证明,含有输入层、隐含层和输出层的3 层BP网络具有高度的非线性映射能力。在监督抽检中,通常以质量标准来判定某产品是否为不合格产品,在若干项检测项目中,只要有1 项超过标准,该产品即被判定为不合格。神经网络可以识别食品抽样数据中某一被检测样品存在的诸多相关属性和其他信息,并能够有效利用监督抽检得到的各项指标检测结果,以达到利用已知的属性信息预测食品安全风险、隐患和趋势,挖掘肉品监督抽检数据并进行预警和快速反应的目的和效果。其核心学习过程主要包括数据的正向传播和误差的反向传播2 个阶段。由于BP神经网络善于进行数据分类及处理,即便原始训练数据集存在空值和离散性的数据,也能够较好地处理缺失值,优化处理输入、输出层单元结构,使预测结果足够精确[20-23]。本研究构建的3 层食品监督抽检BP神经网络模型可以基于样本反复训练后确定BP神经网络的关键参数,将具有多维属性且不同取值的食品监督抽检数据准确分类到输出层,从而得出预测目标变量结果及预测结果分类的重要性情况。

3.2 数据预处理

数据本身的结构和特点很大程度上影响BP神经网络模型的预测准确度,因而既需要选取恰当的特征属性和输出结果,也需要保证足够的数据量。

对于单一样本而言,有17 个属性,但并非所有的属性都适用于模型,选择代表样本本身的属性,排除“抽样地址”、“商标”等无效属性。规格型号、检验结果、标称生产企业地址等指标虽是有用信息,但在不同情况下数据长短不统一,无法确定合理数值,也不能有效使用。最终选取“抽样省份、产品类型、产地、生产日期、年份、是否大型企业”6 个属性作为输入变量,以“是否合格”为输出变量。

从2015—2017年的肉与肉制品原始数据共18 378 条中筛选出检测项目不合格的全部数据样本,其中不合格数据546 条,其余均为合格数据,显然样本极度不平衡,若直接将此数据用于模型构建,则会导致小样本类别预测效果较差的结果,而小样本类别恰巧是需要关注的重点检出指标。因此,在17832 条合格数据中,科学地抽出不合格与合格预混比例分别为1∶1(平衡肉类检测数据)和1∶2的数据,以提高预测结果准确度。Excel数据抽样公式为“=INDEX(Sheet1!A1∶A17833,RANDBETWEEN(1,17833))”,数据调用公式为“=VLOOKUP(She et2!$A2,Sheet1!$A$2:$P$17833,2,FALSE)”。以不合格与合格预混比例1∶2抽样为例,抽样前原始数据中北京市2015年熏烧烤肉制品中合格数据为89 条,酱卤肉制品为200 条,抽样后得到的熏烧烤及酱卤肉制品合格数据分别为6、33 条,抽样后样本分层比例与原始数据相近。

将数据进行预混合后,作为构建模型的数据集,进行下一步处理和分析[24-25]。数据框类型如表2所示。

表 2 BP神经网络模型的数据框类型Table 2 Data frame types for BP neural network model

3.3 食品安全预警数据分析模型的构建

使用IBM SPSS Modeler 14.1软件构建BP神经网络模型。IBM SPSS Modeler是一个提供多种算法和技术的预测性分析平台,能够实现数据的自动化准备、自动数据建模等多项数据分析工作,在食品安全数据分析中发挥极大的作用。运用IBM SPSS Modeler软件构建BP神经网络的过程包括:导入样本数据并储存在Excel表中、选择类型节点与数据准备、选择分区节点、选择神经网络节点、生成模型、参数优化、模型预测与分析[26-27]。本次模型构建首先将数据导入后,进行自动数据准备,样本属性均为名义变量。而人工神经网络输入变量的取值通常要求在0~1之间,否则输入变量的不同数量级别将直接影响权值的确定。此外,神经网络只能处理数值型输入变量,对于已选定的分类变量,自动数据处理将k 个类别的分类型变量转化为k 个取值为0或1的数值型变量后,采用二进制码将各变量编码,使其符合神经网络的输入要求。样本属性中所有数据均为名义变量[28-29]。其次,将全部数据分区,选取全部数据的70%作为训练集,用于训练神经网络模型,20%的数据作为测试集,10%作为验证集[30]。待模型构建完成后,测试集用于检测模型的预测效果,验证集用于调整模型参数。BP神经网络模型构建过程如图7所示。

由训练集生成的BP神经网络模型概要中,模型的目标变量为“是否合格”(“合格”或“不合格”)。构建多层感知器模型,多层感知器模型为前馈式网络模型,模型使用的停止规则为“无法进一步降低误差”,由于模型的训练为不断向样本学习的过程,通过不断调整网络权值以得到较小的预测误差。向所有样本学习完毕后,如果预测误差仍较大,需重新开始新的学习,直到得到理想的精度或满足停止规则。

3.4 结果分析

最终形成的BP神经网络模型为3 层神经网络,隐藏层中神经元数量为5 个。预混比例1∶2分层抽样数据得到的预测模型及模型概要如图8所示,总预测准确度达96.2%。

表 3 2015—2017年肉与肉制品分层抽样结果及检出结果Table 3 Stratified sampling and detection of meat and meat products in the period of 2015—2017

对比预测结果准确度、分层抽样结果及模型概要。由表3可知,虽然首先进行的平衡检测数据(预混比例1∶1)抽样过程得到的总体准确度(总体百分比矫正)为69.6%,而预混比例1∶2抽样数据得到的总体准确度达96.2%,且隐藏层神经元数量比平衡检测数据时多2 个。同时,对于实际检测是否合格的结果,预混比例1∶2抽样数据的BP神经网络模型对于样本不合格及合格的预测准确度非常高,因此对于此次网络预测模型的构建宜采用预混比例1∶2的抽样方式。

利用训练集生成BP神经网络模型后,用测试集评价模型的预测准确性。由图9可知:对于合格样本,判定为合格的概率为96.0%,准确度非常高;对于不合格样本,判定为不合格的概率为96.5%,准确度也极高;样本为合格,错判为不合格的概率为4.0%;样本为不合格,错判为合格的概率仅为3.5%。总体而言,对于实际结果为合格的样本,BP神经网络模型的预测准确度非常高,对于实际结果为不合格的样本,模型的预测准确度有所降低,但是仍有参考和应用价值。另外,这一结果的出现一定程度上是由于样本仍然不平衡所致,即结果为合格的样本数量远大于不合格的样本数量,导致神经网络学习时在大样本分类中预测误差较小,而在小样本分类中预测效果稍显欠缺。这一缺陷可通过进一步完善原始数据和对数据集做不平衡抽样等深入预处理逐步改善。

根据得到的BP神经网络模型,可以得到各属性变量对预测结果分类的重要性情况。由图10可知,最重要的属性为“被抽样单位所在省份”、“生产日期/月份”和“产地”。对结果进行初步分析认为,一方面由于我国各地区产品抽样检测水平仍有较大差距,检验设备及能力不均衡,对不合格结果的预测影响较大,另一方面被抽样单位所在省份与生产省份相近,而我国各地区肉及肉制品质量安全水平不一。同时,季节对肉与肉制品质量安全中微生物指标和添加剂不合格指标影响较大。最不重要的属性为“年份”和“是否大型企业”,这一结果验证了虽然我国2015—2017年公开的抽检数据总量存在较大差异,但运用BP神经网络分层筛选的数据仍具有一定代表性,产品不合格情况的基本预测与年份、甚至产品是否来自大型企业没有很大关系。此外,较重要的变量还包括“产品类型”,从食品细类看,对于不合格样本变量,肉制品各细类产品的检出率和不合格率有较大差异,因此产品品类对检出结果预测的影响较大。

3.5 模型应用与建议

以上是以产品全部不合格样本为研究对象所构建的模型,在实际应用中,可以进一步对所关注的指标进行预测,分别构建相应的BP神经网络模型,并将其作为样品检测前的参考,筛选出单个样品需重点关注的检验项目。以样品A为例,将其某一属性指标导入已训练生成的BP神经网络预测模型中,若预测结果为不合格或检出,则应重点检测该指标,若检测结果为合格或未检出,则应更换为BP神经网络模型预测的其他重点指标的检出情况。由于该模型对于实际不合格样本的错判率为3.5%,故暂不建议当预测结果为未检出时,直接将此项目免检。运用此模型时,检测人员可以通过样本的属性提前预测模型的可能检出结果,有针对性地进行检测,避免漏检、错检情况发生,同时也能有效节省人力、物力和财力。后期通过对模型的改进,提升模型的预测效果后,也可以对预测未检出概率高的样本实现免检,具有较高的实用价值。

后期如要提升BP神经网络模型在“检出”和“未检出”样品中的准确度,数据准备过程尤其重要。对于食品安全监督抽检神经网络模型数据准备的建议:1)丰富样本公开数据信息,如以国家公开数据信息“超市、福建、常温、熏煮香肠火腿制品、预包装、城市、11.5、否、2015年、贵州”为例,数据中仅披露了上述抽样环节、生产省份、抽样状态、产品类别、包装形态、抽样时间及抽样省份等分类型变量,尚未详细、有效地披露样品的单价、年销售额等数值型变量,这些属性也可能是反映样本本质的重要特征,抽样时应做到有效记录;2)由于不合格样本数量极少,不适用于大样本下的数据挖掘分析,应规范各项指标检出值的记录,对同一质量标准下的样品均记录检验结果的原始值,而非“<0.001”、“未检出”等字样,并充分披露公开。这样在建模和分析时,可以根据数值区间有效细分,进而完善模型,提高预测精确度。

4 结 论

本文在收集整理2015—2017年18 378 批次肉类食品国家监督抽检数据的基础上,梳理肉类食品安全的主要风险因素和问题产生的原因,并构建肉类食品安全监督抽检结果的BP神经网络预测模型。从不合格样品来看,2015—2017年我国肉及肉制品微生物指标不合格风险较高,占不合格产品的39%,食品添加剂不符合规定产品占比27%,品质不达标产品占比12%,金属元素污染、兽药残留、致病微生物、其他污染物及禁用兽药不合格产品分别占比4%、3%、3%、2%和1%。经过IBM SPSS Modeler软件的自动模型验证与参数优化过程,得到的3 层神经网络预警模型总体百分比矫正为96.2%,对于合格样本,判定正确的概率为96.5%,错判概率为3.5%,表明基于监督抽检数据的肉类食品安全不合格指标预测得到初步应用验证,肉类食品监督抽检数据的预测模型效果良好。产品各属性变量对预测结果分类的重要性表明,微生物和食品添加剂不符合规定为主要风险,此类问题集中存在于酱卤肉制品、腌腊肉制品等熟肉制品中,且夏季生产产品的不合格风险更高。

建议今后一是重点加强湖南、四川、重庆等地区酱卤肉制品添加剂和微生物指标以及腌腊肉制品不合格指标的抽检监测,科学制定实施肉品抽检监测计划,适当提升西部和欠发达地区的肉品监督抽检与风险监测水平;二是推进公众食品质量安全数据共享机制,加强政府官网、新闻媒体等多种形式的抽检信息规范化公布,并通过构建肉品安全监督抽检数据库对肉品不合格项目进行系统搜集、监测和预警;三是建立对重点抽样监测区域、产品类型、检测项目等多项指标的预警模型系统,如建立牛羊肉产品中克仑特罗、莱克多巴胺等禁用兽药检出预警模型、畜禽内脏中金属元素等污染物监测预警模型、酱卤肉制品中山梨酸添加剂超标预测模型及广东腌腊肉制品不合格指标预测模型等;四是有效记录检测样品信息,规范各项指标检出结果与原始值,提高模型系统预测精确度,实现重点地区、重点项目的预测预警,为推进肉类食品安全检测的科学性与靶向性提供数据平台和技术手段。

猜你喜欢
肉制品合格神经网络
苏丹将扩大牲畜和肉制品出口市场
神经网络抑制无线通信干扰探究
我是合格的小会计
基于神经网络的拉矫机控制模型建立
做合格党员
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
GC-O风味分析及R-index法在发酵肉制品排序中的应用
句子的合格与不合格
肉制品致腐微生物溯源技术构建