基于贝叶斯网络的疫苗全产业链质量安全风险测度

2022-12-18 03:19谢小良成佳祺黄凌璐左锦霞刘光男李慧慧
湖南财政经济学院学报 2022年2期
关键词:贝叶斯概率疫苗

谢小良 成佳祺 黄凌璐 左锦霞 刘光男 李慧慧

(1.湖南工商大学 理学院,湖南 长沙 410205;2.湖南工商大学 大数据与互联网创新研究院,湖南 长沙 410205)

一、引言

2011年,我国疫苗监管体系正式通过世界卫生组织评估;2014年,我国疫苗监管体系通过世界卫生组织再评估。这说明我国疫苗监管体系日臻完善,疫苗监管质量符合国际标准。2020年,全球突发疫情,疫苗研制和监管再次成为全人类共同关注的热点问题,而我国疫情爆发的时间比较早,在疫苗研发上有着先发优势。然而,现阶段我国疫苗行业仍处于成长波折阶段。2016年山东疫苗事件和2018年长春长生疫苗事件不仅连续冲击了疫苗行业,也严重损害了人民群众的利益,给党和政府形象及社会稳定带来了极大危害,敲响了疫苗质量安全的警钟。2019年12月我国施行《疫苗管理法》,鼓励疫苗行业的生产规模化、集约化,保障疫苗质量和供应,规范疫苗接种,为公众健康安全保驾护航。

国内外学者对疫苗质量安全风险度量的研究成果比较丰富,已有研究大部分集中在理论分析方面。我国最早的疫苗质量全产业链研究始于1991年[1],探讨了全面质量管理在控制和消除计免响应传染病中的效果,涉及疫苗的领取、冷藏运输、保管、免疫接种、分配、监管等环节;2000年,朱加叶和乙小娟对疫苗的生产质量管理、冷链系统的管理、免疫接种副反应及其预防等问题进行了探讨[2];2007年以来,我国对于疫苗安全研究更为细致与专业化,如有关动物疫苗的生产安全管控[3]、肺炎球菌结合疫苗质量控制考虑要点[4]、我国动物狂犬病疫苗的质量管理等[5]。查阅现有文献,发现已有研究主要包括理论框架研究与实践研究,这些研究中以定性分析居多,如比较分析[6]、案例分析[7]等,定量研究和实证分析极少。少有的定量分析也只是针对食品药品质量安全风险等级进行的大类评估,如食品药品监管风险预警系统构建[8]、大中型医疗机构药品质量安全风险评价[9]等,现有关于药品食品风险度量的方法适用性有限[10],大部分统计分析方法的实验环境过于理想化[11]。贝叶斯网络具有两方面显著优势:一方面,贝叶斯网络具有概率性语义和因果逻辑,可以学习样本数据中的因果关系,根据因果关系进行结构学习和参数学习[12];另一方面,贝叶斯网络通过可视化方式直观描述样本数据间的相依关系,便于直观理解[13]。Judea Pearl(1986)提出了贝叶斯网络的概念[14],袁卫(1990)提出贝叶斯公式是现代统计推断的重要方法[15],向书坚(2001)提出贝叶斯预测类似于Kalman滤波过程[16],刘乐平等(2013)指出应用贝叶斯统计学可以揭示长期存在的计算学难题[17],Tien(2016)提出贝叶斯网络是描述变量之间因果关系、处理不确定性问题的有力工具[18],欧阳资生和黄颖(2017)利用贝叶斯方法对金融风险进行了度量[19];Gendelman(2017)等分别将贝叶斯网络应用于医学、风险评估和自然语言处理[20-22]。因此,采用贝叶斯网络构建疫苗全产业链质量风险度量模型,可以在一定程度上弥补已有研究的不足。

贝叶斯网络是美国Pearl教授所提出的一种用于表达随机变量概率关系的图型模型,具有强大的不确定性问题处理能力,利用条件概率表达各个信息要素之间的关系,能在有限的、不完整的、不确定的信息条件下进行学习和推理,在处理小数据集问题上有很好的表现,是一种很好的风险诊断方法。王双成等探究了贝叶斯网络在小数据集上的表现,实验结果表明这种方法是有效且可靠的[23]。王广彦等将故障树转化为贝叶斯网络,对二者的推断功能进行了比较,证明贝叶斯网络具有更好地揭示系统故障原因的能力,认为结合贝叶斯网络对故障树进行分析是一种有效的评价手段[24]。张友强等借用贝叶斯网络探究了智能变电站保护设备状态检修方法,得出故障风险评估结果[25]。而比较新的研究中,贝叶斯网络也被应用于经济数据分类、人民币汇率风险预测、贷款违约预测、无人配送风险评估、新闻类自然语言处理、乳腺癌分期诊断、声学数据频率分析和土壤分层识别等方面,但应用贝叶斯网络进行疫苗质量安全监测的研究文献极其罕见。

二、贝叶斯网络

贝叶斯网络(Bayesian network,BN)又称信念网络,是一种表示变量间的相互关系及其概率分布的有向无环图(directed acyclic graph,DAG)。BN可以用G(V,E)表示,V表示节点集,节点表示随机变量,疫苗质量安全风险测度中所构建的指标体系就是V,V中的每一个具体指标就是节点,其状态能够反映影响因素之间的相关关系;E表示有向边集,代表两个节点间的依赖关系强度,其中一个节点是“因”,另一个节点是“果”,疫苗质量安全中的不安全因素可能会导致疫苗发生质量问题,这就是疫苗质量安全测度中的因果;每一个节点都对应一个条件概率表(conditional probability table,CPT),CPT表示随机变量之间的相关强度,由相关强度的数值可以计算风险发生的概率数值。BN需要完成对网络结构学习和参数学习过程,网络结构学习可以综合专家知识进行对应问题的定性描述,网络参数学习明确对应问题的定量分析,通过定性和定量的有机结合,使复杂关系图清晰明了直观。利用贝叶斯定理的学习和统计推理函数可以实现预测、诊断等任务。BN利用概率形式表示疫苗全产业链所有状态的不确定性,并通过概率规则实现BN的结构学习和推理过程,从而完成对疫苗安全质量风险发生的概率进行定量描述和对已发生事件的原因进行概率分析与有效诊断。

(一)BN结构学习

贝叶斯网络以贝叶斯条件概率公式为基础,基于概率推理的图形化网络,它可以综合考虑疫苗质量安全风险因素体系及因素间的相互关系,并能够通过逐层计算条件概率得出体系后果及其可能性的定量结果。因此,可以用贝叶斯网络作为构建疫苗质量风险评估模型的方法,将疫苗全产业链质量安全风险因素作为网络节点,建立疫苗质量风险的贝叶斯网络模型。贝叶斯网络结构学习主要通过先验知识,再结合对样本数据的分析,然后构建出一个有向无环图(DAG),使这个图能够反映最接近真实的关系。BN结构和数据可以用来确定参数,结构学习合理的情况下,可构建出最优的BN结构。

BN结构学习过程如下:首先,确定网络节点。BN建模中主要存在三种节点集,即目标节点(父节点或子节点)、中间节点和证据节点。目标节点是用来识别待解决问题,通过推理目标得到后验概率,用于相关决策的进行,疫苗安全风险就是目标节点;证据节点是用来输入BN,并且确定已知条件,疫苗安全风险监测体系就是证据节点;中间节点是除以上两种节点之外的节点形式。划分所选因素的状态代表节点值的确定,每个因素的范围都可视为一个完整的空间状态。通过对每个空间进行连续的划分,因素所落的范围表示节点的取值,各状态之间都是相互独立的。疫苗全产业链质量风险的贝叶斯网络节点是基于我国法律法规(《疫苗管理法》《药品生产质量管理规范》等)、文献分析法和统计分析方法对影响疫苗质量安全的因素进行归纳、总结和筛选。其次,确定BN的拓扑结构。结构学习是BN学习的基础,有效的结构学习是构建最优网络结构的关键。BN结构的构建包括:一是基于专家经验和先验知识确定BN的可变节点,从而确定BN的拓扑结构,然后依据推断原理来构造网络模型;二是通过对已知样本数据的学习,借助机器学习算法来获取BN结构。但是,在实际采集数据中,数量较大的网络节点会增加算法的计算量。因此,在实践中应用这种学习算法会存在很多限制条件。分析疫苗全产业链质量风险时是基于专家经验的问卷数据和机器学习算法得出的,是基于前两种方法的融合,既能避免专家经验的定性弊端,又能同时解决机器学习的单纯定量学习的缺点并运用在对应的实际问题中。本文基于专家经验和已有文献构建BN的拓扑结构,借助机器学习算法来优化BN结构,且主要借助机器学习算法以保证拓扑结构的准确性,最后确定节点的条件概率分布。主要有两种方法:第一种方法是基于疫苗质量安全的样本数据,通过对数据的训练学习,直接得到节点的概率分布,具有较高的准确性和有效性;第二种方法是通过专家经验确定疫苗质量安全风险等级。

(二)BN参数学习

在BN结构已知条件下,用样本数据来学习节点的CPT,这样的方法被称为BN参数学习。目前比较好的参数学习软件为Netica软件。Netica软件由NORSYS 软件公司出品,是目前世界上拥有最广泛的贝叶斯网络应用的分析软件,Netica软件的开发软件以可靠、高效而著称,现阶段被广泛应用于商业、工程、医药和生态分析,被世界上一些大公司和政府机构作为决策的工具,所以度量疫苗质量安全风险可以基于Netica软件进行参数学习,对其各观测节点的风险概率值进行分类度量。数据样本可分为两种,分别是调查问卷的完备数据集和数据收集的不完备数据集,通常用最大似然估计和贝叶斯两种比较常见的学习方法来对完备数据集进行学习;对不完备数据,要借助EM 算法近似方法来学习。构建了疫苗质量安全风险的BN模型之后,结合样本数据,通过条件概率公式来计算目标节点(父节点或子节点)发生的概率。概率推理的形式主要有三种:一是因果推理,由父节点推导子节点,即由疫苗发生情况推导各子节点的风险发生概率;二是诊断推理,由子节点推导父节点,即由疫苗质量安全因素发生的情况推导父节点的风险发生概率;三是解释推理,在目标节点(父节点或子节点)和部分证据已知的条件下推算剩余证据的概率,从而完整解释事件发生的情况。

(三)BN风险模型

疫苗质量安全风险的BN网络由DAG和一组相关的条件概率分布组成,DAG反映一组变量(节点)之间的条件独立关系,有限离散BN的数学表述可简记为β(G,P),其中,G=(X,E)表示有d个离散随机变量X={X1,X2,…,Xd}的DAG,X为评价指标中风险因子的集合,E为风险因子间的直接依赖关系,每个Xi都有父节点pa(Xi)。向量(X1,X2,…,Xd)的联合概率分布记为:

BN模型,可以采用爬山算法进行结构学习,采用Netica软件进行参数学习,BN多用于风险事件的概率预测和已发事故的原因诊断。BN风险模型能够将事件之间的关系以具体明了的拓扑图形式展现,能够发现数据中的隐形关联信息,对于处理不完全和不准确数据也有很好的表现。BD模型在处理疫苗质量安全风险评估上能够解决数据不完全、信息不确定的问题、指标因素较多且因素之间有较为复杂因果关系的问题以及模型可解释问题。疫苗质量安全风险评估除了要进行准确评估预警之外,还需要对事件发生的过程进行解释,以此为进一步优化疫苗质量安全体系提供具体依据。

三、指标体系构建

本文综合考虑了《疫苗管理法》《药品生产质量管理规范》和前人的研究,结合本文的研究目的和思路,以保障疫苗安全为准则,归纳总结了现阶段影响疫苗质量安全的各风险因素,以此构建指标体系。从法律法规方面来看,我国《疫苗管理法》对于疫苗质量安全的划分与界定十分详细,主要将疫苗安全监管分为六个部分:疫苗的研制和注册、生产和批签发、流通、预防接种、异常反应监测和处理及上市后管理,且根据每一部分进行一一规范;从CNKI中国学术期刊的关键词检索来看,围绕“疫苗质量风险”的研究成果比较少,为此文章扩大了搜索范围,围绕“疫苗”进行了关键词搜索及关联词搜索,主要检索词汇有:疫苗安全、疫苗监管、疫苗研究进展、疫苗生产、疫苗制备、疫苗管理法、疫苗事件、疫苗冷链,检索期刊的来源限定为SCI、EI、CSSCI、CSCD和硕博论文数据库。最终通过整理、筛选及归纳,总结出了一套系统的疫苗质量安全风险监测指标体系。下面以我国相关法律法规[34]为基础,结合 OpenLaw官网公布的疫苗安全事件案例,并咨询国家课题组合作单位湖南省疾控中心免疫规划科专家,从疫苗研发环节、审批环节、生产环节、流通环节、不良反应检测环节中选择31个主要风险因素,建立相应评估指标体系,本文使用的指标和相应的符号设定如表1所示。

表1 疫苗安全风险监测预选指标

通过前期对相关文献的收集与研究,针对疫苗安全监管的多个环节,以此设计调查问卷的相关问题,并将问卷发放给与疫苗安全监管相关的工作人员。具体操作如下:1.发放并回收问卷;2.问卷筛选;3.赋予权重;4.计算先验概率。本次实证分析总计发放问卷160份,收回155份,回收率为96.875%,其中无效问卷为5份,有效问卷为150份,有效回收率为96.774%。使用Likert五分量表测量疫苗安全监测的影响因素并进行相应的赋值,1表示没有影响,2表示影响较小,3表示影响一般,4表示影响较大,5表示影响很大。

(一)风险等级划分

以现有研究为基础,结合所调查的数据,对疫苗的研发、审批、生产、流通以及不良反应监测五个环节的影响指标进行总结和概括,具体的概括详情如表1所示。

根据国家相关规定,将疫苗安全风险进行量化,本文将疫苗安全风险分为五个等级来进行评估,具体等级量化表如表2所示。

表2 疫苗风险概率等级划分

(二)指标筛选

对于本文所构建的指标体系包含疫苗研发、审批、生产、流通以及不良反应监测五个环节,涉及34个具体指标,五个环节之间有从前到后的时间顺序,各环节的各个指标共同构成同一环节,由于同一环节中的不同指标之间数据有较强的耦合度,本文针对每一个环节得到的数据进行筛选,以达到减少指标的强耦合数据的目的,数据的耦合度可以通过Person相关性分析来度量,Person相关系数介于-1到1之间,绝对值越接近1,数据之间的相关性和耦合度越高,利用SPSS进行Person相关性分析来剔除样本中一些相关性很高的指标,减少分析指标的个数,构建高质量风险评估指标体系。本文对疫苗研发、审批、生产、流通以及不良反应监测这五个环节分别进行指标的耦合度筛选,即对这五个环节分别进行Person相关性分析,筛选出具有代表性的指标体系。由于五次Person相关性分析采取的方法一致,所以此处仅展示研发环节的相关性分析结果,如表3所示。

表3 研发环节相关性

续表3

根据Person分析可知,疫苗研发、审批、生产、流通以及不良反应监测这五个环节中:临床试验设计和研制方法及检验标准、研制的试验设计环境与研制的仪器设备、实验室的人员素质与标准操作规程之间有着较强相关性;根据相同的原理可以筛选出其他环节的指标,最终保留了临床试验设计A1、研制的仪器设备A4、实验室的人员素质A5、审评专家意见客观性B1、核查队伍稳定性B2、检验检测体系B5、生产仪器及设备C2、生产环境C3、质量检测过程C5、体系文件C6、疫苗的存储环境D1、流通渠道的规范性D4、流通环节的精简性D8、监测主管部门的独立性E1、不良反应监测的基本概念和评判标准的一致性E2等指标。

(三)指标体系构建

根据Person分析,上述指标筛选结果为A1、A4、A5、B1、B2、B5、C2、C3、C5、C6、D1、D4、D8、E1、E2,筛选后确定了疫苗质量风险度量指标体系,如图1所示。通过贝叶斯网状图,可以清楚地看到各风险指标及各指标之间的网状关系。

图1 疫苗质量风险评价指标体系

四、模拟仿真

疫苗全产业链过程是一个复杂的大系统,从疫苗研发、流通到接种完成的过程中涉及因素很多,一个简单的定量系统或者方程是很难满足要求的,而贝叶斯网络能很好地解决这一问题。在贝叶斯网络中,每个节点代表一个主要影响因素,形成相应的度量指标。另外,一个节点也是一个决策节点,它能表明疫苗风险发生的概率。

以OpenLaw官网上公布的疫苗案件为样本,分析涉及疫苗运输过程的质量风险来源,统计样本风险源数据,并尝试将蒙特卡罗法(又称统计实验法)运用于疫苗质量安全测度问题上。先利用收集到的数据训练概率统计模型,后利用蒙特卡罗法随机进行200组实验数据的测度。结合BD网络,通过在matlab中使用爬山算法,得到疫苗安全风险的贝叶斯网络结构(如图2所示)。图2中共有16个节点,包括表示影响指标的15个观测节点和表明风险是否发生(“risk”)的决策节点。各个观测节点的状态为{5,4,3,2,1}五个状态,决策节点状态为T和F,分别代表风险发生和未发生。假定决策节点“risk”取T的概率为100%,观测其他各个节点的概率变化,明确问题疫苗安全的责任主体,此时贝叶斯网络结构如图3所示。

由图3可知,A5(实验室的人员素质)、B1(审评专家意见客观性)、C5(质量检测过程)以及D1(疫苗的储存环境)状态为“5”的概率较大。表示当疫苗安全风险发生时,问题出在疫苗的研发环节、生产环节及流通环节的可能性比较大,因此,需要重点关注这几个环节的影响因素。根据贝叶斯网络各个节点的参数学习,疫苗质量风险可以度量,其仿真结果如表4所示。

图2 贝叶斯网络结构先验概率图

图3 风险变化后的贝叶斯网络结构图

表4 各节点风险概率表

五、结语

通过问卷和查阅相关文献,确立了疫苗质量安全的影响因素,在此基础上筛选出主要的影响因子,构建疫苗质量安全度量评估指标体系,建立贝叶斯网络模型。为了验证模型的有效性和稳定性,采用随机模拟,构建了贝叶斯网络的拓扑结构,通过参数学习,得到了疫苗全产业链的风险概率。仿真分析表明,贝叶斯网络模型是度量疫苗质量风险可行而有效的方法。从分析结果来看,在疫苗的研发A、审批B、生产C、流通D以及不良反应监测E这五个环节中,A5(实验室的人员素质)、B1(审评专家意见客观性)、C5(质量检测过程)和D1(疫苗的储存环境)发生疫苗质量安全风险的可能性较大,分别为26.9%、23.8%、19.6%和18.5%。

依据上述分析,对疫苗质量安全风险防控提出以下建议:一是增强实验室人员专业性并进行规范化管理。疫苗研发对规范性操作的要求很高,这就意味着需要具有专业知识的操作人员来进行操作,为此可以在人员招聘、任用、岗位调整和技能培训等环节上进行动态调整,明确“术业有专攻”的工作原则,在事关人民生命健康安全的行业里,要做到专人专用、善用其长、与时俱进,强调岗位责任感、使命感和荣辱感,同时也要完善实验室管理规范,创造一个良好的实验室工作环境,确保疫苗在研发过程中经临床试验验证疫苗安全,保证其研发环节不出差错,从根源上解决疫苗安全问题。二是要进一步明确审批环节的审评责任制并建立客观可量化的审评指标。在疫苗审批过程中也要明确责任主体,加大对违法违规行为的审查力度,对违法违规的审评行为进行相应的惩戒。三是在生产环节规范疫苗的质量检测行为,规范理化性质检测、微生物检测、免疫学检测和疫苗源标准化,对疫苗生产的过程中的原液、半成品、各种成品和中间商品都要规范其检验规范流程,保留检验结果,可对生产过程中的原液、半成品、各种成品和中间商品进行留样。四是严格遵守我国有关药品、生物制品、冷链运输等方面的法律法规,严控药品储存环境并执行疫苗全程追溯。不同类型的疫苗保存条件是不一样的,必须要按照规定进行分类保管、分批号保管,对疫苗储存环境的温度、摆放位置严管严控,并且做好防断电措置以防止断电带来的不必要损失,确保安全流通,包括把控疫苗在运输和接种过程中的质量和安全,对疫苗运输冷链车进行实时数据采集,追求高精度冷链温度反馈,保证冷链疫苗的质量安全,保证疫苗保管的温度记录、设备记录、时间记录等真实完整,并做好相关资料的保存。五是参照国外被动监测系统,对上市后的疫苗进行被动监测,建立疫苗安全性评价的监测系统,收集疫苗接种后发生不良反应的相关信息,监测疫苗存在的潜在安全问题,建立系统数据库,将疫苗进行统一编号,通过统一的编码,使疫苗在流通过程中更容易被监测,在研发、审批、生产、流通过程中,对疫苗的生产厂家、批次、经销商进行快速识别,以此来提高被动监测的效率。根据我国实际情况,及时更新完善不良事件列表,为主动监测系统的建立提供更好的基础。因此,政府或者相关机构在对疫苗流通过程进行监管时,要保证存储疫苗环境中的温度监测器能够及时将温度情况反映到监测中心。提前做好温度控制,做好应急方案,计划好疫苗的流通线路,保证整个流通环节的可控和精简。

基于对近年频发的疫苗安全问题的分析,为实现疫苗安全风险监测与预警,必须全面把控疫苗整个生命周期内的质量,从根源上解决疫苗质量问题,建立疫苗预防机制;从源头全程把控疫苗质量,以被动监测为核心,完善主动监测系统为目标来健全保障疫苗安全的预警机制;对于意外的不良反应,应建立完善的应急处理机制。让疫苗安全保障系统能做到提前预防、及时预警、有效处置,以此来确保我国疫苗安全,提高人民的生活质量。

猜你喜欢
贝叶斯概率疫苗
概率统计中的决策问题
概率统计解答题易错点透视
概率与统计(1)
概率与统计(2)
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
HPV疫苗,打不打,怎么打
抢购疫苗暴露全球不平等
我是疫苗,认识一下呗!
租赁房地产的多主体贝叶斯博弈研究