基于R语言的碱性耐火砖的烧成缺陷分析和控制

2022-03-07 07:03王杰曾徐琳琳胡建辉
耐火材料 2022年1期
关键词:麻面决策树合格率

王杰曾 徐琳琳 刘 昭 胡建辉 袁 林

1)中国建筑材料科学研究总院有限公司 北京 100024

2)瑞泰科技股份有限公司 北京 100024

3)河南瑞泰耐火材料科技有限公司 河南郑州 451162

中国制造企业实现升级换代需要打造强势品牌,打造强势品牌需要提高产品质量,提高产品质量就需要运用数据挖掘分析生产数据,发现影响质量的缺陷,掌握这些缺陷发生的规律,进而根据这些规律进行有的放矢的治理。研究背景已在文献[1]中介绍,在本文中,用软件R及WPS表格,研究某碱性耐火材料企业的烧成质量统计数据。

1 数据准备

数据为2014年某月的质量统计报告。报告由质量检查员汇总每日的检测结果,统计员再汇总各检查员每日上报的结果产生。报告以WPS数据表(64行,16列)提交,其中,64行分别是1行表头和63行不同规格又16个品种的统计值,16个品种分别是:A型镁铝、B型镁铝、C型镁铝、电半-16、电熔-20、镁铝铬、镁铁、普铬-16、镁铁铝、新型镁铁、直-12、直-14、直-16、直-18、直-22、直-9A。16列表示不同属性,分别是:行业、品种、型号、出窑质量、生产线、裂纹、装角、熔洞、槽裂、公差、粘连、压纹、扭曲、倒跺、麻面、合格率。其中,槽裂指带有凹槽的在凹槽处发生的裂纹,装角是指从干燥器出来后工人从干燥车装到窑车的过程中造成的掉角破损,其他需要说明的属性见文献[1]。

本数据表没有空列、空行,也没有需要合并的属性,但有很多缺失值。因此,用0替代缺失值。否则,软件以默认方式处理可能造成不良后果。还有,剔除了一合格率仅为68.3%的记录。

2 数据探索

首先,用R软件的rattle包[2]导入数据可见:5个输入变量中,行业、品种、型号、生产线为离散型变量,出窑质量为数值型变量;10个中间变量中,裂纹、装角、熔洞、槽裂、公差、粘连、压纹、扭曲、倒跺、麻面为数值型变量;剩下1个合格率为输出变量。用Apriori算法,设定参数支持度大于或等于0.20、置信度大于或等于0.70,所得规则显示了生产组织的特点,见表1。表1中,如置信度等于1即100%正确的规则。其中,规则[1]为有色行业用砖全部交一线生产;规则[3]为二线只生产水泥行业用砖;规则[5]直-9A为水泥行业用砖;规则[6]至规则[9]镁铁铝为水泥行业用砖且由二线生产。置信度为0.72,即72%正确的规则,有规则[2]和[4]:一线生产有色行业用砖,水泥用砖交二线生产,即大约72%的水泥行业用耐火砖的型号交二线,剩余由一线生产。

表1 碱性耐火材料的生产组织特点

其次,用WPS表格的数据透视表探求合格率与产量的关系,以及各类缺陷出现的总次数,其结果见图1。由图1(a)可知,对合格率影响最大的就是产量很大但合格率(95.6%)偏低的镁铁铝(镁铁铝尖晶石砖),其次就是产量不高且合格率(75.0%)很低的直(直接结合镁铬砖)-22砖。由图1(b)可知,裂纹是主要缺陷。因数量很少,可忽略扭曲、麻面和倒垛。

图1 各种耐火砖的合格率与产量以及各种缺陷出现的总次数

将检测数据导入R软件,选10个中间变量为输入变量,选合格率为输出变量,选皮尔逊Pearson相关系数分层,可得各输入变量的相关树,见图2。在图2(a)中,X坐标值表示树高度(取值[0,2]),高度越低越相关。因此,属性可分4类:麻面,倒垛,以裂纹为代表的熔洞、装角、公差、压纹、粘连、槽裂,扭曲。由图1(b)可知,以裂纹代表第3类是主要的。因而,可以把第3类作一族;余下1、2、4类作另一族。由图2(b)可知,K均值聚类分析结果[3]也证实可将缺陷分两族。其中,第1族中心点的裂纹、装角、熔洞、槽裂、公差、粘连、压纹、扭曲的数值较高;第2族中心点的倒垛和麻面的数值很高。主成分分析结果为:第1族,裂纹、装角、熔洞、公差的绝对值很高;第2族,扭曲、倒跺、麻面的数值很高。总之,缺陷分为两族:一是以裂纹为代表的裂纹、装角、熔洞、槽裂、公差、压纹、槽裂、粘连等;二是麻面、倒垛和扭曲。因第二族较少,第一族可代表全部。

图2 耐火砖烧成缺陷的属性聚类和样本K均值聚类分析结果

3 数据建模

模型用于表达输入变量(原因变量)和输出变量(结果变量)之间的数学关系或逻辑关系。本文中,有1个结果变量:合格率;5个原因变量:行业、品种、型号、出窑质量、生产线;10个中间变量:裂纹、装角、熔洞、槽裂、公差、粘连、压纹、扭曲、倒跺、麻面。首先,将所有关系分为三类,即原因变量与结果变量、中间变量与结果变量、中间变量与原因变量。其次,逐一建立所述模型并解释输入变量与输出变量的关系。然后,根据模型预测的正确率以及能否转换成为专业技术人员易于理解的知识从中选择优胜者。最后,结果变量为强度性质的变量,中间变量为容量性质,将中间变量除以产量(出干燥器质量),转变为强度性质的中间变量。如将裂纹转为裂纹产品/t,将麻面转为麻面产品/t。

3.1 原因变量与结果变量的关系

3.1.1 型号对合格率的影响

首先,将5个原因变量和1个结果变量导入R软件,运用决策树方法[4]分析,软件三级分解后将最终型号分为四类:第2类的平均合格率为89%;第12类平均合格率为95%;第13类平均合格率为97%;第7类平均合格率为99%。其次,用WPS表格制作以型号为“行”、合格率平均值为“值”的数据透视表。最后,按合格率高低排序,发现合格率为低(75.0%~94.5%)的13个型号,除3个型号(或没有注册的特殊型号,或技术不成熟如镁铁铝尖晶石砖、镁铝砖、镁铝铬砖等产品),其余正常。

3.1.2 品种对合格率的影响

将数据导入R软件,选择行业、品种和生产线为输入变量,合格率为输出变量,选择决策树模型,设置Max Depth(决策树最大深)为5,得到品种对合格率影响的决策树,见图3。可知,在自动分类的43组样品中,品种属于B型镁铝砖、镁铝铬、直接结合镁铬砖-18、直接结合镁铬砖-22的9组样品的合格率最低(平均93%);属于A型镁铝、镁铁铝、普铬-16和直-16的18组样品的合格率居中(平均95%)。其他剩余耐火材料品种的合格率最高(平均97%)。

图3 品种对合格率影响的决策树

如果以品种为“行”、以合格率的平均值为“值”制作数据透视表,先按合格率排序,再拆分为镁铬系列和其他系列排列,得到图4。由图4(a)看出,镁铬砖的缺陷率取决于:1)是否直接加入铬铁矿;2)铬铁矿加入量的多少(以Cr2O3含量表示)。由4(b)看出,无铬材料在生产原料时因较充分合成了尖晶石,平均合格率要高些。

图4 镁铬系和无铬材料的品种与产品合格率的关系

3.1.3 产量对合格率的影响

如选择行业、产量和生产线为原因变量,选择合格率为结果变量,以决策树为模型,设置Max Depth为5,可以得到品种对合格率影响的决策树,见图5。

图5 产量对合格率影响的决策树

由图5可知,在自动分类的43组样品中,18组产量<11 t数据的平均合格率最高,98%;16组产量大于或等于23 t数据的平均合格率居中,95%;余下9组产量居中的,即产量在11~23 t数据的平均合格率最低,92%。

由于二次尖晶石反应是影响合格率的主要因素,反应程度高的品种需要慢升温、长保温;反应程度低的品种需要快升温、短保温。这样,混烧反应程度不同的碱性砖就可能出现问题。因此,如果产量<11 t,常与相近品种搭烧而且在相近品种生产周期中段加入,因而合格率最高(98%);如产量>23 t,因自成一体生产时除前段和后段外,都按理想的方式煅烧,因而合格率居中(95%);如产量中等,既不能够搭烧,又不能自成一体,合格率也就只有92%。

3.2 中间变量与结果变量的关系

首先,将数据导入R软件,以10个中间变量为输入,以合格率为输出,采用线性模型求出:有2个非常显著的因子,裂纹产品/t和粘连产品/t;3个中等显著的因子,倒垛产品/t、压纹产品/t、扭曲产品/t;有2个轻度显著的因子,装角产品/t和槽裂产品/t。其次,以裂纹产品/t和粘连产品/t为输入,以合格率为输出,采用决策树模型求出缺陷类别对砖坯合格率的影响,见图6。可看出,如果裂纹产品≥2.1 t,平均合格率为92%;如果裂纹产品为0.66~2.1 t,合格率为97%;如果裂纹产品≤0.66 t,合格率为99%。经过模型评估证实决策树的置信度已达97%,再采用机制隐晦的随机森林和人工神经网络模型建立可提高置信度1%~2%的新模型也就意义不大。

图6 缺陷类别对砖坯合格率的影响

3.3 原因变量与中间变量的关系

以生产线、品种2个输入变量为“行”,2个输出变量(裂纹产品/t、粘连产品/t)为“值”制作数据透视表,再选定某生产线后按麻面产品/t数值大小排序,求得生产装备和品种对碱性砖缺陷的影响,见图7。

图7 品种和生产装备对碱性砖缺陷的影响

如文献[1],二线使用年产25 000 t燃气高温隧道窑烧砖,一线使用年产15 000 t燃气高温隧道窑烧砖;10个中间变量(裂纹产品/t、装角产品/t、熔洞产品/t、槽裂产品/t、公差产品/t、粘连产品/t、压纹产品/t、扭曲产品/t、倒跺产品/t、麻面产品/t)中,裂纹产品/t和粘连产品/t是最显著的。由图7可知,左端前面5个B型镁铝、镁铁、新型镁铁、镁铁铝、直-9A砖是二线用每年2.5万t的新窑煅烧的,且按裂纹大小排序;后面的都用一线用每年1.5万t老窑煅烧,也按裂纹产品/t大小排列。由图7可得:1)直接结合镁铬砖-22(阿拉伯数字为Cr2O3含量)不仅单位产品的裂纹发生率高,而且单位产品的粘连发生率高。这说明生产直-22砖时,不仅烧成温度高而且烧成时间短且升温过快,在高温下迅速发生二次尖晶石反应,因而同时裂纹多而且粘连也重;2)B型镁铝砖、A型镁铝等无铬碱性砖的烧成工艺有待完善;3)二线烧成的合格率低于一线烧成的。如B型镁铝二线烧成的裂纹产品为5.99 t,一线的为2.04 t;直-9A砖二线的裂纹产品为1.64 t,一线的为0.05 t。这说明,还有待进一步掌握新设备的特性。

4 结语

(1)碱性耐火砖的烧成缺陷主要是以裂纹为代表的第一类(装角、熔洞、槽裂、公差、压纹、槽裂、粘连等)。

(2)对合格率影响最大的首先是产量很大但合格率偏低(95.6%)的镁铁铝尖晶石砖,其次是产量低且合格率也很低(75.0%)的直-22砖。提高合格率主要应减少裂纹和粘连这两种主要缺陷的发生率。

(3)碱性耐火材料烧成技术的主要难点是解决二次尖晶石化带来的松散效应;主要任务是根据不同的品种,使用不同的原料,制定不同的烧成曲线。

(4)碱性耐火材料生产的主要难点是解决用设备有限的能力一方面满足各品种的特殊工艺需求,另一方面又要满足完成繁重生产任务和节能减排需求的矛盾。如果矛盾解决不好,就会产生损失。例如,直-22镁铬砖的裂纹发生率和粘连发生率都显著增多。

(5)碱性耐火材料生产企业具有规模效益。例如,用高、中、低不同煅烧温度的3台隧道窑生产要比2台隧道窑好。条件不成熟时,也可以另外建设梭式窑来协调生产。

(6)根据上述结论对碱性耐火材料的生产进行了针对性的治理,两年后综合合格率从93%提高到96%,取得了很好效果。

猜你喜欢
麻面决策树合格率
基于决策树和神经网络的高血压病危险因素研究
2020年畜禽产品兽药残留抽检样品合格率99.49%
2020年农产品质量安全例行监测合格率达97.8%
决策树和随机森林方法在管理决策中的应用
提高铝电解电容器合格率的多元化工艺技术
客运专线桥梁道床板烂根、麻面等质量通病的预防
决策树多元分类模型预测森林植被覆盖
浅谈道路工程中路基路面运用的病害治理对策
基于决策树的出租车乘客出行目的识别
我国生鲜乳连续7年三聚氰胺抽检合格率100%