民航气象数据库系统气象资料不归档处理方法的分析与探讨

2020-04-16 06:30阿不力米提阿布都克力木
中国科技纵横 2020年19期
关键词:数据库系统日志备份

阿不力米提·阿布都克力木

(中国民用航空新疆空中交通管理局空管中心气象中心,新疆乌鲁木齐 830016)

0.引言

民航气象数据库系统是一套用于实现飞行气象情报及气象资料的交换、分析、处理、存储等功能的信息系统,包括通信子系统、数据库子系统、信息处理子系统及相关网络设施,是目前各空管系统气象服务机构用于开展气象业务工作的重要装备之一。

其中,民航气象数据库子系统担负着管理和存储气象数据信息的任务, 从而实现对气象资料的有效存储和快速检索,在民用航空气象服务保障中发挥了重要作用。随着数据库子系统对气象数据的处理及存储要求不断增加,在业务运行及气象设备保障人员的维护监控过程中,民航气象数据库系统发生了一起气象资料不备份故障,如不及时发现和处理,将影响业务的正常运行。

本文详细介绍了一起气象数据不备份故障事例,并通过实际案例分析,结合笔者实践经验及对故障长期跟踪,给出了故障问题的处理方法,为设备保障人员今后的设备维护和故障排查提供思路和参考。

1.气象资料不归档对业务运行的主要影响

如果数据库不进行气象资料不归档,短期内也许不会对业务造成较大的影响,但是如果长时间不归档会对业务造成巨大的影响,主要包含:

(1)应用库表空间过大导致数据无法入库,目前应用库是保存3d,默认是两个表空间文件,当数据增加到最大可扩展存储容量后,数据将无法入库。

(2)长时间资料不作归档清除,会造成数据表中数据大量增加,影响数据库运行和查询效率。

(3)由于数据库图形文件没有月份标识,当应用库数据达到一个月以上时就会有两个文件名一模一样的文件,当前端应用查询不严谨时有可能飞行文件或者图形查询会查出来上一个月的数据。

2.故障现象

2017 年7 月26 日,值班期间检查发现数据库中气象资料没有正常归档,没有将应用库中过期的资料转移到历史库中,也没有将历史库中过期的资料删除。

3.故障事例分析及排查处理过程

(1)数 据 库dmsserver 进 程 每 天UTC18:10(北京时间凌晨2:10)调用expdp 命令,在/home/mhdbs/data/backup/20170726 目录下形成dmp 文件,并打包成33 个zip 文件,一般40min 执行完毕。

(2)出现异常后:/home/mhdbs/data/backup/2017 0726/形成表对应的空目录。如图1 所示。

图1 不正常归档留底(部分截图)

图2 日志信息

(3)故障的定位及精准定位,离不开日志分析,日志通常分为三个层级,第一层级为进程类日志,第二层级为服务类日志,第三类层级为平台类日志,分析日志,一般应从第一层级逐级展开,如优先查看进程日志,进程日志一般记录进程的活动,本列为dms 的日志,存放于/bin/log/dms/下;其次查看服务类日志,本列中服务类日志为oracle 数据库的相关日志,数据库日志文件记录了数据库的相关事务活动,包含警报、跟踪和重做3 类日志,通过show parameter dump_dest;命令可以显示日志路径;第三层级为平台日志,一般记录平台用户相关的一些日志,如守护进程、用户登录、定时任务等相关日志;应当从进程日志开始逐层分析,根据本列的故障描述,优先查看dms 相关日志和oracle 日志,查看相关日志文件及内容显示。如图2 所示。

(4)如图2 中的错误描述所示,报故时间段正在使用expdp 进行数据库导出操作,为进一步判断故障原因,在shell 下执行expdp 命令进行了手动排查,查看命令报错信息。如图3 所示。

图3 导出命令

(5)返回的错误提示信息。如图4 所示。

图4 错误信息

4.故障原因分析

结合日志文件及系统返回的错误提示信息,查阅相关文档资料分析得知,民航气象数据库在用expdp 进行备份导出时会在对应用户(userdbs)下自动创建一个表名类似SYS_EXPORT_*_N 的表,其中*代表方案如FULL、SCHEMA、TABLE 等,N 一般是数字,如01、02 等形式,如果导出过程异常,诸如此类的表会遗留下来,则会占用用户表空间,达到一定数量,会引起用户表空间不足,会造成恶性循环,使得expdp 数据泵job 异常终止,从而导致气象资料备份失败。

5.故障处理方法

(1)清理dba_datapump_jobs 表。

(2)查询生成清理DBA_DATAPUMP_JOBS 的SQL 语句,并复制生成的处理SQL 语句,对表DBA_DATAPUMP_JOBS 进行清理,查询结果总共99 条记录。

(3)清理后再次查询确认DBA_DATAPUMP_JOBS是否清理完全。

(4)清理后再运行备份命令,系统没有报错,资料备份确认正常。

6.结语

民航气象服务是保证航空安全的重要前提,确保民航气象数据库系统的数据稳定、安全、可靠是设备保障人员工作的重中之重。本文通过分析民航气象数据库系统中的异常现象,经采取对相应表的操作,数据库系统资料归档功能已恢复正常。在日常运行中,设备保障人员及时分析系统日志文件各种提示错误信息,有利于快速判断故障点,分析排查故障原因。通过此案例也告诉我们,设备出现故障之后,数据库系统日志文件中记录的任何信息都是不容错过的,通过查看日志可将系统运行风险降到最低,从而保证气象设备的正常运转,有效提高设备的运行质量。

猜你喜欢
数据库系统日志备份
一名老党员的工作日志
扶贫日志
创建vSphere 备份任务
数据库系统shell脚本应用
游学日志
微细铣削工艺数据库系统设计与开发
实时数据库系统数据安全采集方案
旧瓶装新酒天宫二号从备份变实验室
核反应堆材料数据库系统及其应用
一种基于粗集和SVM的Web日志挖掘模型