Q A R数据的飞行阶段划分与列式压缩存储设计*

2016-12-08 11:06梁家华张溦溦张志远
甘肃科技纵横 2016年11期
关键词:列式编码阶段

梁家华,张溦溦,张志远

(中国民航大学计算机科学与技术学院,天津300300)

Q A R数据的飞行阶段划分与列式压缩存储设计*

梁家华,张溦溦,张志远

(中国民航大学计算机科学与技术学院,天津300300)

QAR全称Quick access recorder,是一种标准的机载飞行数据记录设备,QAR数据是时序数据,采样频率高,数据量巨大。通过对QAR数据的研究,我们可发现其中相当多列的数据存在冗余或是遵循一定的规律。利用Visual Studio开发环境结合SQLServer数据库,将QAR数据划分为滑行起飞、爬升、巡航、下降、进近着陆等五个阶段,进一步针对不同阶段中不同特征的数据列设计不同的压缩方法,用列式压缩存储的方法去除QAR列数据中的冗余,对QAR数据进行更加有效地管理。

QAR;飞行阶段;列式压缩

0 引言

快速存取记录器QAR中记载了极其丰富的飞行数据,具有不可循环记录、记录数据比黑匣子(FDR)多、不带保护装置、便于存取等特点,被广泛应用于机务维修、飞行检查、飞行品质监控等方面[1]。充分利用与挖掘QAR数据的功能,将对飞行品质、安全系数、飞行效益等多方面进行改善,对航空公司乃至民航事业的发展将产生极大的推动作用。但由于缺乏专业化的数据分析工具和有效的数据监控,大量数据未能被充分利用,造成了资源的极大浪费。且由于QAR数据采样频率较高,大量的信息源源不断地产生,不可避免地产生数据冗余。本论述通过对QAR数据进行飞行阶段划分,并针对划分后的数据列的特点设计不同的压缩方式,对这一庞大的数据进行更加有效地管理,具有较大的研究意义。

1 QAR数据的飞行阶段划分

1.1航班基本信息提取

QAR数据量大而且结构复杂,本论述针对QAR数据进行研究,将其与单纯的数据区分开来就必然不能忽略对航班信息的提取以及所分析数据的意义。QAR数据源为CSV格式的数据文件,默认以Excel电子表格的形式打开,QAR数据头一般的格式为:第1行为译码信息(包括飞机注册号),第2行为航班信息(包括航班号、始发机场、目的机场、出发时间以及到达时间等信息),第3行为数据参数名详细解释,第4行为数据参数的简称,第5行为数据的单位,第6行之后为具体的QAR数据[2]。文件示例见图1所示。

图1 QAR数据CSV文件示例

提取航班信息,首先在数据库中创建一个航班基本信息表,表的结构设计见表1所示。信息的提取需要系统能够灵活地读取excel文件的单元格中的数据,在项目中添加对Interop.Excel.dll、Interop.Office.dll以及Interop.VBIDE.dll的引用[3],使用封装在自定义类中的getvalue(int row,int col)方法获取指定单元格中的值,实现语句为worksheet.get_Range(worksheet.Cells[row,col],worksheet.Cells[row,col]);转换为字符串格式之后用split函数在空格处进行拆分,在返回的数组中筛选出所需要的数据存储在数据库中。

表1 航班信息表结构

1.2飞行阶段划分

飞机要完成一次飞行任务要经过滑行和起飞、爬升、巡航、下降、进近和着陆几个阶段。不同的机型具有不同的划分标准,结合实际操作的可行性,本论述将数据进行阶段划分采用的标准见表2所示。

表2 航班飞行阶段划分标准

QAR数据中所参考的参数为:地速(GROUND SPEED);无线电高度(RADIO HEIGHT);标准气压高度(STANDARD ALTITUDE)。

不同的机型具有不同的参数,甚至相同的机型参数列也不尽相同,1 000多列至2 000多列不等,而能够明确参数意义且与飞行品质监控密切相关的参数不超过70列,因此可将关键参数列筛选出来。数据库中插入数据一般按行操作,而筛选参数及数据需按列提取,因此暂时将其保存在excel文件中,在阶段划分完成后将excel文件导入数据库中后删除该文件。

每一个QAR数据文件上传后,系统即自动创建一个同名的excel文件,在每个excel文件中创建五个sheet表,分别命名为滑行起飞、爬升、巡航、下降、进近着陆。每个表中第1行提前插入要提取的参数列的名称。依据上述标准中的参数定位出各个阶段的起始与终止行。对应参数的对应区域的值复制到相应的excel表中。

2 QAR数据的列式压缩存储

选择阶段划分之后再进行压缩的原因为:对各个阶段来说,关键参数存在差异,特点也不尽相同;飞行关键阶段为滑行起飞阶段和进近着陆阶段,按需压缩减少了不必要的工作。

本论述将QAR数据依据飞行阶段划分标准划分为滑行起飞、爬升、巡航、下降、进近着陆等5个阶段之后,再选取某些特征较明显的列数据进行压缩。涉及到的压缩方法包括等值压缩、行程编码压缩、字典编码压缩、差量编码压缩等四种方法。本设计中所用数据以2013年1月13日OKA2812次长沙飞往天津的航班数据为例。

等值压缩即该列参数数据在飞行过程中没有发生变化,这类数据列只需存储一个数据值实现压缩。例如滑行起飞阶段的航向数据一直保持不变,选取Time列和SELTD HEADING(FCC)列(航向),压缩后在数据库中存储的信息为阶段起始时间、结束时间、参数值以及行数。此类数据列压缩前后对比见图2所示。

图2 等值压缩数据列压缩前后对比图

行程编码压缩[4]即该列参数数据在飞行过程中数值变化离散,且一段时间内数值保持不变,此类数据列只存储数据值与对应的变化区间。例如爬升阶段的数据列为抬头速度(ROTATION SPEED),在时间段9:26: 40至9:27:16内参数值为148,在时间段9:27:16至9: 55:04内参数值为0,符合行程编码压缩的要求。选取Time列和ROTATION SPEED列,压缩后存储的数据为阶段起始时间、结束时间、参数值以及行数。

字典编码压缩[5]即由较小的符号代替占用较大空间的值,可有效减小存储空间。例如下降阶段中的数据列主起落架状态LANDING GEAR NOSE SQUAT列、左起落架状态LANDING GEAR LEFT SQUAT列、右起落架状态LANDING GEAR RIGHT SQUAT列,起落架状态分为AIR和Ground,可采用字典编码压缩方式,1代表AIR,2代表Ground。而起落架状态在下降阶段中会保持在收起状态,即AIR状态,因此可将字典编码压缩与等值压缩方式结合。

差量编码即某列数据在某一固定值周围浮动,采用存储数值与该固定值的差值的方式实现压缩。巡航阶段的压缩的数据列为标准气压高度STANDARD ALTITUDE列,存储各数据点与最大巡航高度的差值,压缩后存储的信息为阶段起始时间、结束时间、该值与最大巡航高度的差量以及最大高度。

仅以上述压缩的数据列为例,将10列数据单独导出对比,压缩前大小为144 KB,压缩后大小为49 KB,可以预见,当后续对更多的数据列进行压缩后,会极大地节省存储空间。

3 结束语

QAR数据是航空公司较为重要的飞行数据,数据量庞大。本论述依据QAR数据的特点,参考QAR数据设项目审批计划、资金安排、工程进展、监督管理等详实完整的信息资料,形成共享模式,确保在第一时间准确掌握建设项目情况。同时,还应引入BIM建设项目管理系统,实现对项目的全过程动态跟踪监控,真正达到精准化、主动性管理控制的工作目标。

4.3建立联动机制,发挥整体监管效能

走进力嘉国际集团位于东莞的力嘉环保包装印刷产业园,浓郁的文化气息扑面而来,古朴的造纸技术与现代的创意设计融于一体,丝毫让人没有突兀之感,反而感觉文化传承之美妙。与香港力嘉国际集团董事总经理马馀雄的交流就在这里。

建立发改、建设、审计、财政、监察、评审等部门参加的政府投资建设项目工程造价管理联席会议制度,加强对建设项目审计工作的领导、指导和协调,及时研究解决工程审计中出现的重大疑难问题和意见分歧,形成各司其职、相互衔接、协调运转的联动工作机制,确保建设项目管理形成闭环,做到既不遗漏、也不重叠,发挥建设项目监督机制的整体效能。

[1]刘家义.论国家治理与国家审计[J].中国社会科学,2012(6).

[2]胡钊.经济转型背景下深化政府投资建设项目审计的思考[EB/OL].[2012-08-24].http://www.audit.gov.cn/n19925150/ n1992576/3076 318.html.

[3]黄升.浅谈政府投资建设项目工程造价审计[J].决策与信息旬刊,2010(6).

[4]王希亮,迟永镇,等.审计机关购买社会服务的探讨[A].审计署审计研究报告,2014(8).的具体意义,实现对QAR数据的飞行阶段划分,在此基础上选取数据特点较明显的列数据进行压缩,针对不同特点的数据列设计不同的压缩方式,有效地减少了数据的冗余,节省了存储空间,为QAR数据进一步的管理与查询优化奠定了基础。

[1]耿宏,李萍萍,等.基于压缩感知的QAR数据重构[J].计算机测量与控制,2013,21(5):1351-1353.

[2]周百政.QAR数据处理系统的设计与实现[D].天津:中国民航大学,2009.

[3]李志学.基于C#.NET的Excel表格数据访问与创建[J].电脑编程技巧与维护,2011,22(051):75-77.

[5]龙礴涛.列存储数据仓库中压缩技术的研究与实现[D].上海:东华大学,2013.

TP311

A

DOI10.3969/j.issn.1672-6375.2016.11.009

2016-9-18

大学生创新创业训练项目(IECAUC201510059048)。

梁家华(1995-),男,汉族,广西梧州人,大学本科在读,主要研究方向:民航信息系统。

猜你喜欢
列式编码阶段
关于基础教育阶段实验教学的几点看法
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
在学前教育阶段,提前抢跑,只能跑得快一时,却跑不快一生。
Genome and healthcare
准确审题正确列式精确验证
每筐多装多少
大热的O2O三个阶段,你在哪?
两岸婚恋迈入全新阶段