基于航班数据可视化系统的设计与实现

2019-07-01 02:35闻雅高志远王吉富蔡雨轩高晟珍李瑞改
智能计算机与应用 2019年3期
关键词:航线

闻雅 高志远 王吉富 蔡雨轩 高晟珍 李瑞改

摘 要:随着社会的快捷发展,飞机成为目前人们生活中重要的出行方式,改变了人们的生活,便利出行,但是随着高效率时代的到来,时间以及安全成为了人群衡量交通的重要因素。飞机晚点的现象成为了一个影响大家出行,制约行业发展的突出现象。此航班数据可视化系统想法来源于第七届中国软件杯大学生软件设计大赛,同时作为东北林业大学大学生创新创业训练计划项目,本系统能够查询不同地区的航班航线,以及对应航班的晚点率,开发这个系统对民航行业有个更准确清晰的目标,能够更好地针对一些晚点率较高的航班并采取相应的行动对其加以控制,同时,可以给出行群众提供参考。

关键词: 航线;晚点率;航班数据可视化系统

文章编号: 2095-2163(2019)03-0228-04 中图分类号: TP311.52 文献标志码: A

0 引 言

随着中国经济的快速发展,越来越多的人选择乘坐飞机出行,航班延误问题是目前制约国内民航服务质量的焦点问题,航班正点率已成为民航业内的重中之重,同时也关系着民航业的整体运行品质[1]。为了促进民航业的高效良性发展,进而提升用户出行体验,调研后可知将亟需对航班进行合理监控,以及开展数据对比,尽可能地降低航班取消、延误、备降等方面的概率。因此,航班数据可视化系统的研发就是至关重要的解决方式。该系统开发基本满足了对于国内航班的监控需求,尤其利于航空公司对航班进行管理控制,而对于一些晚点概率较高的航班将予以着重考察,并采取合适的整改措施,如此一来,不仅提升航空公司的运行效率,而且也更进一步地改善和优化了用户体验。

1 系统开发平台简介

PyCharm是一种Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制等。此外,该IDE提供了一些高级功能,可用于支持Django框架下的专业Web开发。PyCharm是由JetBrains打造的一款Python IDE,VS2010的重构插件Resharper就是出自JetBrains的手笔。同时支持Google App Engine,PyCharm支持IronPython。迄至目前,这些功能已经内嵌于先进代码分析程序中,就使得PyCharm成为Python专业开发人员和初级入门人员使用的有力工具。更重要的是,Pycharm还配备了一个带编码补全,代码片段,支持代码折叠和分割窗口的智能、可配置的编辑器,从而可以更快、更轻松地完成编码工作。在PyCharm的图形处理中,利用pyecharts显示地图图形,为了维持项目的轻量化运行,PyCharm不再自带pyecharts。如果需要用到世界地图,则直接安装echarts-countries-pypkg包,用到省级地图则直接安装echarts-china-provinces-pypkg包。有了这2个包,就可获得完全显示地图效果。

2 系统算法设计

2.1 基本原理

本系统采用了基于朴素贝叶斯分类器对航班晚点进行预测,其理论基础就是貝叶斯定理。在概率论与统计学中,贝叶斯定理,或称贝叶斯法则、贝叶斯规则,描述了一个事件的可能性,这个可能性是基于一些与此事件相关的预备知识。目前,朴素贝叶斯算法已被广泛应用于文本分类领域。该算法基于条件独立性假设,研究时假定给定目标对象的各个属性之间相互独立,互不影响,通过计算目标对象的先验概率,利用贝叶斯定理计算出其后验概率、即该对象属于某类的概率,然后比较后验概率的大小进行决策分类[2]。这个假设的数学公式可表达为:

其中,P(X)表示X出现的概率,属先验概率;P(C)表示不考虑相关因素时,随机事件出现C情况的概率,属先验概率;P(C|X)表示在X的条件下,随机事件出现C情况的概率,属后验概率;P(X|C)表示在已知事件出现C情况的条件下,条件X出现的概率,属后验概率。

因此,属性条件独立性假设实际上是忽略掉了某些属性之间可能存在的关联,假设属性的取值可能性都是独立的,这就将P(x1, x2,x3,...,xn|c)的计算简化为∏di=1P(xi|c)=P(x1|c)*P(x2|c)*P(x3|c)*…*P(xn|c)。那么按照这种方式计算,数据集无法覆盖所有可能的属性组合的样本的问题也得以基本解决,此模型下不需要大量样本,只需要保证每个属性的各个取值都能取到样本即可。

2.2 数据来源

该系统以及模型所需数据来源于https://zh.flightaware.com网站以及国外网站https://rp5.ru/中国天气_,通过查询航班基础信息,包括日期、出发时间、出发地点、到达时间、到达地点、飞机型号、晚点状况等,以及查询各个城市机场飞机起飞时的天气状况,包括气象站水平大气压、总云量、机场附近特殊天气、水平能见度等多种因素,最终对数据进行筛选整合,用建立的朴素贝叶斯模型预测各条航线的晚点率,显示各类航班的基础信息以及航班起飞时的天气状况。航班延误与人为因素[3],可能与管理不当,工作人员自身疏忽[4]都有一定关系,由于数据搜集困难,该模型不考虑此因素。

2.3 实验结果分析

该模型的实验环境为Oracle Linux 7.4以及Python 3,硬件环境是基于x64的处理器,处理器为Intel CoreTM i7-5500U CPU @ 2.40 GHz 2.39 GHz,内存为8.00 GB,64位操作系统的Windows10企业版。实验运行步骤可描述为:

新建python项目对搜集的数据进行划分,对划分的训练集以及测试集建立朴素贝叶斯模型。再对测试集进行预测,同时绘制ROC曲线,计算概率阈值。使用阈值重新预测飞机晚点概率。在这个模型中,考虑了诸多因素,例如出发到达时间、机型、航线、压强以及飞机起飞时相近时间点的天气因素等。由此得到的该航线晚点的混淆矩阵见表1,预测晚点概率阈值如图1所示。

猜你喜欢
航线
越南国家航空公司新开通3条航线
开通4条直飞国际航线
中国航空公司新开义乌直飞符拉迪沃斯托克航线
重庆直飞巴黎、科伦坡航线正式开通
贵阳至北美洲际航线开通
临时航线评价指标研究与分析
东西航线上的“四大战役”
开通新航线 老板乐开怀