超短波监测数据可视化分析

2019-07-20 08:21范振雄冀维林
数字通信世界 2019年6期
关键词:超短波台站监测数据

范振雄,李 蓉,冀维林

(国家无线电监测中心,北京 100037)

在无线电监测工作中,不可见的频谱资源通常以频谱图、瀑布图等形式展示,频谱的使用数据或信道占用度表示某特定频率或频带在指定的测量时间间隔内发射信号的时间[1]。抽象的监测数据能变为直观的、以图形图像表示的、随时间和空间变化的物理现象呈现给观测者,用以进一步的分析和处理[2]。

多年来,我国在超短波监测方面已累积了大量的历史数据,但目前超短波监测工作依然面临一些现实问题。例如业务系统与实践监测工作结合不够紧密、监测数据分析处理深度不够等。究其原因,主要是受限于现有超短波监测系统的数据分析功能单一、软件内置的IQ数据分析功能多样性不足,已难以满足监测工作中对数据挖掘的多样化需求。

针对当前社会有效的、可伸缩的和灵活的数据分析迫切需要,数据挖掘技术应运而生,尤其是可视化技术取得了长远的发展,目前,越来越多的、基于R语言、Scala、Python等编程语言的可视化技术,已被用于各种海量数据挖掘场景。可视化技术的飞速发展,使得频谱管理人员利用开发工具定制可视化应用,用于超短波监测数据挖掘成为可能。本文梳理了可视化技术的基础知识,设计了一种超短波监测数据挖掘可视化模型,并基于Excel、Python等可视化开发工具,结合实际案例对超短波监测数据挖掘中的可视化应用进行简要分析。

1 超短波监测数据可视化模型设计

如图1所示,监测数据挖掘通常将数据分析和数据可视化组合,数据分析包含数据接入、数据预处理、分析算法等数据功能;数据可视化包括可视化算法和数据展示(可借助R语言、Python等动态开发工具来实现)[3]。数据可视化是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。

图1 监测数据挖掘流程

从应用角度来说,数据可视化的根本目的是直观地展现数据,为此可建立如图2所示的超短波监测数据挖掘可视化嵌套模型。

图2 超短波监测数据挖掘可视化嵌套模型

该模型详细地列出了可视化系统设计一般的方法与步骤,并为这些步骤提供评估体系执导设计的优化。结合无线电监测工作的具体实例,可将可视化设计与评估的嵌套模型从外到内分为四层:

(1)需求提炼:描述待解决的实际问题,以及需要何种监测数据。

(2)抽象设计:将实际问题映射为抽象的数据类型及对其的操作。

(3)编码交互:通过代码实现底层监测数据与分析者之间的交互通道。

(4)算法实现:基于监测数据挖掘需求,利用可用的数据分析工具进行具体的算法实现。

通过可视化技术定制所需的监测数据挖掘模型,有针对性的输出超短波监测数据挖掘结果。

2 超短波监测数据挖掘可视化应用

可视化应用的目的是以最精确的方式来展示数据。Extreme Presentation创始人Dr. Andrew Abela认为每一种图表类型都有最适合自己的业务场景[4]。数据之间通常包含下述5种关系:构成、比较、趋势、分布及联系,如图3所示。

图表是数据的直观表现,使枯燥的数据更直观化和形象化,通过图表可以非常迅速地对数据产生总体上的认识[5]。在超短波数据挖掘的实际应用中,各数据关系之间的用途和应用如表1所示:

图3 数据关系模型

表1 各数据关系之间的用途和应用

当总的数据量较少时,可以选择灵活的Excel进行绘图;而当需要分析的频点较多时,可利用Python等语言进行二次开发,以满足实际工作中对数据挖掘的需要。在本文中,主要使用的Python 函数库有 NumPy,Pandas,Scipy,Matplotlib,Thinker等[6]。结合超短波监测工作,以下对监测数据挖掘可视化进行应用举例。

2.1 条形图

条形图可用于表述数据间关系,其排列先后顺序可根据监测技术人员的要求进行改变,适用于重点标注数据集中排名前Top N的元素。如图4所示,在台站核查工作中,在某市不同区域(A区-I区)的某类型台站数量分布情况。

图4 某类型台站区域数量分布图

2.2 柱形图

柱状图描述的是分类数据,其用高度反映数据差异,用来展示有多少项目(频率)会落入一个具有一定特征的数据段中。同时,柱形图还可以用来表示含有较少数据值的趋势变化关系。从分析图形分类来看,有单指标柱形图、多指标柱形图(又称分组柱形图)以及堆叠柱形图三种类型。本文主要举例单指标柱形图、多指标柱形图。

(1)单指标柱形图。典型的就是用于展示某广播电视在不同月份的占用度信息,可反映全年该广播电视信号的频段占用情况,如图5所示,基于某年3月-10月对某广播电视进行连续监测后,根据历史监测数据,利用Python相关库绘制的占用度情况图。

图5 某广播电视3-10月占用度情况(基于Python)

(2)多指标柱形图。根据《中华人民共和国无线电频率划分规定》[7],不同的无线电业务使用不同的频段。实际监测中,发现某超短波业务时常受到非法台站的干扰。如图6所示,为研究干扰规律,可以将整个频段划分为10个子频段进行比较,根据显示了各子频段内业务受干扰的数量多寡的对比。

图6 合法台站和干扰台站频段分布图

2.3 饼图

饼图可通过弧度大小来对比各种分类,表示每一部分所占全部的百分比情况。由于人的眼睛比较习惯于按顺时针方向进行观察,所以通常以12点方向为起点,顺时针让所有待显示值从大到小的顺序排列。从分析图形分类来看,有标准饼图、中空饼图和环形饼图三种类型。本文主要讨论标准饼图。

如图7所示,饼图可有效显示不同频段内台站数量占比。

图7 各子频段内业务受干扰的数量占比图

2.4 折线图

折线图可用来反映随时间变化而变化的关系,尤其是在趋势比单个数据点更重要的场合,显示数据在一个连续的时间间隔或者时间跨度上的变化。

(1)单线图。如图8,基于监测系统频段扫描采集的底层数据,可根据小时占用度以分析某频点的日发射规律,该频点从晚上21点开始有信号出现,在早上6点消失。

图8 某频点的发射规律(以小时占用度统计)

基于现有超短波监测系统,在对某频点进行连续监测后,可根据历史监测数据,利用Python相关库绘制的占用度情况图。图9展示了基于Python绘制的某频点的近3日(72小时)发射规律(以小时占用度统计)。

2.5 面积图

面积图是折线图的另一种表现形式,其使用颜色或者纹理布满折线图中折线与自变量坐标轴之间的区域,颜色的填充可以更好的突出趋势信息,该区域通常称为“面积”。一般来说,透明度可以很好的帮助使用者观察不同序列之间的重叠关系。如图10所示,某广播电视信号在某天的小时占用度测量值和长期观测得到的典型值对比,可见测量值和长期观测获得的典型值基本一致,未见明显偏差。

图9 某频点的近3日发射规律(基于Python)

图10 某广播电视信号典型值和测量值对比

此亦可用于在重点监测频段内发现异常信号。如图11所示,可见某天监测到的测量值和长期观测获得的典型值有明显偏差,正常信号未予发射的时间间隙被未知信号占用。

图11 某广播电视信号典型值和测量值对比

2.6 地图

地图是信息密度最大的数据可视化方式,基于算法和展示手段的不同,无线电监测数据挖掘中常用地图类型有散点地图和热力地图、轨迹图等。本文重点说明散点地图和热力地图。

(1)散点地图。散点地图用散点来表示所在位置的信息指标。其根本依据是通过监测技术人员提供的经纬度坐标。如图12所示,其部分展示了某类型台站的地理位置分布情况。

(2)热力图。热力地图以地图为底,结合特殊高亮的形式将数据数据描述于某一指定地理区域内,不同颜色反映不同区域密度的分布。从绿到红,颜色越深则此区域数量越多,密度越大。如图13为某类型台站的密度分布情况。

图12 某类型台站的地理位置分布

图13 某类型台站的密度分布

3 结束语

在数据可视化中,如何定义最合适的图形十分重要。一般来看,饼图、折线图、柱形图等基本图形可以满足大部分需要,这些图形也是可视化开发人员最常使用的;但对于超短波监测数据挖掘的具体业务场景下就需要更加特殊的可视化。

在本文所述超短波监测数据挖掘可视化模型的基础上,基于Excel、Python等可视化开发工具,结合实际案例对超短波监测数据挖掘中的可视化应用进行了阐述。监测技术人员仍应在此基础上进行进一步的设计开发,在更多维度上对监测数据进行挖掘,以更好地支撑频谱管理工作。

猜你喜欢
超短波台站监测数据
中国科学院野外台站档案工作回顾
超短波联合穴位按摩治疗Ramsay-Hunt综合征的临床研究
地震台站基础信息完善及应用分析
一种适用于高铁沿线的多台站快速地震预警方法
温针灸配合超短波治疗腰椎间盘突出症的疗效观察
铁路无线电干扰监测和台站数据管理系统应用研究
GSM-R接口监测数据精确地理化方法及应用
机载超短波电台邻道干扰减敏特性建模与评估
航空超短波通信链路余量分析系统设计
环评中引用大气现状监测数据的研究