浅谈机器学习在短波信号调制识别中的应用

2021-07-04 11:12陈弘扬王心尘
数字通信世界 2021年6期
关键词:短波监测数据决策树

陈弘扬,薛 珂,王心尘

(国家无线电监测中心福建监测站,福建 厦门 361004)

0 引言

国家短波监测网由北京、哈尔滨、上海、福建、深圳、成都、云南、陕西和乌鲁木齐等9个短波监测站以及短波监测指挥控制中心(北京)组成。自建成以来,国家短波监测网为短波无线电管理的各项工作,如重大活动保障、国际干扰申诉处置、频率指配、干扰查找等提供了有力支撑,并为频率及台站的规划和审批工作提供了可靠支持,有力地维护了短波电波秩序。

随着短波监测网监测能力大幅度上升带来的海量数据处理需求,以及大数据、云计算、AI、机器学习等新的概念的普及应用,如何实现新概念与短波数据分析的结合,挖掘短波监测数据蓝海中更有价值的内容应当是未来发展中值得重点关注的问题。

1 机器学习在无线电监测方面的应用情况调研

早期的无线电监测是以人工耳听及手动分析为主,而随着监测网技术水平和建设规模的提升及软件无线电理论的日渐完善,随之而来的是监测数据量急剧增加,对于海量数据的各种联系和规则的挖掘、主动发现异常信号数据、当前频谱使用态势分析以及对未来频谱需求预测,是无线电监测工作中的重要部分。而机器学习技术的目标正是从杂乱无章的海量数据中挖掘出潜在的有价值的信息和知识。

1.1 机器学习的定义

机器学习指的是通过设计某些算法来训练计算机 通过已知数据得出一个最适合的模型,再利用这个模型对未知数据给出判断的过程,也就是让计算 机具备 像人一样的学习能力,进而从大量监测数据中挖掘出其中隐含的规律,并用于预测或者分类。

1.2 机器学习的应用

近年来,机器学习技术迅速发展,在社会各行业得到了广泛应用,如工业生产、金融投资、医学、旅游、天文气象等领域。随着数据量的快速增长,传统的统计分析方法已经无法满足需求,人们开始转而利用计算机的高性能来分析数据库中的海量数据,从中挖掘数据蕴藏的更深的价值。当前越来越多的技术工作,如数据挖掘、云计算、知识发现、信号处理等同机器学习概念联系起来[1],充分证明了机器学习可以在海量数据处理方面发挥重要的作用。机器学习可以依托原始样本分析数据规律,并利用历史经验,以更加智能的方式产生决策[2]。

机器学习涉及领域广泛,包括概率方面、统计方面、算法复杂度理论等诸多学科[3],而随着机器学习理论的不断发展和计算机性能的提升,机器学习应用得到了进一步发展,已经广泛应用于语音识别、图像识别、数据挖掘、机器人控制等诸多领域。

在无线电监测方面,机器学习的应用主要包括针对黑广播频谱参数进行采样学习、信号检测发现、调制模式或干扰识别、认知无线电等。

由于机器学习最本质的目的就是从大量的数据分析中汲取知识,因此机器学习与短波大数据的结合显然值得重点关注,特别是当短波新技术发展及专业化应用趋势日趋明显的情况下,如何从无到有地实现机器学习手段的工程化,进而利用机器学习方法针对短波大数据进行分析处理依然是一项具有挑战性的工作。

2 机器学习工具调研

业内应用最广的3款机器学习工具是Python、MATLAB和WEKA。

(1)Python是一种用于通用编程的解释型高级编程语言,目前已有很多机器学习(深度学习)框 架,能够比较 好地支 持机 器 学习,因此如果需要进行多运行环境的适配和移植,计算模块使用Python是个比较理想的方案。

(2)MATLAB是一种多范型数值计算环境,它提 供了大量机器 学习算法,常见的比如PCA、SVM、决策树、集成学习等,应付日常需求绰绰有余。但同时它也存在无法开发单独的应用和迭代循环性能 差的问题,而且 正 版MATLAB的每个 license都价格不菲。如此昂贵的价格以及美国日渐加强的知识产权保护措施,也使得MATLAB不再适用于大数据的机器学习研究。

(3)WEKA是一款集机器学习、数据挖掘和可视化为 一 体的 软件,它作为 一 个 免费、公开的数据挖掘平台,包含了大量的机器学习算法,如数据预处 理、分类、回归、聚类、关联规则分析等。WEKA操作简单,计算速度快,是入门机器学习的不错选择怕,同时用户还可以通过Java语言,在其架构上开发更多的数据挖掘算法。

综上所述,若有编程基础,可以选择功能更加强大的Python,若编程基础薄弱或没有编程基础,则可以使用WEKA。对于大部分无线电监测从业者来说,关注的是监测数据的挖掘,也就是机器学习方法的应用,所以WEKA的机器学习功能能够满足无线电监测从业者的需求。

3 WEKA机器学习应用实例

在短波监测中,信号的调制方式是一个非常重要的属性,它对于分辨信号是否合法有着很大的意义。传统的信号分析方法是由监测人员进行手动分析,但对于越来越大的数据量,这个方式存在效率不高的短板。由于短波信号在频谱上的特征比较明显,我们可以尝试在WEKA的知识流界面使用分类方法对海量短波监测数据进行调制方式识别的机器学习。

3.1 分类算法介绍

分类是一种重要的数据挖掘形式,它通过一个分类函数构造一个分类模型(即分类器),将未知类别的数据对象映射到某个给定的类别。

分类的一个重要预测模型是决策树,它是一种与流程图类似的树结构,它包括了决策节点、分支和叶节点这三个 部分。决策节点表示待分类样本的某一个属性,在此处进行一个判断,不同判断结论形成不同的分支,叶节点代表一种分类结果。选择分支的特征可以用到决策树中应用最广泛的算法——C4.5算法,它采用信息增益率作为当前最优决策属性的度量标准。本文将使用C4.5算法对短波监测数据中的调制方式这一属性进行决策树分类的机器学习。

3.2 基于WEKA的决策树分类实现

我们使用的短波监测数据集包含1 230条数据,具备频率、功率、带宽、定位位置(国内或国外)、调制方式、发射是否规律这6个属性。在WEKA的知识流界面中,添加如图1所示的组件,其中CSVLoader是数据源组件,用于加载数据集;ClassAssigner用于指明数据集中需要分类的属性;CrossValidationFoldMaker是交叉验证组件,用于设置训练集和测试集的比例等;J48组件是本流程的核心算法部分,J48即WEKA中决策树下的C4.5 算法;GraphViewer及TextViewer是最后的图形及文字结果输出组件。各组件通过“批量传递数据”模式连接后,设置好各组件中的参数,点击开始后,WEKA开始运行,结束后可得到如图2所示结果,在1 230条数据中,分类正确的是1 199条,正确率为97.48%,这一正确率在大体量的数据集中是个不错的结果,说明该决策树分类模型可以用于海量监测数据的调制类型分类中。从图3的结果中可以看出,错误分类的数据主要是SSB信号和数字调制的信号,要提升分类正确率,还需要更多的准确数据或更多的数据属性来丰富决策树,这也是我们未来努力的方向。

图1 知识流界面中利用J48算法进行分类

图2 J48算法分类结果1

图3 J48算法分类结果2

4 结束语

本文首先介绍了短波监测数据分析面临的挑战,然后通过文献调研对机器学习在短波监测数据分析方面的应用进行了归纳,接着对主流的机器学习工具进行了调研,并选取WEKA作为机器学习工具,对短波监测数据集中的调制方式进行分类,得到了较高的正确率,证明了机器学习在短波监测数据分析的可行性。

猜你喜欢
短波监测数据决策树
基于决策树和神经网络的高血压病危险因素研究
秦皇岛河口湿地环境在线监测数据应用研究
浅谈模块化短波电台的设计与实现
决策树和随机森林方法在管理决策中的应用
浅谈2kW短波发射机开关电源的维护
决策树多元分类模型预测森林植被覆盖
短波发射机维护中的安全防护措施分析
基于小波函数对GNSS监测数据降噪的应用研究
关于短波发射机的发展方向的探讨
北京经济社会发展月度监测数据(2008年11月)