林业数据可视化技术及其应用

2016-08-29 02:14北京航空航天大学李昕冉
电子世界 2016年15期
关键词:槲寄生云杉可视化

北京航空航天大学 李昕冉



林业数据可视化技术及其应用

北京航空航天大学李昕冉

林业病害防治工作所共有的一些特征,如数据结构复杂、各因子间的制约关系难以挖掘等,给当前林业信息化提出了不少难题。因此我们引入了数据可视化这一技术,以期丰富林业信息化手段,更好地支持林业工作。本文设计并实现了云杉矮槲寄生调查数据可视化系统,辅助林业专家挖掘寄生病害的成灾规律,实验结果表明,本系统能够更高效地指导灾害防治工作,同时扩展性较强,可以为类型工作提供一定的参考。

数据可视化;林业;林业病害防治

0 引言

在信息爆炸的今天,各个领域经过调研记录,都积累了海量数据,如此庞大的数据量既给了我们发掘新知识的无限可能,同时,由于无用数据淹没了有价值的信息,数据的结构也更加趋向于高维化、多态化,探索难度也明显增加,给我们带来了新的困扰。在数据处理方面,传统的统计分析和数据挖掘方法往往只能进行单纯的简化或抽象,无法展示数据集的真实面貌,容易遗漏某些重要但无法通过降维来发掘的信息或规律。

当前林业领域调查数据的处理分析工作,也面临着这样的问题,目前并没有一种得心应手的技术手段来组织和利用这些庞杂的、非结构化的调查数据。与此同时,可视化技术的兴起、深入研究和广泛应用,则针对这个问题为我们提供了一条令人兴奋的解决途径。可视化技术已经非常善于将不可见的、难以直接显示的数据映射为可感知的图形、符号、颜色、纹理等,再结合一定的交互操作,以此还原所研究数据的全局结构和具体细节,甚至可以达到突出重点数据,增强数据减重要关系的可见性的效果[1]。

1 关键技术

1.1数据可视化

数据可视化旨在研究如何对大规模数据信息资源进行交互的视觉呈现以增强认知,可视化技术既可以满足使用者纵观全局的需求,也可以提供突出细节功能;既可以展示数据的直观内容,也有助于分析和表达数据内部所遵循的组织结构。

数据可视化由于所研究的数据对象的不同而分为两个分支,分别是科学可视化和信息可视化。科学可视化主要面向自然科学领域和工程领域的数据。而信息可视化所处理的数据对象则是文本、社交网络、金融交易、地图或高维空间中的点等结构化程度极低的抽象数据。对于这些数据集合的特点而言,信息可视化技术所面临的最大难题就是如何在呈现高维、大尺度的复杂数据时,减少视觉混淆带来的干扰,使可视化过程能够充分发挥辅助知识发掘、辅助信息传达的作用,令使用者能够验证预期,并从冗杂的信息中发现未预期的知识[2][3]。

多维与多元数据处理,在可视化过程中是一个普遍存在的基础性问题,也是众多学者研究的热点。目前解决这个问题的主要方法包括增维方法、维对应方法和降维方法。每种处理思想都衍生出了多种具体的实现技术,例如雕形图、多维重叠、星座图等。在降维处理过程中大都依赖于数学分析方法,常用的包括主成分分析方法、多维尺度法、神经网络等[4]。

1.2数据可视化

对于林业信息的管理工作,目前的成果主要集中在对林业工作人员的管理和对蓄积量等经济利益指标的管理上,真正深入挖掘林本数据的工作相对较少。而针对病害数据,完整地做到采集、整理、分析、利用各个环节的,就更少了。

目前林业科研中的可视化应用主要分为两个方法,一方面是针对于森林、林场等宏观概念的森林资源管理,另一方面是针对于单株树木的生长模拟和外形建模上。在林场等宏观层次上的可视化应用,主要还是依托于一些较为成熟的软件,如GIS软件和CAD软件等,然而这些软件都是地理信息和工程设计领域较为通用的工具,并非针对于林业领域而设计的工具,所能达到的可视化效果远不能支持林业领域更多方面的研究工作。

林业领域积累了充足的调查数据和实验数据,然而无论是国际上还是国内,目前对于林业数据的利用都处于探索阶段,大部分的应用研究工作仍然基于集中于相对简单的统计与空间分析功能,隐藏在调查数据中的大量信息和知识有待深入探索。因此,更充分地解决高维数据、时序性数据、多重尺度和多个来源的数据集的利用问题,必将会深刻地推动林业领域可视化应用的发展。

2 林业数据挖掘与可视化的应用

以云杉矮槲寄生调查数据为例,将可视化技术应用到林业领域的调查数据的分析中,能够有效地解决云杉矮槲寄生灾害防控工作所面临的问题。

2.1系统结构设计及数据可视化流程

本系统以JavaScript为开发语言,引用了d3函数库,将数据以电子表格的形式存储起来,在经过数据集成和数据清理等过程去除了数据中的无用或错误信息后,会进入可视化算法处理阶段。针对不同对象采用不同的可视化表达模式,经过颜色、位置、形状等表达方式的设计与点选、拖拽、缩放、切换等交互方式的设计后,完成对数据的处理。系统的数据流动过程如图1所示:

图2 展示病害现状模块

2.2可视化方法设计及选择

可视化算法的设计是一个多次循环的过程,类似于软件开发中的迭代开发,需要在晕乎需求描述、数据梳理、编码、用户使用和反馈等步骤中多次循环,在试用过程中发现新的需求和灵感并应用到算法设计中去,在数据整理过程中选择合适的映射方式,在编码设计过程中发现更多能传达的信息等等,最终形成较完善的算法设计。对于本系统中所实现的可视化效果,主要使用二维空间,配合部分二点五维效果。

图3 致病因子研究模块

2.3可视化系统的实现

本系统中主要包括两大模块,一是病害分布情况可视化模块,主要用来展示当前调查数据中所包含的云杉矮槲寄生发病严重程度和地理位置分布状况;二是致病因子研究可视化模块,主要功能在于研究云杉矮槲寄生的致病因子,以便于指导防治措施的制定。

展示病害现状的功能模块(图2),主要向使用者提供选择数据源和评价方式的功能,同时提供图例向使用者说明当前可视化方法的映射原则,以遥感卫星影像为底图,叠加以病害调查数据为基础的颜色渲染,颜色差别明显,易于辨认和理解。

致病因子研究的功能模块(图3),针对林业调查数据属性类型较多、维较高的特点,设计了两部分可视化过程,第一部分为初次可视化,用来展示所有属性类型的调查数据,以及它们之间的相互关系,二部分为再次可视化,利用主成分分析结合多元线性逐步回归分析方法,以主成分得分为解释变量,以分析致病的关键因子。

2.4实验结果与分析

由于篇幅限制,仅列出几条记录样例,如表。从病害分布特征可视化模块得知,云杉矮槲寄生病害的发生有一定的地域性,即如果某地有云杉矮槲寄生病害发生,则其附近地域也倾向于发生严重程度类似的云杉矮槲寄生病害。从致病因子研究模块结果可以看出,感病指数、发病率、平均DMR三者之间的相互都有较强的关联性,平均胸径与冠幅的一致性很高,郁闭度与发病率的关联性、平均DMR与冠幅的关联性较为明显。当然,可视化所得到的这些规律暗示都有待进一步的确认与分析,最终结果需要取决于林业专家的意见。

表1 实验数据

3 结语

将可视化技术应用到林业领域是一条值得关注且尚未成熟的技术路线,本系统在结构设计上根据可视化结果的功能进行划分,较为合理,在代码开发上具有较好的可扩展性和重用性,可以为类似的工作提供一些参考。

[1]Hansen C,Johnson C.2004.The Visualization Handbook[M]. Waltham Massachusetts:Academic Press.

[2]戴国忠,陈为,洪文学,刘世霞,屈华民,袁晓如,张加万,张康.信息可视化和可视分析:挑战与机遇——北戴河信息可视化战略研讨会总结报告[J].中国科学,2013,43(1):178-184.

[3]Spence R.2007.Information Visualization:Design for Interaction[M]. New Jersey:Prentice Hall.

[4]杨峰,李月华.高维信息可视化方法研究综述[J].情报理论与实践,2012,35(9):125-128.

猜你喜欢
槲寄生云杉可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
槲寄生
云杉大苗的起苗与包装
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
云杉的管理与栽培技术要点分析
云 杉
西秦岭山地云杉育苗技术
幸福的槲寄生