投影寻踪法在滦河流域生态系统健康评价中的应用

2016-12-20 07:19董增川谈娟娟王雪薇张技涛
水力发电 2016年9期
关键词:滦河投影遗传算法

韩 锐,董增川,施 露,谈娟娟,方 庆,王雪薇,张技涛

(1.河海大学水文水资源学院,江苏南京210098;2.河海大学研究生院,江苏南京210098;3.黄河水利委员会信息中心,河南郑州450004)



投影寻踪法在滦河流域生态系统健康评价中的应用

韩 锐1,董增川2,施 露1,谈娟娟1,方 庆3,王雪薇1,张技涛1

(1.河海大学水文水资源学院,江苏南京210098;2.河海大学研究生院,江苏南京210098;3.黄河水利委员会信息中心,河南郑州450004)

针对滦河流域日益突出的生态系统健康问题,基于压力-状态-响应(PSR)模型,构建了滦河流域生态系统健康评价指标体系。采用投影寻踪法将高维数据指标转化到低维子空间,利用基于实数编码加速遗传算法优化求得最佳投影方向。通过建立投影寻踪等级评价模型,对2012年滦河流域4个市进行生态系统健康评价。结果表明,承德、秦皇岛、唐山和锡林郭勒对应的等级值分别为4.58、3.77、2.83和2.69,分别处于很健康、健康、亚健康和亚健康状态。同时,结合评价指标体系,对4个市生态系统存在的问题进行分析。

生态系统健康评价;评价指标;加速遗传算法;投影寻踪;滦河流域

0 引 言

近年来,随着社会经济的发展和人口的增多,人类正以前所未有的规模和强度影响环境,致使流域生态系统受到严重威胁,而人类社会的健康发展又受到流域生态环境恶化的严重影响。开展生态系统健康研究具有重要的现实意义,国内外众多学者对此进行了大量研究[1- 3]。

目前,关于流域生态系统定量化评价常用方法有层次分析法[4]、模糊综合评价法[5]、物元可拓模型法[6]、神经网络法[7]等。这些方法的评价结果会受到主观因素的影响,且评价方法在处理高维非线性样本数据集的适应能力不强,尤其是在流域评价指标数目较多的情况下。投影寻踪法可以避免评价过程中主观赋权问题,还可将高维非线性数据转化投影到低维子空间进行评价。评价过程中将流域划分成单元进行评价,并且会涉及到大量的社会经济数据,而这些数据通常是以行政区为单元统计的。

本文采用投影寻踪法,选择滦河流域承德、秦皇岛、唐山和锡林郭勒4个行政区作为流域生态健康的评价单元。通过建立投影寻踪等级评价模型,从空间尺度对滦河流域生态系统健康进行定量评价,为今后滦河流域生态系统发展和治理提供科学借鉴。

图2 流域生态系统健康评价指标体系

1 研究区概况

滦河流域隶属于海河流域,是海河流域四大水系之一,发源于河北省丰宁县的巴彦图古尔山麓,流经内蒙古自治区、河北省以及辽宁省的27个县市,最终于河北省乐亭县汇入渤海。流域总面积约为44 750 km2,其中山区面积占98.2%,平原面积占1.8%。多年平均降雨量为400~700 mm。滦河流域交通发达且矿藏资源丰富,形成了以唐山市、承德市、秦皇岛市为中心的经济区,是京津冀地区的重要工业基地。

研究数据及来源:滦河流域1∶25万数字高程模型(DEM);滦河流域土地利用调查数据即土地利用/覆盖图,数据格式为ArcGIS的shp文件;2012年滦河流域行政区划图;2012年中国城市统计年鉴、河北省经济年鉴、内蒙古统计年鉴等。

2 健康评价指标体系的构建

2.1 健康评价指标体系的建立

压力-状态-响应(PSR)模型[8- 9]由加拿大统计学家Tony Friend和David Rapport于1979年提出,在流域生态系统健康评价中受到广泛认可。压力-状态-响应模型为研究者提供的仅仅是对生态系统健康评价的一种思想,在具体应用中,针对研究区域实际状况,通过修改完善灵活运用。压力-状态-响应(PSR)框架模型见图1。

图1 压力-状态-响应(PSR)框架模型

本文参考已有的流域生态系统健康评价指标体系框架以及流域生态系统健康评价的相关研究[10- 11],选择了15个指标进行流域生态系统健康评价体系的构建。流域生态系统健康评价指标体系见图2。

2.2 评价指标标准的确定

为合理地定量评价流域生态系统健康,需要确定构建指标的阈值范围[12]。本文针对所选取的评价指标,部分指标阈值确定采用国家或国际的有关标准,如人口密度、土地垦殖指数等;部分指标阈值采用数理统计方法,如景观类型多样性指数、生态弹性度指数等。本文将指标分级标准划为很健康、健康、亚健康、不健康和病态等5个等级。流域生态健康评价指标分级标准见表1。

表1 流域生态健康评价指标分级标准

分级标准压力状态响应土地压力人口压力水资源压力活力组织力恢复力服务功能自然系统响应社会系统响应土地垦殖指数/%化肥施用强度/kg·hm-2人口密度(人/km2)人口干扰指数/%水资源开发利用率/%生物潜在第一生产力/g·m-2·a-1多样性/%均匀度/%蔓延度/%混布与并列指数生态弹性指数生态系统服务价值/106·(km2·a)-1土壤侵蚀指数林地覆盖率/%人均区域生产总值/万元·人-1病态6037004590400060490900402223005不健康402600357060008057070051154351亚健康201540025558001065050063176403健康15112501545100012072020078178456很健康1009100104012001408101009158105014

3 投影寻踪等级评价模型

3.1 实数编码加速遗传算法

美国Holland教授于1975年首次提出遗传算法[13- 14],它模拟了自然界生物进化过程,具有简单、通用、全局并行、鲁棒性强的特点,主要包括选择、交叉、变异等操作。传统遗传算法的寻优效率依赖于优化变量的区间范围,选择、交叉操作的寻优能力随着迭代次数的增加而慢慢减弱。本文采用基于实数编码的加速遗传算法来优化投影方向,通过最大程度暴露高维数据特征结构得到最佳投影方向。

3.2 投影寻踪等级评价模型建立

投影寻踪法[15- 16]是国际统计界于20世纪70年代中期发展起来的一类新兴多元数据分析的数学方法,其基本思想是把高维数据通过某种组合,投影到低维(1~3维)子空间上,通过极大(小)化某个投影指标,找出反映高维数据结构的投影在低维上对数据结构进行分析,据此达到分析和研究高维数据的目的。

3.2.1 对评价指标进行归一化处理

3.2.2 构造投影指标函数

投影寻踪的本质是通过从高维到低维的投影充分挖掘数据信息的最佳投影方向,将标准化后的指标值{xij}乘以单位长度向量α=(α1,α2,…,αp)即为投影方向的一维投影值zi,公式为

(1)

式中,αj为单位长度向量,xij为归一化后的指标值。

将α=(α1,α2,…,αp)取最佳投影方向,代入(1)式就可以得到流域生态系统健康评价的投影值。投影函数表达式为

Q(α)=SZDZ

(2)

3.2.3 采用实数编码加速遗传算法优化投影指标函数

确定各指标的样本后,投影方向α的变化会导致投影指标函数Q(α)变化。Q(α)可通过下式求解得到

(3)

该问题是一个关于{αj|j=1,2,…,p}为优化变量的复杂非线性优化问题,本文采用实数编码加速遗传算法进行优化求解。

3.2.4 等级评价

把上节中求得的最佳投影方向α*代入(1)式即可得到各等级样本,将各等级与其对应投影值z(i)*建立投影寻踪等级评价模型y*=f(z),然后通过归一化待评价样本得到投影值z(i),将投影值z(i)代入建立好的投影寻踪等级评价模型y*=f(z)中,即可得到各评价样本所属的等级。

4 研究成果

本文选取2012年承德、唐山、锡林郭勒和秦皇岛4个行政区的15个指标进行评价(见表1)。指标体系中的景观指数运用景观指数分析软件Fragstats4.0计算获得;采用迈阿密(Miami) 模型计算生物潜在第一生产力;生态弹性指数和生态系统服务价值可根据相应的计算公式求得[17];其他各指标通过土地利用/覆盖图以及统计年鉴获取。

针对表1的评价指标体系,将其分成5个评价标准的样本,评价样本的维数是15。利用MATLAB7.0编程处理,求得最佳投影方向α*=[0.184 1,0.513 0,0.508 2,0.433 8,0.134 5,0.124 0,0.169 9,0.160 2,0.129 6,0.159 3,0.173 4,0.137 7,0.159 5,0.142 9,0.177 3],对应的投影值为0、0.913 1、1.787 2、2.594 5和3.307 4。根据评价后的投影值,将病态、不健康、亚健康、健康和很健康5种状态分别对应1、2、3、4级和5级,据此得到对应标准样本的投影值散点图(见图3),最终建立投影寻踪等级评价模型y = 1.202 6x+0.931 01(R2=0.997 7)。将待评价的样本进行归一化处理,计算出待评价样本的投影值,根据所建立的评价模型即可得到评价样本所属等级。通过所建立的投影寻踪等级评价模型,得出2012年承德、唐山、锡林郭勒和秦皇岛对应的等级评价值分别为4.58、2.83、2.69和3.77,对应的等级分别为很健康、亚健康、亚健康和健康。

最优投影方向大小实质上反映了评价指标值对评价体系的影响程度,投影方向值越大说明影响程度越大。根据所求得的最佳投影方向值大小,权重位于前5的分别是化肥施用强度、水资源开发利用率、人口密度、土地垦殖指数和人均区域生产总值。化肥施用强度权重较大说明面源污染对流域生态健康的影响较大;水资源开发利用率、人口密度、土地垦殖指数反映了人类活动对于水资源、人口、土地要素的压力程度,体现出压力层面的指标对流域生态系统健康评价的影响程度;人均区域生产总值反映流域的生产能力,体现出社会经济系统对生态系统变化的响应。这些指标对保护未来流域生态健康具有一定的指导意义。

图3 投影值与等级关系

对比滦河流域4个行政区生态系统健康评价等级结果,可以得出:

(1)承德市处于很健康状态。主要原因是承德市土地压力和人口压力对环境影响较小。其中,土地垦殖指数、人口密度评价指标都位于很健康评价范围内;生态系统中活力、恢复力、服务功能相对较好,组织力相对较弱,说明生态系统的生产力水平较好,生态系统结构和功能比较稳定,但是生态系统生物多样性以及景观格局结构较弱。同时,承德市森林覆盖率高,林地覆盖率指标位于很健康评价范围内。

(2)秦皇岛市生态系统虽然处于健康状态,但是其指标数据并不乐观。其中,蔓延度、混布与并列指数等景观格局数据值较大,反映出秦皇岛地区景观破碎化程度较高,景观空间格局受到一定制约。同时,化肥施用强度指标值较高,说明面源污染一定程度影响着秦皇岛市的生态系统健康水平。

(3)唐山地区生态系统处于亚健康状态。主要原因是土地压力和人口压力对城市生态系统影响较大,这与唐山城市化程度高密切相关。同时,生态弹性指标评价值较低,说明唐山市生态系统弹性度相对较弱,生态系统恢复力较低。但是生物第一潜在生产力处于健康水平,说明唐山市生态系统生产力水平较好,具有一定的生态活力。

(4)锡林郭勒生态系统处于亚健康状态。由于近年来区域草地退化趋势得到遏制,土地压力对锡林郭勒生态系统影响逐渐减小。同时,锡林郭勒经济发展较好,人均区域生产总值较高。但是生态系统中活力、服务功能、组织力相对较差,说明区域景观格局结构较差,生态系统结构单一、不合理,生态环境脆弱。

5 结 语

本文基于压力-状态-响应模型构建了流域生态系统健康评价指标体系,采用基于实数编码加速遗传算法优化最佳投影向量的投影寻踪法建立投影寻踪等级评价模型。根据最佳投影方向计算出滦河流域4个行政区评价样本的投影值,确定4个行政区所属的健康等级。该模型的应用可避免由于预先给定评价的权重而产生主观性评价结果,且在数据降维的同时保持数据的稳定性。

对滦河流域4个行政区2012年生态系统进行健康评价结果表明,承德市处于很健康状态;秦皇岛市处于健康状态;唐山市处于亚健康状态;锡林郭勒处于亚健康状态。分析评价结果,可以识别影响每个单元生态系统的不利因子,为今后滦河流域生态系统发展和治理提供参考。本文针对滦河流域生态健康评价,只进行了空间尺度的分析,而时间尺度的分析未做考虑,在后续研究中需进一步完善。

[1]李春晖, 崔嵬, 庞爱萍, 等. 流域生态健康评价理论与方法研究进展[J]. 地理科学进展, 2008, 27(1): 9- 17.

[2]盛芝露, 赵筱青, 李佩泽. 中国流域生态系统健康评价研究进展[J]. 云南地理环境研究, 2011, 23(2): 52- 58.

[3]龙笛, 张思聪, 樊朝宇. 流域生态系统健康评价研究[J]. 资源科学, 2006, 28(4): 38- 44.

[4]付爱红, 陈亚宁, 李卫红. 基于层次分析法的塔里木河流域生态系统健康评价[J]. 资源科学, 2009, 31(9): 1535- 1544.

[5]王冰. 清水河流域(原州区段)生态系统健康评价[D]. 银川: 宁夏大学, 2014.

[6]解雪峰, 蒋国俊, 肖翠, 等. 基于模糊物元模型的西苕溪流域生态系统健康评价[J]. 环境科学学报, 2015, 35(4): 1250- 1258.

[7]聂磊. 区域生态安全的BP神经网络评价方法及其应用研究——以巢湖流域为例[D]. 合肥: 合肥工业大学, 2004.

[8]魏兴萍. 基于PSR模型的三峡库区重庆段生态安全动态评价[J]. 地理科学进展, 2010, 29(9): 1095- 1099.

[9]闫正龙, 高凡, 黄强. 基于PSR模型和粗糙集的平原地区河流系统健康评价指标体系研究[J]. 西北农林科技大学学报: 自然科学版, 2013, 41(12): 200- 208, 219.

[10]方庆, 董增川, 刘晨, 等. 基于PSR模型的唐山地区生态系统健康评价[J]. 中国农村水利水电, 2013(6): 26- 29.

[11]龙笛, 张思聪. 滦河流域生态系统健康评价研究[J]. 中国水土保持, 2006(3): 14- 16, 52.

[12]段树国, 奚秀梅. 塔里木河流域生态系统健康评价指标体系的构建[J]. 云南地理环境研究, 2007, 19(5): 114- 117.

[13]苏明珍, 董增川, 张媛慧, 等. 大系统优化技术与改进遗传算法在水资源优化配置中的应用研究[J]. 中国农村水利水电, 2013(11): 52- 56.

[14]边霞, 米良. 遗传算法理论及其应用研究进展[J]. 计算机应用研究, 2010, 27(7): 2425- 2429, 2434.

[15]王浩, 唐德善, 何格. 基于RAGA的PPPCA模型在水资源配置方案中的应用[J]. 水电能源科学, 2014, 32(7): 37- 39.

[16]王明昊, 董增川, 马红亮. 基于混合蛙跳与投影寻踪模型的水资源系统脆弱性评价[J]. 水电能源科学, 2014, 32(9): 31- 35.

[17]方庆, 董增川, 刘晨, 等. 基于景观格局的区域生态系统健康评价——以滦河流域行政区为例[J]. 南水北调与水利科技, 2012, 10(6): 37- 41.

(责任编辑 杨 健)

Application of Projection Pursuit Method in Ecosystem Health Assessment of Luanhe River Basin

HAN Rui1, DONG Zengchuan2, SHI Lu1, TAN Juanjuan1, FANG Qing3, WANG Xuewei1, ZHANG Jitao1

(1. College of Hydrology and Water Resources, Hohai University, Nanjing 210098, Jiangsu, China; 2. Graduate School of Hohai University, Nanjing 210098, Jiangsu, China; 3. Information Center, Yellow River Conservancy Commission, Zhengzhou 450004, Henan, China)

In view of increasingly severe ecosystem health problem in Luanhe River Basin, the ecosystem health assessment index system of Luanhe River Basin is established based on pressure-state-response (PSR) model. The projection pursuit method is used to change high-dimensional data indexes into low-dimensional subspace and the best projection direction is obtained based on real coding accelerating genetic algorithm optimization in model. The level evaluation model of projection pursuit is established to evaluate the ecosystem health of four cities in Luanhe River Basin in 2012. The evaluation results show that the corresponding level value of Chengde, Qinhuangdao, Tangshan and Xilin Gol is 4.58, 3.77, 2.83 and 2.69 respectively, which imply that they are in a state of very healthy, healthy, sub healthy and sub healthy respectively. At the same time, based on evaluation index system, the existing problems of ecological system in four cities are analyzed.

ecosystem health assessment; evaluation index; accelerating genetic algorithm; projection pursuit; Luanhe River Basin

2016- 01- 15

水利部公益性项目(201101017);国家社会科学规划基金资助项目(2012&ZD214)

韩锐(1992—),男,宁夏同心人,硕士研究生,研究方向为水资源规划与管理;董增川(通讯作者).

X826

A

0559- 9342(2016)09- 0005- 04

猜你喜欢
滦河投影遗传算法
河北省滦河“一河一策”方案编制与实施评估
解变分不等式的一种二次投影算法
让滦河流域水量丰、水质好、生态美——河北省人大常委会通过关于加强滦河流域水资源保护和管理的决定
基于最大相关熵的簇稀疏仿射投影算法
美丽河北之滦河
找投影
找投影
啊,我的滦河燕山
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用