基于社交平台照片数据的城市次级荒野空间景观偏好研究
——以杭州江洋畈生态公园为例

2023-09-05 01:44杨龙旭

山东林业科技 2023年4期

杨龙旭，李煜

（西南林业大学园林园艺学院，云南昆明 650224）

1 研究背景

次级荒野景观空间是由于人类活动干预的减少而促使植物群落结构发生自我演替形成的景观。视觉上呈现出土地撂荒、植物自由生长，甚至野生动物栖息于其中。而这种在城市中因人类干预减少而自发演替形成的荒野景观，其最大的特点是具有稳定的群落结构和丰富性物种。

景观偏好理论最早由Kaplan 夫妇提出，环境偏好其本质是指景观产品的使用群体由于多种因素而在景观的选择上偏向于某一种或某一类的现象，景观偏好研究则是通过对研究不同群体对不同景观的态度和偏好程度进行研究和评估分析的过程[1]。

传统上景观偏好研究多通过问卷调查或半结构化访谈进行。例如，郭丽丽等人对太原市迎泽公园美景度进行评价，通过向50 名游人发放印有取样点照片的问卷对样点按照喜爱程度打分[2]。又如，为了研究西班牙南部安达卢西亚的两个地中海农村地区居民对景观的偏好，Manuel Arriaza 等人召集226 名受试者，对取样点拍摄的160 张照片排序，选出个人最喜欢的和最不喜欢的，最喜欢的+4 分最不喜欢的-4 分其他的各0分，以此方法获得每个场景的平均视觉质量指数（AVQ）[3]。

“杭州江洋畈生态公园” 位于杭州城南凤凰山路北虎跑路东，它的前身是西湖淤泥疏浚的堆积场。由于西湖疏浚淤泥在此的堆晒泥中的水生、陆生植物种子纷纷发芽，江洋畈堆积场变成了以垂柳、湿生植物为主的次生湿地。2008年杭州决定将此地打造成我国第一个城市次级荒野公园，占地19.8 hm2，公园中按照人工干预的大小分为生态保育区、景观保护区、文化活动区，因此可以就游客偏好“一般人工景观”还是“荒野景观”的问题提供对照（见图1；图2）。

图1 江洋畈生态公园平面图

图2 江洋畈生态公园功能分区图

传统的景观偏好研究方法，费时费力并且获取到的数据总量有限，也不能反应受试者的景观偏好，也不是无意识真实的反应，最重要的是数据的准确性非常依赖受试者的配合度。

随着我国的发展国内网民数量呈现指数级增长，网络平台也成为大众展现自我的多样舞台，也为景观研究提供了海量数据。用户发布的照片绝大部分是基于自愿拍摄所得，这种摄影行为能真实的表达游客对于旅游消费对象的理解和认知甚至欲求。这种被称为旅游摄影的行为其动机可被描述为①被景致所吸引；②对异地的好奇和旅游的新鲜感；③为拍出好作品，特意选择地方旅游，并找寻最佳取景点；④与亲朋好友、当地人或自己独照[5]。并且游客发布在社交平台上的照片数据符合游客自愿拍摄法对于数据的要求。游客自愿拍摄法(VSEP)在受雇游客拍摄法（VEP）的基础上发展而来，该方法赋予被试者自主拍摄偏好景观的权利，能更准确地表达被试者的真实想法及偏好[4]。因此，通过对网络平台旅游摄影者发布的照片进行分析，依据照片中主景是否呈现低人工干预的特征分类，分为“一般人工景观”和“荒野景观”[6]。并分析哪一类数据在总样本数中占比较大，即游客更喜爱更关注该公园中哪一类景观即可以较真实的得出游客在城市次级荒野空间中是更加偏好荒野景观还是一般人工景观。通过对图像数据反应的景观要素进行统计，则能分析并较真实的得出游客在景观中特别关注的内容。该方法使分析结果受研究员个体偏见和主观性影响大大降低。

截止2022 年底在相关荒野景观的中文研究文献当中，鲜见学者针对国内大众群体进行公众对于荒野景观偏好的调查研究。而了解国内荒野景观在大众群体中是否接受或喜欢，并且了解大众群体在城市次级荒野空间中偏好什么样的景观内容，对于现代化城市绿地构建营造有重要的意义。

2 研究过程

2.1 研究方法

本研究应用“飞桨EasyDL（百度AI 开放平台）”提供的图像分类模型以及图像内容识别模型，通过人工标注后的图像数据组成训练数据集、测试数据集、验证数据集，将训练数据集和验证数据集导入模型进行训练，其中训练数据集的数据起主要训练作用，验证数据集的数据起到监督训练的作用。模型训练完成后通过测试数据集得出模型整体和各个标签下的的置信度、准确率以评估模型的总体识别效果以及各个标签的识别效果。

2.1.1 图像分类模型

将经过人工粗筛去除无关图片和4MB 以下的模糊图片数据导入训练后的图像分类模型中进行批量预测分类，将所有图片数据分为“一般人工景观”和“荒野景观”。并将模型分类结果文本通过Excle统计分析得到每一类别标签下图像数据的数量以及该标签下图像数据占总数据数量的占比。

2.1.2 图像内容识别模型

以图像分类模型处理结果为依据，选择被识别为荒野景观的图像数据创建数据集。将荒野景观图像数据集导入训练后的图像内容识别模型中，进行批量预测识别。最后导出模型识别结果的文本，通过Excle 处理结果文本，将置信度不足0.5 的标签除去。最后统计每一标签的数量。

2.2 数据收集处理

为保证数据的真实性和分析的效果，图片数据主要来源于以旅游游记分享为主要功能的网站上发表的带有“江洋畈生态公园”位置坐标的游记图片。本文中，选取了携程旅游网、大众点评、马蜂窝旅游网3 个国内知名度较高用户数量较高的旅游网站。通过“八爪鱼RPA”对时间尺度在2021 年2 月16 日至2023 年2月21 日网页照片进行截取，3 个平台共计3510 张。对照片进行人工粗筛，筛去文件小于16KB、特写镜头、人像写真、美食照片、拼图照片、杭帮菜馆内部照片等无关的数据后有效数据共计2758 张。

2.3 图像标签分析

在正式开始处理网络获取的数据之前，结合实验的目的对所获取的数据进行初步的人工分析。从经过人工粗筛的2758 张图片数据中随机抽取300 张图片进行分析。

2.3.1 图像分类模型—单标签

依据研究目的设置“一般人工景观”和“荒野景观”两个单标签。从抽取的图片数据被摄物来看，江洋畈生态公园中的一般人工景观主要为廊架、标识牌、宣传栏、景墙、人工花坛、车行道、雕塑、栈道等，识别特征清晰明显。

江洋畈生态公园中的荒野景观主要为以水生草本植物为主的滨水景观、水生乔灌木为主的滨水景观、中乔木为主的森林景观、草本花卉为主的景观等。自然演替特征明显。

2.3.2 图像内容识别模型—多标签

通过对随机抽取的300 张图片进行人工观察分析并归纳总结出了自然景物标签——灌木丛、浮叶植物、挺水植物、水塘、山、树林、树丛、旱生草本植物、野花海、野花丛，人工景物标签——小径、栈道、建筑、园林小品、标牌，共15 类景观要素（见图3）。

图3 部分内容标签示意图

2.4 模型训练

2.4.1 图像分类模型

在经过人工粗筛的2758 张照片数据中，按照10%的比例随机抽取出276 张图片数据，并分别通过人工标记上“一般人工景观”和“荒野景观”，同时保证“一般人工景观”和“荒野景观”下标签数据数量为1:1。随后将这276 张图片数据按照8:1:1 的比例分为训练集数据、验证集数据、测试集数据并进行模型训练和模型测试。

2.4.2 图像内容识别模型

在图像分类模型结果为荒野景观的结果中随机抽取图像数据进行人工标注，并保证训练数据集中每个标签下标注不少于50 个，数据集、验证集下每个标签标注不少于10 个，对模型进行训练。

2.5 EasyDL 模型评估

2.5.1 图像分类模型

在该图像分类模型中，基于测试数据集中28 个样本的计算，模型正确分类的测试数据集样本数占测试数据集总样本数的96.3%。模型精确率（‘某类样本正确预测为该类的样本数’占‘预测为该类的总样本数’的比率）为90.0%，召回率（‘某类样本正确预测为该类的样本数’占‘标注为该类的总样本数’的比率）为97.8%，其中各类别精确率和召回率的调和平均值为93.3%。从每个标签来看，一般人工景观识别的精确率为80.0%，召回率为100%；荒野景观的精确率为100.0%，召回率为96%。总体来看模型的识别效果较好，其中模型对于荒野景观的识别效果最好，而对于一般人工景观的识别效果则不如荒野景观的识别效果。究其原因可能因为，被摄人工景观主体周边或多或少的参杂了一些由于低人工干预而形成的荒野景观而对识别造成一定的困难。考虑到图像数据呈现的景观复杂性与人工操作产生的误差，可以将该部分误差列为正常结果。

2.5.2 图像内容识别模型

在图像内容识别模型中，由于建筑、园林小品、标牌该3 类标签人工标注数据低于10 个，因此予以剔除。基于34 张图片数据12 个标签，每个标签下标注数据不少于10 个的测试数据集测试结果来看，在平台建议阈值0.6 的情况下模型精确度80.6%，召回率为84.7%。12 个标签的识别效果中，挺水植物和灌木丛的识别效果最差（见图4）。通过平台导出的错误示例来看，识别效果差主要是由于，测试数据集人工标注的遗漏而导致模型识别到了相应内容而在测试数据集中的图片数据中却没将该内容标注出来，而被平台判断为误识别造成的（见图5）。因此模型的精确度实际应远高于该值。

图4 内容识别模型各标签识别效果（mAP）

3 结果与分析

3.1 结果

3.1.1 图像分类模型

通过对网络社交平台图像数据的收集和图像分类模型的分类，最终在有效的2758 张图片之中，得到分类结果为一般人工景观的465 张，得到分类结果为荒野景观的2293 张。即一般人工景观占所收集到有效数据的16.9%，荒野景观占所收集到有效数据的83.1%。

3.1.2 内容识别模型

通过对图像分类模型分类结果中2293张结果为荒野景观的照片进行内容识别分析。共识别到内容标签6987 个，在所识别到的内容标签中树林最多为1503 个，浮叶植物最少为180 个（见图6）。

图6 图像内容识别模型识别结果

图7 杭帮菜博物馆的屋顶绿化与周边环境

3.2 分析

3.2.1 图像分类模型

从分类结果上来看，杭州江洋畈生态公园的游客在进行旅游摄影分享时更愿意分享低人工干预的景观，即荒野景观，通过旅游摄影心理理论分析可以得出，游客相比于一般人工景观更喜欢荒野景观的结论。

究其原因，其一是，随着我社会经济和人口质量的不断提高，对于不规则野性的自然的美鉴赏力在不断的提高[7]；其二则是，随着城市化的进程，人们在城市生活中接触自然的机会不断减少，而人们生活在城市当中的压力和负担却在不断增加，以心理学家荣格的原型理论来分析，生活在城市中的人们越逐渐认为规则的城市景观并不能给人带来安全感，这唤醒了人类DNA 中对自然的渴望，因此与高人工干预的景观相反的自然野性的景观反而更能带给人安全舒适适宜生存的感觉，所以游客们会认为荒野景观相较于一般人工景观来说更美并且更加偏好[8]。

3.2.2 内容识别模型

从图像内容识别结果来看，标签数量占前3 的是树林、挺水植物、水塘，标签数量位于后三的是小径、野花丛、浮叶植物。

从江洋畈生态公园自身情况分析。江洋畈生态公园就自然演替阶段上来说处于乔木群落阶段，并且在滨水景观的植物中以挺水植物为主，森林景观中植物层次丰富但以乔木、灌木、草本的层次为主。在被图像分类模型标记为“荒野景观”的图片数据中，有大部分被内容识别模型识别出具有人类活动标志的内容标签如栈道、园林建筑、小径。说明①栈道为江洋畈生态公园的主要游览路径设计形式；②江洋畈生态公园中的园林建筑在外观上与周边环境融合较好，查看被标记为园林建筑的内容可以发现主要为“杭帮菜博物馆”，说明该建筑是园中处于中心地位的园林建筑，其次是廊道、亭子等；③小径为江洋畈生态公园内容识别结果中数量最小的人类活动产物。在识别结果中可以发现，江洋畈生态公园中的小径多为青石板、小料石、鹅卵石铺装，部分为水泥沥青材料铺装，从景观的角度上看，说明石材铺装对荒野景观的整体影响较小，更显自然；④江洋畈生态公园中栈道、园林建筑、小径的设计皆与周边环境融合较好，在较大程度上降低了对以植物为主的群落自然演替过程的影响，并在景观上对总体荒野景观的景观效果影响较小。

从发布旅游摄影作品的游客行为分析。自然景物标签占前三的是树林、挺水植物、水塘，说明游客在游览江洋畈生态公园时的旅游摄影行为中，对森林景观和滨水景观更加青睐，自然景物标签位于后三的是浮叶植物、野花丛、野花海，说明草本植物形成的景观以及林下景观游客的关注度较低，这一现象可以解释为由于江洋畈生态公园土壤条件多为淤泥，多数草本花卉不适应这种土壤条件，因此长势较差；加上自播能力较差并且主要花海植物如金鸡菊(Coreopsis drummondii)，波斯菊(Cosmos bipinnata)、硫华菊(C.sulphureus)等，盛花期正值杭州雨季易霉烂倒伏，因此头一年人工撒播的花海景观效果一年不如一年，最后销声匿迹，无法形成规模引起游人的注意[9]。识别结果中人工景物“栈道”识别结果较多，说明游客活动被较多的限制在栈道之中。

4 结论

综上所述基于社交平台照片数据分析。在有江洋畈生态公园游憩经历并将游历江洋畈生态公园旅游摄影分享在社交平台的游客中①相较于一般人工景观，他们更喜欢公园中的荒野景观；②而通过对社交平台照片数据内容的分析发现，在城市次级荒野空间景观中游客对森林景观和滨水景观更加偏爱。

通过对江洋畈生态公园现状以及社交平台数据的分析可得，建设广泛的被游客喜爱的城市次级荒野空间景观需要满足的原则有①景观较稳定层次较丰富，江洋畈生态公园的自然演替阶段处于演替时间较长的乔木群落阶段，因此有稳定和丰富的群落层次；②人工景物在设计上应着重考虑其与周边环境植物群落演替的关系，江洋畈生态公园中最大的建筑“杭帮菜博物馆”设计理念中传达出对自然立场的尊重以及对杭州建筑地域特色的尊重和使用，并且在建筑材料上采用植草屋顶和绿色的遮阳立面隔栅，使建筑真正的融入城市次级荒野景观空间（见图6）[10]；③丰富的滨水景观空间，依据生态学边缘理论处于两种生态系统之间的边缘地区往往是物种最丰富的区域，因此形成的景观效果也是丰富最多变的，另外水面在园林空间当中往往会形成一个开敞空间，与周边闭合的森林景观形成空间开度上的对比，对于游人来说这样的开敞水景空间也是最有吸引力的空间；④森林景观与生态保育区结合，通过查看含有“森林”标签的图片数据可以发现大多森林都是以背景的形式出现在图片中，这也说明了游客对森林景观的喜爱，更具体的说是对森林林缘景观的青睐，而森林景观与生态保育区的结合非常利于自然演替过程中形成丰富自然的林缘景观。

基于社交平台照片数据的城市次级荒野空间景观偏好研究——以杭州江洋畈生态公园为例