基于遥感解译样本数据采集与整理的问题探讨

2018-12-26 08:36何德俊夏小江
地理空间信息 2018年12期
关键词:数据表实例样本

何德俊,倪 峰, 夏小江

(1.湖北省测绘工程院,湖北 武汉 430074)

遥感解译样本反映了地面照片和遥感影像之间的对照关系,解译样本制作是地理国情普查、监测工作顺利开展的重要基础内容之一。遥感解译样本数据包含地面照片和遥感影像实例数据。两类数据分别从不同的侧面反映地物影像形态特征,起到相互印证的作用,可以帮助解译人员更高效地认知遥感影像所蕴含的信息。同时,样本照片还可以作为教学资料指导后续解译工作。本文在简单介绍遥感影像解译样本数据的内容与属性的基础上,结合数据采集实际,重点阐述了解译样本数据整理的技术要求及质量控制措施。

1 数据内容及目录组织结构

遥感影像解译样本数据包括:存放遥感影像解译样本数据照片属性表、影像实例属性表、照片和影像实例关系表的SMPDATA.mdb文件;实地照片文件(.jpg);影像实例文件(.tif、.tfw、.xml)。当地面照片文件和遥感影像实例文件较少时,可以省级任务区为单位将各县级测区的样本数据合并保存在省级任务区子目录中。每个省级任务区子目录命名方式为:“SMP”+省级行政区划6位数字代码,如SMP130000,三类文件放置于同一个目录下。当地面照片文件和遥感影像实例文件较多时,按照“SMP”+省级行政区划6位数字代码目录和“SMP”+测区代码目录进行组织,如SMP130123,三类文件应放置于同一个目录下[1]。图1展示了遥感解译样本目录的组织结构框架。

图1 样本数据成果目录组织结构

2 地面照片采集相关要求

2.1 数量要求

监测工作中,应按照一定的拍摄比例采集外业调查路线上实际变化发生处的实地地面照片,具体比例可根据外业工作量进行确定,外业核查变化图斑数低于总变化图斑数20%的,实地照片拍摄比例应不低于60%。每个县级测区范围内,对于所有新增图斑,其对应的每种覆盖类型(最细一级类)一般至少应采集1个典型样点,形成地面照片和遥感影像实例构成的完整解译样本数据[2]。该规定的出发点是:在确保成果质量的总要求下,不对外业作业量进行具体规定,因此对外业的有效性进行了强调。如果外业调查路线对变化图斑的覆盖率超过20%(外业路线左右各2 km缓冲区覆盖的变化图斑占总变化图斑数的比例),可以不受上述60%指标的限制。

2.2 质量要求

拍摄时应尽可能水平持握相机,使其保持正常姿态,避免照片信息失真,因而误导使用者。特殊情况下,相机俯仰角或横滚角大于10°以上时,记录其值。应尽可能拍摄离相机200 m范围以内的景物,避免照片与遥感影像实例之间的空间对应关系失真,难以到达只能通过远距离拍摄的景物。拍摄距离大于200 m时,应估测拍摄距离并记录。可以现场估测,也可以内业确定拍摄对象位置后测算其与相机位置之间的距离得到。对于同一地物,可以采用不同角度、焦距拍摄,以便充分反映地物形态,从而提高照片的信息量。地面照片应尽可能使用精细模式保存,总像素数量应在200万像素以上。由于数据量原因,不建议采用过大的总像素数量,建议一般控制在1 000万像素以下[3]。地面照片的长宽尺寸不做限定,可根据相机情况合理设置。此外,拍摄的照片应地物清晰、主体明确、明暗适中,与主题无关或质量欠佳的照片应在整理时剔除。

图2 水田近景拍摄

图3 水田远景拍摄

3 样本数据库整理技术要求

遥感影像解译样本数据库由记录地面照片属性及文件名的PHOTO数据表、记录遥感影像实例属性信息及文件名的SMPIMG数据表以及反映地面照片和遥感影像实例对应关系的关系表PHOTO_IMG 3个表格构成。样本数据库整理时务必满足如下要求:

1)地面照片文件的文件名与PHOTO数据表中的PHID属性值必须一致。

2)地面照片采用JPG格式,后缀名为“.jpg”。文件名必须符合规范规定(PH+14位为时间:YYYYMMDDHHMMSS+7位经度:DDDMMSS+6位纬度:DDMMSS+3位照片方位角:DDD,方位角取值需在[0,359.99]之间),且与PHOTO数据表中属性值对应关系一致[4]。

3)遥感影像实例应确保其数学基础、坐标及投影信息务必正确,各文件能够正常打开,并保证文件没有多余,且文件名与SMPIMG数据表中的IMGID属性值必须一致。

4)遥感影像实例文件采用TIF格式,后缀名为“.tif”。文件名必须符合规范规定(前2位RS,后面30位与地面照片命名方式一致,方位角取值也需在[0,359.99]之间),且与SMPIMG数据表中属性值对应关系一致。

5)遥感影像实例与地面照片的对应关系必须保持一致,重点检查两者方位角是否相符合,如图4所示。

图4 CC码为0833的地面照片和遥感实例关系图

6)遥感影像实例的裁切范围及裁切大小应符合生产规范(裁切长宽:511×511像素或1 023×1 023像素),且位置正确。

7)遥感影像解译样本数据库结构必须与规范要求相一致(检查SMPDATA.mdb数据库的3个数据表:PHOTO数据表、SMPIMG数据表和PHOTO_IMG关系表是否创建,以及各字段属性名称、属性类型和字段长度的定义是否正确)。

8)生成解译样本点的位置必须与解译样本数据库中样点地理环境描述相一致[5]。

9)遥感影像解译样本数据库中SMPIMG数据表和PHOTO_IMG关系表的所有属性项不能为空。

10)SMPIMG数据表中解译样本四角点坐标必须按左上、右上、左下、右下的顺序填写。

11)关系表PHOTO_IMG中的PHID属性值必须与PHOTO数据表中的PHID属性值一致;IMGID属性值必须与SMPIMG数据表中IMGID属性值一致。

12)遥感影像解译样本数据的分类码、影像类型、影像分辨率值域必须正确。

13)影像及照片的拍摄时间属性值需要采用年月日的时间组合方式,并且采用完全表示法的扩展格式:YYYY-MM-DDTHH:MM:SS[6]。

4 普遍性问题列举

4.1 影响入库和应用的问题

样本数据库中直接影响入库的问题表现在:①样本文件命名不符合规定要求(如:PHOTO数据表中PHTM、LONG、LAT、AZIM字段值与文件命名不符)[7];②PHOTO_IMG关系表或SMPIMG数据表内容为空;③遥感影像实例数学基础为地方坐标系,而非CGCS2000坐标系;④数据所在任务区不正确。

对于影响应用的问题主要表现在:①SMPIMG数据表中记录的遥感影像实例四角点坐标错误(原因:利用tfw中记录坐标计算的四角点坐标与填写值差异较大);②遥感影像实例的投影信息文件xml记录的内容错误(原因:记录的内容是规定之外的内容)[8];③遥感影像实例的投影信息文件xml记录的中央经线错误(原因:记录的为地方坐标系的中央经线;“Central_Meridian”为“central_meridian”,首字母未大写);④遥感影像实例无对应地面照片。

4.2 其他不符合规定的问题

样本数据库中其他不符合规定的问题主要体现在:①地面照片的拍摄时间在实际拍摄时间之前(比如:2000-01-01T10:12:13,1970**,1999**);② SMPIMG数据表中SRCBAND字段值与遥感影像实例波段数不一致;③PHOTO数据表DOP、AZIMP项分别记录位置定位平面精度水平、方位角准确程度,但填写值为0,不符合实际情况(原因:如果缺省,应为空,而不能填0);④PHOTO_IMG关系表FDATE字段记录最后检查完成日期,填写为2010-05-31(原因:此时间早于样本数据采集时间)[9];⑤相机横滚角超过90°,相机俯仰角超过90°;⑥遥感影像实例采用GeoTiff格式,坐标加了带号;⑦PHOTO数据表字段定义顺序与规定不符。

5 解译样本质量控制措施

5.1 检查内容及具体检查项

检查内容包括数据完整性、数据组织、数学基础、数据文件名及格式以及数据内容。对于地面照片,应检查地面照片文件格式与命名是否正确、文件是否能够打开;对于遥感影像实例,应检查遥感影像实例文件格式与命名是否正确、数学基础是否正确、坐标及投影信息数据是否正确、各文件是否能够打开、遥感影像实例裁切范围是否合适;对于遥感影像解译样本数据库,则应检查SMPDATA.mdb数据库的3个数据表:PHOTO数据表、SMPIMG数据表、PHOTO_IMG关系表是否创建、属性名称定义是否正确、属性类型定义是否正确、3个数据表中属性项的必填项是否有错漏、属性项的可选项是否有错、属性项的可选项为空时需统计的空值数目。

5.2 检查单元缺陷分类

表1 检查单元缺陷分类

对于以下两类错误,在检查总体情况中说明,不作为检查单元个体错误:①SMPDATA.mdb数据库缺失、数据表定义错误、属性项定义错误;②同一任务区的地面照片与遥感影像实例文件不对等。

6 结 语

遥感影像解译样本制作是一项新任务,是地理国情监测的主要成果之一。影响遥感影像解译样本数据整理的因素很多,笔者结合多个测区的生产经验,阐述了地面照片采集的工作要点,并对遥感解译样本数据的处理方法及常见问题作了较为详细的归纳与总结,同时也提出了质量控制措施,对相关工作的规范化作业具有参考价值,也对提高样本制作效率和样本质量具有重要意义。

猜你喜欢
数据表实例样本
用样本估计总体复习点拨
湖北省新冠肺炎疫情数据表
基于列控工程数据表建立线路拓扑关系的研究
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本
图表
完形填空Ⅱ
完形填空Ⅰ
基于VSL的动态数据表应用研究