基于深度学习的遥感影像分析平台设计与实现

近期,笔者主持开发遥感影像分析平台,阶段成果总结如下,希望能够有所借鉴。

引言

近年来,随着卫星传感器、4G\5G信息通信技术的发展,可以快速获取和存储海量的高分辨率遥感影像已经成为人们观察和研究地球最重要的数据来源之一。高分辨遥感数据也呈现出明显的“大数据”特征,遥感大数据具有容量大、难辨识、多维度和非平稳等特点,如何通过遥感大数据的智能分析和数据挖掘来破解对地观测面临的问题,从而实现人类视野最大限度的延伸,已经成为研究热点[1-3]。目前,通过对航天卫星遥感影像的人工判读是目前国土资源监测采用的主要方法之一。但新型的国土资源监测需要需要开展基于不同分辨率、多时相的连续监测,对于所采集的大量不同来源的影像难以全部通过人工判读的手段进行,因为这种方式不仅需要消耗大量的人力、物力,而且对监测目标状态变化实时感知性差。由此可见,一方面是越来越丰富、越来越大的多源遥感影像数据,另一方面是越来越精细,越来越广泛、实时性要求越来越高的监测要求,这一矛盾已经成为制约国土资源监测质量和水平提升的重要瓶颈。因此,如何摆脱单纯依靠人工影像解译方式,实现对海量的多时相、非同源的遥感影像中智能解译,对创新国土资源监测及城市监管具有重要意义。

早期的影像智能解译,不少研究者将传统的机器学习技术引入到影像的自动判读中,取得了一定的成果。但是这种方法最大难点在于机器难以自主学习样本特征,而需要有丰富经验的业务专家参于确定关键特征,且不同区域、不同地物的特征有很大差异,因此这种方法难以大规模推广。近年来,在神经网络基础上快速发展起来的深度学习技术在影像识别中取得重要进展,同时大规模分布式并行集群计算技术的发展为深度学习推向实用提供了重要基础条件。深度学习最重要的优势是,理论上只要神经网络的层数足够,样本数量与质量满足,通过机器能够自动学习训练影像样本的特征,从而大幅度降低人工介入的工作量。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据。

基于此,本平台设计的主要出发点在于通过深度学习技术从实时采集的高分辨率、多光谱的国土资源影像中自动提取监测目标信息,并自动分析出监测对象的状态变化,做到精准定位与实时预警,创新国土资源监测新方式。

2系统结构

平台系统结构如图1所示。至下而上共分为5个层,分别是:

①网络基础设施层:提供海量遥感影像存储以及实现以遥感影像进行智能提取的计算能力,由分布式存储集群和分布式计算集群组成。

②数据资源层:存储和管理基础地理信息(如行政区划等)、多分辨遥感影像数据库、业务数据库以及用于对数据进行描述的元数据库。

③应用支撑层:包括ARCGIS空间数据引擎、消息中间件、服务注册与发布、应用服务器等。

④平台服务层:平台服务层用以实现平台对外服务。包括目标检测、对监测对象的变化检测、遥感图像的语义分割、空间分析(如空间叠加和缓冲分析)、影像查询服务等。

⑥平台应用层:平台应用层是指平台提供给业务系统的服务调用,包括实现土地利用、执法监察、地灾监测等。

图1 遥感影像自动分析平台系统结构

3遥感影像智能提取技术路线

3.1基于深度学习的格网化的变化检测

在国土资源智能监测中,监测地物因时间的变化是一个关键应用。由不同的时间点卫星拍摄的遥感影像,来判断地物目标的变化,这是属于语义级的变化监测。本文提出先将不同时间点的影像进行配准,然后使用分类的方法对配准的影像块的地物类型进行分类及确定是否变化和变化类型,为了利于计算,以格网为单位。在遥感影像地物目标的分类问题上,一个必须利用到的重要线索是地物目标的上下文信息,地物的上下文信息利用可以辅助地物目标的分类。本文设计可以提取不同尺寸大小的上下文信息的神经网络结构,以更好的对地物目标分类。在同一区域,不同时间点拍摄的遥感影像网格对齐和分类基础上,根据神经网络的输出,来对地物的变化进行推断。

图2 基于深度学习的格网化的地物变化检测技术路线

3.2 基于深度学习的遥感影像实体语义分割

遥感影像的语义分割是根据图像内容对指定区域进行标记的计算机视觉任务,在遥感影像应用于国土资源监测中,需要最常见的农田、道路、农房、建筑物、植被、林地、水体的智能提取,即以像素为基元,在同一张影像中明确每类实体的不同边界,以实现对遥感影像像素级的理解。

在遥感影像的实体分割上,考虑到遥感影像地物实体上下文的复杂的强关联性,本文采用了业界主流的PSPNET[4](即金字塔场景解析网络)算法,这种算法与经典的FCN(全卷积网络)相比,实现了全局场景信息的利用,而PSPnet解决了这个问题,其概述如图3所示:

(a)输入需要预测的图像

(b)通过基础层即(带有空洞卷积的与预训练ResNet)提取特征图,大小是输入图像的1/8。

(c)在卷积层设计上,采用四种不同金字塔尺度的特征,第一行红色的是最粗糙的特征,即全局池化生成单个输出,后面的三行是不同尺度的池化特征。为了保证全局特征的权重,如果金字塔一共有N个级别,则每个级别后使用1×1的卷积层来将对应的语义特征的通道数降为原始1/N,再通过上采样(双线性插值)来将特征图恢复至未池化前的尺寸,并concat到一起。

(d)经过金字塔池化模块来获取语义信息,使用四种不同的层级的金字塔分别获取不同尺度的分割结果,并以上采样方式将其融合为原始特征图大小,从而完成语义分割。

图3 基于金字塔场景解析网络的遥感图像语义分割

4主要界面及实例

根据上述设计,笔者所带领的团队自主研发了基于AI的遥感影像分析平台,目前应用的深度学习算法包括PspNet,Dlink-Net。地理信息基础软件采用ARCGIS 10.5,算法开发采用Python3.5。 以下采用的遥感影像数据是福州市仓山区2018年的高分二号遥感影像数据,分辨率是0.8M。数据分为训练集与测试集,IOU>70%。

图4 建筑物、水体、农田的提取

实例 图5 道路提取实例

5结语

本文论述了基于深度学习的遥感影像自动分析平台的设计和实现,重点包括了遥感影像分析平台的系统结构以及基于语义分割提取遥感信息的关键技术路线。下一步将继续完善平台功能和算法调优,推动国土资源监测实现周期性调查到动态性监测的转型升级。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();