文 献 综 述
摘要:本文主要分三个部分描述了基于云平台的海量高光谱数据管理系统的相关知识,第一部分主要描述了当前高光谱数据管理系统的现状;第二部分主要讲解高光谱遥感的一些基本概念,同时介绍了高光谱数据管理系统的两个部分,即数据库设计与数据处理与分析系统;第三部分则说明了云计算以及HDFS的相关概念。
关键词:高光谱遥感 云计算 Hadoop HDFS
一、选题背景
随着社会与科学的不断进步,卫星遥感技术、星载/机载高光谱遥感探测技术也随之发展,给我们带来了成为科学判断、预测的重要依据的高光谱遥感数据,这些高光谱遥感数据具有很高的光谱分辨率,能在电磁波谱的可见光、近/中/热红外等波段范围内获取许多非常窄的光谱波段信息,从而得到光谱连续的影像数据,这些数据已经成为国土资源利用、农业遥感、大气研究、环境监测、地质勘探等领域的重要手段,高光谱遥感影像的应用领域已经覆盖了地球及相关科学的方方面面,是当前对地观测领域研究的国际前沿。
近年来,高分辨率遥感影像数据应用的不断深入,大规模数据密集型计算及计算密集型计算应用需求也不断出现,高光谱遥感探测任务每天产生的巨大数据量给遥感数据的存储和管理带来了巨大的挑战[1]。现有的单机环境很难满足这类海量遥感数据的存储和高效处理需求。因此如何采用新的技术来开发一个能有效管理高光谱遥感影像数据的影像管理系统,提高空间信息的数据存储、管理和应用能力,是当前高光谱快速发展和深入应用的一个重要问题之一。近年来,云计算技术的不断成熟与发展,为高分辨率遥感影像快速获取及高效处理提供了一种新的可能,建立分布式的高光谱遥感数据存储、共享、管理以及高性能的应用集成变得尤为重要[8]。本课题针对上述问题,在Hadoop云计算平台上研究高光谱遥感图像的存储组织与管理方法,利用HDFS的分布式存储能力,设计高光谱遥感数据管理系统,实现海量高光谱遥感数据的高效组织与管理。
二、基于云计算的遥感数据处理研究现状
高光谱遥感影像分类是在常规多光谱遥感影像分类的基础上,结合高光谱影像的特点进行目标区分和识别的过程,是对遥感图像基本分类方法的扩展与延伸[3]。目前,国内外学者一方面充分利用模式识别、机器学习等领域的最新发展和先进算法,另一方面充分挖掘高光谱遥感数据隐含的丰富信息和特征,发展了一系列分类技术[5]。着互联网技术的发展,IT 资源的使用、应用和服务模式不断地发生演变。云计算技术以其弹性服务、资源池化、按需服务、服务计费、泛在接入五大特点,成为近年来IT界的一个研究热点[13]。
云计算现在已经成为目前用来解决高性能计算、海量数据存储、分布式应用、异构服务集成、按需提供服务等问题的主要途径[12]。云计算遥感应用方面,也有许多积极的 探索,ESRI、Google、中国科学院遥感应用研究所、中国科学院计算技术研究所等都进行了探索性和基础性的研究工作,证实了云计算技术应用于遥感领域的可行性。基于云计算技术,可将遥感数据、信息产品、处理技术与计算资源打包成类似公共设施(如自来水和电力等)的可计量的服务,提供给用户通过网络或移动终端随时随地按需使用,解决遥感应用中的数据、技术、设备、成本和人员的瓶颈,实现遥感信息技术在政府和公 众日常业务中的普及应用[16]。
三、高光谱遥感—原理、技术与应用
