大气污染指数与多气象因素的相关性及其预测文献综述

 2022-11-18 11:06:59

文献综述

摘 要:近年来,全国大面积、高频率、持续出现的雾霾天气成为了城市居民日常生活关注的焦点,国家也对此高度关注和重视。由于雾霾成因比较复杂,关于雾霾成因以及其形成条件的研究和分析还不成熟,这主要是因为雾霾天气的形成与其地理以及城市发展规划有着紧密的联系。不同城市因为地理环境以及其相关产业、城市规模等城市特点的不同,其大气污染的成分及其形成均有不同。目前主要的研究多集中于中国北部地区的城市,其关于大气污染的研究并不完全适合于中国南方发达地区出现的高强度持续性的污染情况。本文基于最近两年南京全年的大气污染物质量浓度以及相关气象数据,建立基于气象数据的预测模型。分别应用多元线性回归、时间序列分析、支持向量机等分析方法,以大气污染物质量为例进行研究、分析和预测。

关键词 大气污染 时间序列 支持向量机 气象预测

改革开放以来,我国的经济高速发展着,取得了举世瞩目的成绩。但是在这高速发展的背后,因为技术、管理、意识等方面的局限,空气污染逐渐成为一个影响人们日常生活的严重问题。2012年底至2013年初,我国出现了大范围持续性的雾霾天气,引起了举国上下的关注。2013年,全国平均雾霾天35.9天,华北、黄淮、江淮、江汉、江南、华南等地区均遭遇严重雾霾天气,受影响面积约占国土面积的四分之一,六亿余人生活受到影响[1]。面对日益严重的雾霾问题,各地各级政府均出台措施治理大气污染。国务院和国家环境保护部先后出台了《重点区域大气污染防治“十二五”规划》《大气污染防治行动计划》等文件。政府更是在借鉴国外经验以及国内实际情况的基础之上,将评价指标由原来的API改为AQI,并首次将PM2.5纳入检测范围。

针对大气污染物的观测与研究表明,大气污染物的浓度不仅仅与污染源有着密切的关系,同时还受到地区气象因素的多重影响[2,3,4,5]。由于雾霾天的成因及原理的研究尚有很多问题所以对其浓度及形成的预测至今仍是一个难题。

目前,环境预测主要可以分为逻辑判断预测以及数学判断预测。逻辑判断预测主要是基于个人的经验以及结合历史的推断来进行预测。这种方法相对容易实施,但精度不高,同时因为是以经验为基础的判断,所以引入了主观因素,导致其结果在较大程度上受预测者的经验和能力的限制。而数学预测则是借助于数学语言,通过抽象的数学语言表示具象的实际情况,利用模型以及相关的数学推断方法,对环境进行预测,这种方法较逻辑判断更为客观同时在假设准确的前提下,其所得结果往往更为精确。但是这种方法也有缺点,在缺乏有效数据或者对于数据理解收集不足的情况下,我们往往会做出错误的假设或者将重要的因素视为噪声忽略,导致我们的模型不准确或难以建立与修正。当前对于城市大气污染物浓度的预测研究主要是基于污染物的排放量进行研究分析[6]。而之后,随着各种统计分析,统计学习的新方法的出现以及应用,关于大气污染物的浓度预测出现了多种统计预测模型,如多元统计分析、灰色预测GM(1,1)、神经网络预测以及支持向量机的预测方法。

多元统计分析法。该方法主要用于研究多个变量或因素之间相互依赖的统计规律性,它能在多个变量和指标相互关联的情况下分析彼此之间的统计规律。将其应用至大气污染物浓度预测中,可考虑大气污染物浓度与环境因素之间的相关性,通过聚类方法来分析、判定预测模型中各要素的关系,从而实现对大气污染物的定量分析、预测。黄国和[7]通过地区31个环境单元,分析各单元中的5个大气污染指标和3个环境污染指标之间的相关性,应用聚类方法对各指标进行判别、蹄选,探索了大气污染物与各影响因子之间存在的相关性,最终实现了定量化预测, 结果表明预测结果有较高的准确度。王晓鹏和曹广超[8]利用主成分分析法,结合层次分析、聚类分析以及判别分析等多元统计分析方法,,建立一种将主、客观指标赋权方法优点相结合并可准确可靠地判定样本点环境质量级别的大气环境质量评价模型,并对个大气环境质量样本进行了评价,结果表明:这是一种适合于大气环境质量综合定量评价且切实有效的方法模型,构造的大气环境质量综合指数有较强的实践价值。于涛等[9]对与兰州市大气环境质量有关的诸多影响因子如:经济发展、能源消耗等进行了综合数理统计分析并建立了多元统计模型,最终得出了影响城市环境质量的两类因素:第一类主要包含社会经济发展、能源消耗以及空气污染因素;第二类主要包括气象因素,其预测结果在环境和统计意义上均具有较强的可信度,拟合性较好。

灰色GM(1,1)预测模型。灰色GM(1,1)利用预测对象本身的时间序列进行预测,是一种一阶单变量指数模型,其预测曲线形状简单,所需预测样本少。赵勇和孙中党[10]运用灰色系统理论建立了郑州市质量浓度的灰色GM(1,1)预测模型,其结果显示当前影响大气污染物浓度的主要因素是家庭用气,并分析得出了的NO2预测值和变化趋势,认为灰色GM(1,1)预测模型精度较高。李宏伟和苑兴伟[11]利用阜新市年的环境监测数据,通过构建灰色GM(1,1)模型,对大气污染物的浓度变化规律进行了预测,结果表明,所建立的模型精度较高,预测效果较好,可为控制区域的大气环境质量提供依据。戴华伟[12]等应用灰色GM(1,1)模型群,对深圳市主要大气污染物浓度的未来变化趋势进行了预测分析,并得出了深圳市最近几年的环境空气质量情况,反映了深圳市对于环境治理的成果。其所建立的灰色GM(1,1)模型群具有一定的实用价值和评测意义。

神经网络预测法。通过对大量污染物资料的分析[13,14],发现大气污染物含量的变化具有较强的非线性特性,要对其进行较为准确的预测,就必须采取能捕捉非线性变化规律的预报方法,而人工神经网络正是一种描述和刻画非线性现象的强有力工具。该方法是国内外人工智能领域研宄的热门方法,其不需要确切的输入和输出之间的函数关系,而是通过对海量数据进行训练和学习,以此来完成模拟过程,并通过训练好的网络来对输入数据进行预测。McKendry[15]用神经网络模型预测了加拿大菲莎河谷下游区域PM10和PM2.5的小时平均质量浓度。石灵芝,邓启红,路婵[16]利用神经网络模型预测了湖南长沙火车站小时平均质量浓度,研究结果表明:与传统的多元线性回归模型相比,人工神经网络模型能够捕捉污染物浓度与气象因素间的非线性影响规律,能更好地预测PM10质量浓度,拟合优度R2有较大提高。这些研究都取得了想到好的效果。尽管神经网络具有非线性拟合能力较强,学习规则简单,可映射任意复杂的非线性关系等优点,但其在解决网络结构的确定、过拟合和局部极小等问题上存在较大困难。

支持向量机。支持向量机是由Cortes和Vapnik[17]等于1995年首先提出并迅速发展起来的一种机器学习算法。它是基于统计学习理论的新一代机器学习技术, 其非线性回归预浏性能优越于传统统计方法。支持向量机基于统计学习中结构风险最小化原则,实现经验风险和置信范围的最小化,可有效地应用于小样本、非线性和高维模式识别等问题的解决。刘杰[18]曾利用支持向量机与多种统计方法相结合的形式建立模型较好的预测了北京市大气污染物浓度的变化。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版