基于聚类分析对空气质量的研究
摘 要:
随着社会经济的不断发展,工业化程度和城市化水平的不断提高,环境污染的问题的也越来越突出。其中空气污染对我们的生活有着最直接的影响,对我们的身体健康有着不可忽视的危害。空气质量的好坏是通过空气中的污染物的高低来判断的,从侧面反映了空气污染的程度。随着人们对空气质量越来越重视,越来越多的学者针对空气质量展开研究。本文查阅了国内外空气质量方面的文献,在国外主要对某一空气污染物展开针对性的研究,从而来判断空气质量的变化和对社会以及身体的影响。国内学者分别运用函数型数据的研究、决策树、探索性数据分析、K-Means聚类分析、实证分析、固定效应回归模型、BP神经网络等方法对空气质量展开研究,深入分析了影响了空气质量的因素,为本文采用多种聚类方法对空气质量展开研究提供了思路和文献理论基础。
关键词:空气质量、聚类分析、模型构建
- 引言
随着社会的发展,工业水平飞速发展,城市的人口密度也越来越大,与之伴随的是生活污染物和工业污染物的排放增加,我们的生存环境遭到了极大的破坏。资源短缺、环境污染、生态破坏已然成了全球性的三大危机。环境污染问题的加剧,给我们带来了的生命健康带来了很大的危害。震惊世界的十大污染事件,都给我们留下了不可磨灭的印象,也为我们敲响了保护环境的警钟。北美死湖事件,美国东北部与加拿大东南部工业发达,每年向大气中排放二氧化硫2500多万吨。七十年代开始,这些地区出现了大面积的酸雨区,酸雨比番茄汁还要酸,多个湖泊漂浮死鱼,周围的树木枯萎。印度博尔帕公害事件,毒气泄漏,导致2500人死亡,15万人进入医院,20多万人双目失明。雅典“紧急状态事件”,城市内二氧化碳、一氧化碳浓度超标,许多市民出现呼吸困难,呕吐等中毒症状。日本“四大公害事件”四日市哮喘,原因是硫氧化物导致的大气污染。在十大污染事件中,就有6起事件是关于空气污染的,并对我们造成了巨大的健康危害。由此可见,空气质量的检测以及对空气污染的预防干预的重要性。空气的污染,对我们的身体健康造成了直接的危害,人们呼吸道疾病的发生率也逐年增加。空气中的污染物主要是指可吸入污染物、二氧化硫、二氧化碳等物质。空气质量的好坏是根据空气中污染物的多少来判断的。而空气污染受到许多因素的影响,在不同的时间、地点,空气中的污染物浓度也会发生变化。固定和流动污染源的污染物的排放量的大小是影响空气质量的重要因素之一。例如城市中车辆、船舶飞机等尾气的排放,生活中居民废气的排放,垃圾焚烧等,除此之外城市的所在地区地形也是影响空气质量的因素。针对这些因素的研究,可以更好的判断城市的空气质量,为对空气污染的措施和提高空气质量提供有力的帮助。
二、国内外研究方向
随着人们生活质量的提高,人们对生活环境也越来越注重,对空气质量的研究也越来越多,越来越深入。对空气质量的研究,可以更好的让政府对当地的环境做出监测,快速的针对污染物作出相应的措施,对社会决策非常有用,督促人们改善生活习惯,减少污染物的排放。政府增加了对城市空气质量的监测,对空气质量的数据也越来越多。目前,空气质量的研究分析与判断成为了国内外学者研究的重点,并取得了丰硕的成果。
在国外,Chen等人一起采用EPLS模型,通过模式分解,降维,最小二乘投影对城市空气质量进行研究分析。他们提出了一种基于模型的特征提取方法,对空气中的PM2.5进行聚类,综合数据集和空气质量数据集采用不同的聚类方法和相似度度量。发现EPLS模型可以有效的处理高噪声水平和离群空气质量的聚类问题,并适用于各种聚类技术和距离度量。[1]Emily Chang、Kenneth Zhang等人利用美国加州10年来PM2.5水平作为当地空气质量和治理控制县对的衡量标准,对数据进行t检验,以确定治疗控制县对的PM2.5水平知否发生了变化。通过研究发现,拥有炼油厂的县并没有因为美国政府的措施而减少PM2.5的排放,希望政府改善措施法案。[2]Robert M. Banta等人利用回归分析的方法对雷达风廓线仪数据计算的低层大气边界层中最大日臭氧与矢量平均风速进行研究,发现风速与臭氧日浓度峰值具有较强的相关性,差异随着风速的减弱而增大。在风最弱,污染最严重的时候,臭氧浓度连续6年下降,表明在这六年间政府实施的控制策略产生了有益的影响。[3]PG Goodman使用多项式分布滞后模型,对一个中期暴露颗粒物污染和温度的影响进行分析。发现无论是温度还是污染,对心血管疾病死亡率的影响最大,控制空气中可吸入颗粒物的含量可以大大减少柏林呼吸和心血管疾病的死亡率。[4]DJ Jacob、DA Winner两人通过空气质量与气象变量的相关性、化学传输模式的扰动分析,GCM-CTM模拟等多种方法对气候变化对空气质量的影响进行研究分析。发现气候变化会使污染地区的夏季表面臭氧增加,气候变化引发的野火是颗粒物的主要来源等,进一步验证了气候变化对污染地区的空气质量有较大的影响。[5]
在国内,李海蓉利用广义高斯过程函数型回归模型和稀疏采样的函数型聚类方法对我国空气质量时空分布的函数型数据进行研究分析。通过建立函数型非参数回归模型,可以较好的预测和还原现在的能见度距离。对PM2.5浓度进行聚类分析,发现各城市的PM2.5浓度随着季节变化的演变呈现不同趋势。[6]尉倩基于决策树分类算法对2003年至2011年我国31座城市的空气质量和经济发展状况进行研究,根据影响空气质量的基本要素对空气污染进行分类研究,得出决策树分类模型,可以对各个城市的空气质量进行较好的预测,发现可吸入物颗粒物含量,二氧化硫含量和工业粉尘排放量是影响空气质量的主要因素。通过典型相关分析和对比分析,发现不同产业对空气质量的影响。[7]常骑等采用探索性数据分析方法,构建沿黄主要城市空气质量的社会经济影响指标体系,运用BP神经网络改进的DEMATEL模型,研究了影响空气质量的社会经济因素。发现沿黄城市空气质量指数呈“东高西低”的空间分布,工业烟粉尘排放量、人均GDP、工业用电总量和公路货运量对空气质量有较强的影响。[8]崔筱笛等利用全国113个环保重点城市2017年的空气质量数据进行K-Means聚类分析,发现环保重点城市空气质量分布状况具有明显的区域性。[9]王斌会等根据2006-2012年我国31个城市的数据,对空气质量进行系统分析,构建实证分析模型,发现PM10与空气质量之间存在负相关关系,和对空气质量影响不显著,除此之外,发现不同的大气污染物对城市空气质量的影响不同。[10]胡敏等基于固定效应回归模型,在分位数回归的角度下对空气质量污染指标、经济增长和公共交通对空气质量的影响程度进行分析,发现和人均GDP都会对空气质量造成负向影响,而公共交通利用率的增加对空气质量改善有正向推动率。[11]
