基于智能优化的有限混合模型图像分割算法研究文献综述

 2022-11-30 15:24:38

文 献 综 述

  1. 概述:

图像分割是计算机视觉中一个古老而基础的研究课题,它已经成功应用于很多领域,同时它是特征提取图像和图像理解研究的基础,因此图像分割受到越来越多研究人员的关注。图像分割就是把整个图像划分为一些有意义的区域的过程,在统计领域,图像分割又被称为聚类分析。

聚类分析是一种在缺少先验知识的条件下将一个数据集划分成若干个更小更相似的子集(称为类或簇)的方法,使同子集中的数据彼此相似,而不同数据的子集中彼此相异,而其本质上就是寻找聚类的目标函数最优解的优化过程。基于模型的聚类分析是以概率统计理论为基础的一种灵活而有效的聚类方法,它的基本策略是先利用凝聚层次聚类的方法对数据集进行初始划分,再采用EM算法进行模型参数估计,实现聚类结果的优化,最后利用贝叶斯信息结果准则(BIC)筛选出最佳模型及聚类数目,它的框架是有限混合模型。

然而现阶段使用的有限混合模型存在对于噪声敏感、没有有效的边界支持等问题,因此我们需要构建一种新的模型来适应不同形状观测数据的灵活性,例如非高斯和有界支持数据。同时将新构建的模型应用于不同的智能优化算法进行聚类分析,本项目对于推动有限混合统计模型的应用研究具有重要的理论与实际意义。

  1. 综述:

目前已经有很多国内外学者研究出了各类基于统计的图像分割方法,其中代表性的有Mean shift,有限混合模型(Fininte Mixture Model,FMM)以及基于概率图模型等方法。Mean shift最初是由Fukunaga提出并将其用于估计概率密度函数的一种统计迭代方法。Cheng将Mean shift扩展到了核函数空间并定义了权值函数。Comaniciu等人在图像特征空间中使用了Mean shift并成功将其应用于图像分割与图像平滑。Mean shift适用于任何形状的数据,但是其算法复杂度比较高。FMM由于其原理简单并且容易实现,并且它能够对许多复杂现象进行建模,因此FMM被广泛应用到多种实际应用中。FMM是对同一类型概率分布函数的线性叠加。FMM中重要代表高斯混合模型(Gause Mixture Model,GMM)和学生t-分布混合模型(Student-t distribution Mixture Model,StMM)已经成功应用于图像分割并取得了较好的分割效果。但是在噪音条件下,这两种混合模型得到的分割效果差强人意。这主要原因是FMM图像像素之间的关系是相互独立、统计无关的。而在实际应用中,像素的位置在图像处理中扮演了十分重要的角色。基于概率图模型的方法分为两种方式,第一种是基于有向图的贝叶斯网络(Bayesian NetWork,BN)和第二种基于无向图的马尔科夫随机场(Markov Random Field,MRF)模型,无向图模型能够表示随机变量之间的非因果关系,作为MRF模型的一个扩展,条件随机场(Conditional Random Field,CRF)是另外一种无向图模型。基于统计方法的图像分割也是属于全局优化的一种方法。

针对构建模型的问题,目前我们常用的模型有高斯混合模型(GMM),Studentrsquo;s-t混合模型(SMM),广义高斯混合模型(GGMM),拉普拉斯模型(LMM)等,但是上述混合模型的一个缺点是它们的分布是无界的,支持范围为负无穷到正无穷。然而我们在许多实际应用中观察到的数据总是落在有界支撑区域内[20]。 例如,在信号处理领域,功率谱是半有界的;在图像计算机视觉领域,像素通常在有限的范围内。对此Thanh Minh Nguyen等人提出了广义边界高斯混合模型(BGGMM),这种新的分布具有适应不同形状的观测数据的灵活性,例如非高斯和有界支持数据。Jonathan Wu等人针对GMM模型中隐马尔科夫随机场(HRMF)存在的噪声影响问题,对其中的参数进行改进,这使传统的高斯混合模型对噪声更具鲁棒性,同时考虑了局部空间信息与像素强度值信息之间的关系。图像像素的条件概率受其紧邻区域中的像素概率的影响,以合并空间和强度信息。在这种情况下,可以将参数beta;分配给较小的值以保持非噪声图像中的图像清晰度和细节。

针对模型求解问题,Scott和Symons是最先采用基于模型的聚类方法的人之一。假定一个类中的数据服从正态分布,他们的方法等价于一些普遍使用的在类的协方差矩阵上带有各种系统参数的聚类准则。不过,从估计点的角度来说,这个方法产生了不一致的参数估计量,比如Bryant、Williamson以及McLachlan。Wolfe和Day认为,这种不一致可以用混合似然形式避免,这种混合似然形式假定在数据上加上了观察数据来自于哪一个混合分支的信息(不可观察数据),这里混合分支与类是一致的。有限混合模型后来逐渐用于给要聚类的多种随机分布的数据集建立模型,如Bohning,McLanchlan和Peel,以及Fruhwirth-Schnatter最近所著书中及其文献所述。早期的关于混合模型的文献可以在Everitt和Hand,Titteringtion等,McLachlan和Basford,以及Lindsay以前的著作中找到。关于混合分支数的估计,Lavine和West(1992)讨论了如何将判别和分类Bayes方法用于高斯混合模型,其后验概率通过迭代的二次采样方法获得。关于混合模型参数估计,Bilmes.J已经实现了用基于极大似然估计的EM算法去估计正态混合模型的参数,后来Figueiredo和Jain又提出了用改进后的EM算法去估计正态混合模型的参数。为了解决传统的高斯混合模型由于忽略了空间信息和未考虑分割结果的分布情况导致模型不完整等问题,梁恺彬等人把分割结果的概率密度函数作为隐含数据引入到高斯混合模型,建立了非线性加权的隐高斯混合模型;

尽管基于混合模型的聚类算法已经有许多成功的应用,但目前在实际应用中仍然存在许多难以解决的问题。

首先,在已知模型分支数的前提下,如何去估计混合模型的参数。参数估计方法主要是计算混合模型极大似然估计的EM算法及其诸多改进版本。这就涉及到如何有效客服EM算法的初始敏感性、如何改善EM算法收敛到局部极值点的缺陷以及如何提高EM算法的收敛速度等问题,这些问题是目前许多文献研究的热点。

其次,如何选取混合模型的最优分支数。选取方法主要是优化基于贝叶斯理论(Bayesian)和信息编码原理的准则,如BIC、AIC、LEC、MML等。数据量较小时,可以采用基于模型的凝聚层次聚类方法或局部搜索策略,先估计出数据集可能划分的最大成分数目,然后用模型选择准则选出最优成分数。对于多元高斯混合模型,判断其最优混合成分数目仍然很困难,典型的解决方法是不同混合成分的模型进行多次迭代,从而选取其中的最优值。但这一问题至今仍未解决。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版