表情识别系统中的人脸特征点定位算法研究文献综述

 2023-08-15 17:10:05

文献综述(或调研报告):

在人脸特征点定位的研究领域,目前主流的方法大致可以分为基于深度学习的人脸特征点定位方法和基于回归的人脸特征点定位方法。而在此之前,主流的方法是基于形状和纹理模型的人脸特征点定位方法,这种方法由于需要密集扫描和大量比对,运算量大,并且效果欠佳,已经基本被淘汰。

基于回归的人脸特征点定位的方法是近几年的一个研究方向,可以看作是主动形状模型(Active Shape Model)ASM[1]算法相关改进的另外一个方向,就是对形状模型本身的改进。使用回归的方法是通过学习回归函数,根据输入的图像特征,通过回归函数直接得到较为准确的人脸特征点位置,比起传统的基于模型的方法,基于回归的方法避免了大量对获取图像纹理的计算,因此可以提高定位速度。Xiong X等人在2013年的论文中提出的监督梯度下降(Supervised Gradient Descent, SDM)[2]方法,通过回归矩阵学习从SIFT特征到人脸特征点位置之间的回归映射,在人脸特征点检测领域影响很大。之后针对SIFT特征提取耗时的特点,Sun J等人接连提出了改进方法[3],这些方法使用了更简单的形状索引特征以及基于决策树的回归方式,配合以级联的流程,使得人脸特征点定位的速度和精度都有了提升。

基于深度学习的人脸特征点定位的方法是近两三年以来的一个研究方向,香港中文大学的汤晓欧教授团队2013年提出DCNN方法[4],利用卷积神经网络(Convolutional Neural Network, CNN)将5个关键点的定位精度提升到很高的水平,之后基于深度学习的方法逐渐取代了基于形状索引特征和决策树的传统回归方法。2013年之后的一些研究也都是釆用了深度学习、级联和回归的框架,针对精度、速度和多任务回归等不同的研究方向提出了对应的解决方案。而基于深度学习的人脸特征点定位方法己经成为当今的主流方法。并且深度学习的应用领域远不止于此[11]。

即目前来说,主要的人脸特征点定位算法可以细分如下几类:

  1. 基于灰度信息的方法

人脸上的五官附近区域例如眼睛、鼻子、嘴巴等区域在图像上最为明显,该区域的像素灰度分布存在某种模式,特点较为明显,因此可以通过灰度分布的特点快速找到这块人脸的核心区域,在核心区域内对特征点进行匹配相比于在全脸区域进行匹配要容易许多。

  1. 基于先验规则的方法

人脸外形千差万别,但是人脸的结构都是一致的,五官的相对位置也都是确定的,这些先验规则可以应用到人脸特征点定位问题中,即先对图像做一些变换,使得要寻找的目标特征得到强化,然后根据先验规则定位特征点。

  1. 基于几何形状的方法

典型的基于几何形状的方法是ASM[1]和AAM以及其一些算法的提升BAM(Boosted Appearance Model)[11],主要过程是根据人脸的形状结构构造一个参数化模型,这些参数包括尺度、角度和位置,参数表示了人脸形状中的可变部分。最后设置一个目标函数用来评判搜索结果和事先建好的模板的匹配程度大小,通过调整参数找到目标函数的最优解。

  1. 基于统计的方法

这种方法主要是把特征点定位的过程看成是一个分类问题,以特征部位的图像作为正样本,把特征部位之外截取的图像样本作为负样本,进行分类器的训练。基于统计的方法主要有PCA、SVM、Adaboost、模板匹配等。

  1. 基于回归的方法

基于回归的方法在2010年以后开始流行,主要过程是把人脸特征点定位问题看做是对特征点坐标值的回归问题,通过合理选择特征和回归函数训练回归模型。基于回归的方法具有精度高和速度快的优点,是目前比较主流的人脸特征点定位方式之一,近几年的很多重要的学术会议以及权威期刊上都发表过使用回归方法进行人脸特征点定位的相关文章.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版