一、概述
目前市场上的传统相片管理软件存在功能过于简单、设计不友好、用户体验差、存在隐私安全等问题,而近些年来随着人工智能技术和手机性能的高速发展,利用Tensorflow等深度学习框架在本地实现照片识别与分类成为了可能。基于内容的图像分类方法主要可以分为传统方法和深度学习方法,常用的传统方法又可以分为基于颜色、纹理、形状和空间的四种类别,常用的深度学习图像分类神经网络有AlexNet、VGG-16、ResNet、MobileNet等。
二、图像分类方法
自20世纪70年代以来,图像分类的研究先后主要针对于两种基本方法:一种是采用偏重于人工语义的基于文本的图像分类方法;另一种则是偏重于视觉的基于内容的图像分类方法。
1.基于文本的分类方法
基于文本的分类方法主要是在数据库领域中进行研究,其基本思想就是:先对图像用文本(即关键字)进行标注,然后用这些带有文本标签的数据库管理系统对图像关键字进行分类。这种方法比较简单,但是存在以下几个问题:第一,对图像进行人为手工标注的工作量过大;第二,很多图像是很难用几个简单的文字来描述的;第三,不同的人对同一幅图像的理解也是有差别的,即使是同一个人在不同的时间不同的环境下对同一幅图像的理解也是不一样的,这也会造成分类上的较大误差;第四,世界上各个国家的语言不同,那么建立采用不同的语言文字对图像进行描述的索引也会有一定的障碍。所以,基于文本方式的图像分类存在很大的局限性。
2.基于内容的分类方法
基于内容的图像分类方法是根据图像内容进行分类的,目前已经可以被用户所应用,比较知名的产品有IBM的QBIC、Virage公司的Virage图像搜索引擎、百度的百度识图和MIT媒体实验室的Photobook等等。基于内容的分类方法又可以分为传统的图像内容分析方法和深度学习分类方法。
2.1传统图像内容分析方法
传统的图像内容分析方法对图像进行分类主要分为图像预处理、特征提取以及模式的分类三个部分。
