基于MATLAB的图书封面的图片文字提取识别技术研究文献综述

 2022-12-09 21:08:39

开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)

一、选题的依据及解决的问题

图书馆,是现今读书人都会去的地方,因此,图书馆的管理工作也越发重要。近年来,图书馆管理图书多借助图书二维码、条码等进行管理。然而,在录入图书的过程中,往往需要人为手动输入图书的出版社、作者书名等各种信息。在此环节中,由于人为因素时常会造成错误以及延迟记录。如果能通过图片处理,直接通过扫描书籍的图片,自动提取书本的作者以及出版社名,会节约很多时间以及人力,故基于此设想提出本课题。

由于Matlab是当今国际上科学界最具影响力的语言之一,也是最具活力的软件之一。借助MATLAB实现对图片的处理,利用sobel、prewitt、roberts、zerocross、log以及canny等算子,对图像进行边缘提取。利用提取出的图像,进行文字匹配识别。由于在书本的封面、封底、侧面,出版书册都会标识作者姓名以及出版社名,书底还含有书的编号条码,通过此图片文字自动提取存取系统,可以方便快速的进行存取工作,极大节约了人为输入数据库的工作量以及所耗的时间,方便图书馆管理工作。

二、研究方法和技术路线

本研究是基于Matlab软件,利用Matlab进行图片处理工作。为了进行图像的预处理工作,先将所有图像按照统一格式转换为灰度图像。通过此操作后,再对图像进行降噪处理。通过调用Matlab图像处理工具箱的滤波器,拟使用均值滤波器、中值滤波器等达到滤波效果。接下来将采用图像边缘轮廓提取技术,使用Matlab工具箱中的egde函数,利用sobel、prewitt、roberts、zerocross、log以及canny等算子,对图像进行边缘提取。接下来进行字符分割,然后字符匹配识别。最后将数据自动存入数据库中。

三、论文课题研究进度安排

2015年3月1日----3月15日 确定选题,查阅文献。

2015年3月15日----3月26日 撰写开题报告。

2015年3月27日----5月1日 进行调查、收集资料、进行分析设计。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版