光学字符识别(OCR)系统开发文献综述

 2022-11-30 14:43:30

文 献 综 述

  1. 概述

经过数十年的发展,互联网日益深入人们的生活。人们变得越来越信赖计算机设备传播和获取信息,因此信息处理工作也都转移到计算机设备上进行。也因此需要有一种方法能够实现将文字信息从图像中高速、自动地提取出来的技术,即光学字符识别技术。其基本工作原理为通过照相机、扫描仪等光学设备,将文档资料转换成黑白点阵的图像文件,然后通过光学字符识别引擎将图像中的字符转换成可编辑文本格式,以便进一步进行文本信息处理。OCR 技术的应用范围非常之广,几乎所有需要录入电子数据的地方都能使用,如个人证件、发票、收据、护照、名片、银行账单和邮件等。

  1. 正文

目前光学字符识别应用主要是基于 PC 客户端的,而基于移动设备(如安卓手机)客户端的光学字符识别技术还并不成熟。随着硬件性能的提升和移动设备的不断普及,计算机设备移动化的时代已经到来。安卓操作系统的产生与发展,使得安卓移动设备在市场中占据着极大的份额及其应用越来越广泛。具体,需要先搭建开发环境,而实现过程主要分为图像预处理和字符识别两个部分。

2.1研究安卓平台搭建开发环境

以 Java 语言为主,借助一些具有代表性的集成开发环境(IDE),开发者可以非常方便的调用各种各样的接口函数以及方便的编译和调试测试程序。因此在进行安卓应用程序开发之前,需要在电脑上搭建相关的环境,主要包括 Java 开发工具包(JDK)、安卓软件开发工具包(Android SDK)、Eclipse IDE,熟悉其安装及使用流程。

2.2图像预处理研究与实现

2.2.1图像滤波

P-M 滤波法的去噪模型是根据图像的梯度值决定扩散的速度,图像特征强的地方减少扩散系数,图像特征弱的地方增强扩散系数,是一种非线性的各向异性方法,克服了传统滤波法造成的模糊边缘和边缘位置移动的缺点。而光学字符识别系统需要一种既能抑制噪声,还能很好的保留图像细节的滤波方法。应用 P-M 滤波法作为图像去噪算法,既可降低噪声的干扰,并且更加真实地提取图像的边缘特征信息。

2.2.2二值化

图像二值化的关键在于找到合理的阈值,然后对图像进行阈值分割。计算二值化阈值主要有两类方法,分别是全局阈值法和局部阈值法。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版