欢迎访问金谷下载网 专业电脑手机游戏绿色软件网站

资讯|最近更新

当前位置:首页软件教程软件信息资讯 → 捷速ocr文字识别软件识别过程介绍

捷速ocr文字识别软件识别过程介绍

时间:2014-11-30 13:00:49人气:作者:本站作者我要评论

捷速ocr文字识别对于一些经常处理图片文字的朋友们应该很熟悉,小编在之前也介绍了捷速ocr文字识别软件的使用方法,捷速ocr文字识别软件的过程包含几个步骤,下面小编就详细介绍捷速ocr文字识别软件的识别过程吧。

第一步:

是指通过输入设备将文档输入到计算机中,也就是实现原稿的数字化。现在用得比较普遍的设备是扫描仪。文档图像的扫描质量是OCR软件正确识别的前提条件。恰当地选择扫描分辨率及相关参数,是保证文字清楚、特征不丢失的关键。此外,文档尽可能地放置端正,以保证预处理检测的倾斜角小,在进行倾斜校正后,文字图像的变形就小。这些简单的操作,会使系统的识别正确率有所提高。反之,由于扫描设置不当,文字的断笔过多可能会分检出半个文字的图像。文字断笔和笔画粘连会造成有些特征丢失,在将其特征与特征库比较时,会使其特征距离加大,识别错误率上升。

第二步:

扫描一幅简单的印刷文档的图像,将每一个文字图像分检出来交给识别模块识别,这一过程称为图像预处理。预处理是指在进行文字识别之前的一些准备工作,包括图像净化处理,去掉原始图像中的显见噪声(干扰)。主要任务是测量文档放置的倾斜角,对文档进行版面分析,对选出的文字域进行排版确认,对横、竖排版的文字行进行切分,每一行的文字图像的分离,标点符号的判别等。这一阶段的工作非常重要,处理的效果直接影响到文字识别的准确率。

第三步:

单字识别是体现OCR文字识别的核心技术。从扫描文本中分检出的文字图像,由计算机将其图形、图像转变成文字的标准代码,是让计算机“认字”的关键,也就是所谓的识别技术。就像人脑认识文字是因为在人脑中已经保存了文字的各种特征,如文字的结构、文字的笔画等。要想让计算机来识别文字,也需要先将文字的特征等信息储存到计算机里,但要储存什么样的信息及怎样来获取这些信息是一个很复杂的过程,而且要达到非常高的识别率才能符合要求。通常采用的做法是根据文字的笔画、特征点、投影信息、点的区域分布等进行分析。

第四步:

后处理是指对识别出的文字或多个识别结果采用词组方式进行上下匹配,即将单字识别的结果进行分词,与词库中的词组进行比较,以提高系统的识别率,减少误识率。


相关文章

  • 微信一手机号可注册两账号 微信全面支持注册小号

    经过一段时间的小规模测试,微信终于全面支持注册“小号”了!同一个手机号能再次多注册一个辅助账号,这样的新功能能够更好的对微信账户进行管理,但是想要注册小号也是有条件限制..
  • Midjourney使用方法 Midjourney怎么付费

    Midjourney V5测试版本已经推出,目前大家可以直接在这个网站社区进行AI绘画,V5的精美程度堪比真人照片了,不过有很多国内的小伙伴们不知道如何使用,这里小编带来比较详细的操作..

网友评论

推荐文章

关于金谷下载网 | 联系方式 | 发展历程 | 版权声明 | 下载帮助(?) | 广告联系 | 网站地图 | 友情链接

Copyright 2020-2029 JGSC.CC 【金谷下载网】 版权所有 豫ICP备17041013号-5 | 豫公网安备 42033302000245号

声明: 本站所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告