光学字符识别(OCR)是印刷或书写的文本字符,光学扫描成位图字符代码,如ASCII的翻译。这是把硬拷贝材料成可以编辑和以其他方式操纵的计算机上的数据文件的有效方法。这是长期使用图书馆和政府机构进行冗长的文件快速电子方式提供的技术。在OCR技术的进步已通过企业带动了越来越多的使用。对于许多文档输入任务,OCR是最具成本效益和快速的方法可用。每年,该技术可释放亩的存储空间,一旦放弃对文件柜和箱子全纸质文件。之前的OCR可以使用,在源材料必须使用光学扫描器(有时在PC的专用电路板)来读取在页面作为位图(点图案)进行扫描。软件识别图像也是必需的。
我们的软件旨在解决孤立的手写字符和UJI笔字符数据集采用神经网络的数字分类。该数据由26个字符和10位样品在Tablet PC上写的11作家。的字符(在标准UNIPEN格式)在上部和下部壳体写入两者并有一整2组每作家的字符。所以输出应在35类之一。最终的目标是建立每个字符一个作家独立的模型。
有价值的特性的选择是字符识别的关键,所以一个新的和有意义的功能集,统一鉴别标准坐标(UDNC),由C.安吉尔介绍,被采用。这些特征表明,以改善使用简单的分类算法,以便它们被用于训练神经网络,并测试其对UJI笔特征数据集的性能的识别率。
关键词:Matlab的,来源,代码,OCR,光学字符识别,扫描文本,书面文字,ASCII字符隔离
要求:
Matlab的
评论没有发现