视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
文字识别原理及文字识别算法-智能识别课程论文
2025-10-05 18:33:27 责编:小OO
文档
深圳大学研究生课程论文

题目 文字识别原理及文字识别算法    

专业    计算机技术                    成绩                       

课程名称、代码  智能识别系统(201013122) 年级 2011任课教师  贾森  

姓名 许永吉       学    号    **********   时间   2012年 12  月 

文字识别原理及文字识别算法

1.引言

文字识别是智能识别技术中的一个重要技术。文字具有便于信息保存和传递的优点,使信息在时间和空间上得以迅速扩散。在人们的日常生活中,在机关事务处理、工业以及商业交往中,需要识别文字的数量如同天文数字,但利用计算机识别的文字量却很少。最近几年,随着计算机技术、数学和图像技术的发展,文字识别的应用领域逐步扩大,目前较为活跃的应用包括数字识别,文字识别等。文字识别是指用计算机字典、高速地识别现在介质(如纸张等)上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题,一般通过特征及特征匹配的方法来进行处理。

本文将从算法、应用两方面介绍文字识别技术,本文介绍的文字识别应用有英文字母识别、车牌特殊文字识别、书写文字识别、特殊文字识别。

2.摘要

文字是人类相互交流信息的重要工具。社会发展进入信息时代,人们已不再停留在用自己的耳朵和眼睛去直接获得这些信息,而是使用计算机将文字自动的输入计算机,用计算机对他们进行处理,随时以各种方式满足人们的不同需要。因此,研究如何用计算机自动识别文字图像,解决文字信息自动输入计算机,并进行高速加工处理的问题已引起大家的广泛关注。

归一化算法一般作为一种图像的预处理技术,其目的是将采集到的原始图像转换成特征提取器所能接受的形式(灰度图像或二值图像),消除一些与类别无关的因素(噪声消除、归一化等) 。从理论上讲,经过归一化后的骨架应该是宽度为一的中心线,但这是不可能的。不同的硬件设备和不同的算法得出的结果可能不是唯一的,其结果与原图案的扭曲程度也是不~样的,扭曲程度尽量的小应该是归一化算法追求的目的之一 。既然预处理是为后续的特征提取和分类器设计服务的,那么预处理方法的选择就应该有利于特征的提取,以使分类变得简单。

汽车牌照识别,在高速公路收费、电子和治安卡口等系统中有重要的应用价值。作为图像识别的典型问题,汽车牌照识别的研究有很长的历史,但因为实际路况的高度复杂性(如车速、光线、污染及变形等),目前的性能还不能令人满意。

关键词:文字识别、贝叶斯分类器、文字图像识别、归一化算法、汽车牌照识别、BP 算法

3.文字识别过程概述

一般来说,文字图像的识别过程主要由以下4 个部分组成:①正确地分割文字图像区域;②正确地分离单个文字;③正确识别单个文字;④正确地连接单个文字。其中①、④属于文字图像分析技术问题,③属于文字识别技术问题。关于②,由于仅从分割处理不能对其进行评价,通常采用文字识别地评价值来判断分离的正确性。单纯的文字识别是指经二值化处理后的单个文字识别。

3.1.文字识别系统的原理及组成

文字图像的识别的原理如下图所示。图中光电变换检测部分的主要功能,是对纸面上的文字进行光电转换,然后经模数转换成具有一定灰度的数字信号,送往其后的各部分进行处理和识别。常用的检测设备是扫描仪,CCD 摄像头等。文字图像分割的目的就是根据文字图像的特征的视线文字图像区域的定位和分割,将真正的文字图形分割出来,以便后续进行识别,识别与处理部分的功能是将已分割出的文字图形信息加以区分,去除信号中的污点、空白等噪声,增强文字图像的信息。并根据一定的准则除掉一些非本质信号,对文字的大小、位置和笔画粗细等进行规范化,以便简化判断部分的复杂性。特征提取部分是从整形和规范化的信号中抽取反映字符本身的有用信息,供识别部分进行识别。作为特征提取的内容是比较多的,可以是几何特征,如文字线条的端点、折点和交点等。识别判断部分则是根据抽取的特征,运用一定的识别原理,对文字进行分类,确定其属性,达到识别的目的,实际上判断部分就是一个分离器。

识别系统学习部分的功能是生成计算机特征字典,学习根据已准备好的多个字样,抽出代表该字的特征,进行修改,按照字典的规定位置存放该特征。学习分为两种:一种是在人的参与下进行,称为“有教师”学习;一种由计算机自动进行,称为“无教师学习”。

3.2.文字识别的方法

文字识别是指用计算机字典、高速地识别现在介质(如纸张等)上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题,一般通过特征及特征匹配的方法来进行处理。

特征判别是通过文字类别(例如英文或汉字)的共同规则(如区域特征、四周边特征等)进行分类判别。它不需要利用各种文字的具体知识,根据特征抽取的程度(知识的使用程度) 分解到地使用结构分析的办法完成字符的识别。

匹配的方法则是根据各国文字的知识(称为自动)采取按形式匹配的方法进行。按实现的技术途径不同又可分为两种:一种是直接利用输入的二维平面图像与字典中记忆的图像进行全域匹配;另一种是只抽出部分图像与字典进行匹配。然后根据各部分形状及相对位置关系,与保存在字典中的知识进行对照,从而识别出每一个具体的文字。前一种匹配方法适合于数字、英文符号一类的小字符集;后一种匹配方法适用于汉字一类的大字符集。

3.3.边缘检测

边缘(Edge)是指图像局部亮度变化量最显著的部分。边缘主要存在于目标与木板、目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征提前和形状特征提取等图像分析的重要基础。图像分析和理解的第一步常常是边缘检测。由于边缘检测十分重要,因此成为机器视觉研究领域最活跃的课题之一。

图像中的边缘通常与图像亮度或图像亮度的一阶导数的不连续性有关。图像亮度的不连续可分为:①阶跃不连续,即图像亮度在不连续处的两边的像素灰度值有着显著的差异;②线条不连续,即图像亮度突然从一个值变化到另一个值,保持一个较小的行程后又返回到原来的值。在实际中,阶跃和线条边缘图像是很少见的,由于大多数传感元件具有低频特性,使得阶跃边缘变成斜坡型边缘,线条边缘变成屋顶形边缘,其中的亮度变化不是瞬间的,而是跨越一定的距离。

对一个边缘来说,有可能同时具有阶跃和线条边缘特性,例如在一个表面上,由一个平面变化到发线方向不同的另一个平面上就会产生阶跃边缘;如果这一表面具有镜面反射特性且两平面形成的棱角比较圆滑,则当棱角圆滑表面的法线经过镜面反射角时,由于镜面反射分量,在棱角圆滑表面上会产生明亮光条,这样的边缘看起来像在阶跃边缘上叠加了一个线条边缘。由于边缘可能与场景中物体的重要特征对应,所以它是很重要的图像特征。比如,一个物体的轮廓通常产生阶跃边缘,因为物体的图像亮度不同于背景的图像亮度。

4.简单贝叶斯分类器

简单贝叶斯分类器(Simple Bayes Classifier或Naïve Bayes Classifier)[1]假定特征向量的各分量间相对于决策变量是相对的。对于特征向量为X=[x1,x2,…xd]T的测试样本,它属于第Ci类的条件概率为:

P(Ci|X)=P(X|Ci)*P(Ci)/P(X)

       =(P(Ci)/P(X))                   (1)

对每一个类别(即取不同的值)都计算上面的条件概率,最终的识别结果为条件概率最大的那一类别。虽然简单贝叶斯分类器是基于性假设的,在违背这种假定的条件下简单贝叶斯也表现出相当的健壮性和高效性678,它已经成功地应用到分类、聚类等问题中。

4.1.简单贝叶斯分类器在切分中的应用

在确定文字的最佳候选后边界时,假设有m个候选后边界,分别对应m个候选切分结果,用d种特征来衡量其合理性,记为Xj=[x1,x2,…xd]T, j(=1,2…m)。。则,当文字为Ci类(C1、C2、C3)分别表示汉字、英文和数字、标点类别),且后边界为第j个候选后边界的概率为:

P(Xj,Ci)=P(Xj|Ci)*P(Ci)

       = P(Ci)    (i=1,2,3   j=1,2…m)    (2)

以上公式(2)与公式(1)不同的是,公式(1)只需要确定一个值,即观测值X对应的类别;而公式(2)不仅需要确定一个候选后边界切分出文字的种类,还需要确定m个候选后边界那一个最合适。显然,使P(Xj|Ci) 取最大值时的j就对应了最佳切分位置,而相应的i即为对文字类别的定义。

4.2.特征提取

文中的贝叶斯分类器用到的特征可分为两种:一种是文字形状和结构方面的特征,包括6种文字外形特征(文字高度、宽度、字间距离、覆盖率、高宽比[2] 、纵向起始位置)和3种后边界特征(后边界穿越笔划数、后边界投影值、后边界上下穿越笔划点距离);另一种是文字内容特征,包括16维方向线素特征(把文字分成不重叠的2×2块,每块提取出水平、垂直、45°和135°4个方向的方向线素特征)。第一种特征里,除了覆盖率和高宽比外都需要特征归一化。这里用图像中的汉字平均高和宽对它们归一化。因此,切分过程的第一步需要估计基本参数:汉字平均高和宽。

在研究中发现,文字切分中最容易出现的错误是:(1)把汉字的偏旁、部首等部件当成英文、数字或标点单独切开;(2)把英文、数字或标点与汉字切在一起。为了有较好的切分效果,就需要抽取出能够区分这些错误的特征。一级汉字中容易切开的汉字有以下几种:(1)“八”,“儿”,“川”,“非”,“加”,“旧”,“别”,“训”;(2)“叫”,“礼”,“仆”,“讨”,“引”,“很”;(3)“必”,“小”,“心”;(4)“懊”。第1、3 种字,单个字左右部分容易切开;第2、4种字,由于有左边的部首,左右部分也容易切开;第1、2种汉字易被当成英文或数字类文字切开;第2、4种汉字左边的点易被当成标点类文字切开。为此,把上面4种文字易被切开的部分定义为新的文字类别:部件类,用C4来表示它;该类仅用于提取特征。

5.归一化算法的研究

汉字图像的归一化包括位置、大小、旋转、倾斜和笔画宽度的归一化。在整个汉字识别系统中会进行字符切分、倾斜校正等步骤,本文主要研究汉字的大小和笔画宽度的归一化。

5.1.字体大小归一化

由于汉字字形、字体繁多,同一汉字的特征也因此而不同,为了便于统一描述和提取同一汉字的特征,对不同字形、字体汉字均能识别,为汉字识别工作打好基础,在汉字特征提取前还需对汉字图像进行大小归一化的操作。所谓大小归一化就是对实际提取的字符进行缩放操作,最后得到预定大小的字符图像。

一般汉字图像预处理的第一步是进行二值化处理,二值化处理的目的是把灰度图像转换为二值图像。二值化处理后图像中的像素点不是1(黑点)就是0(白点)。记为:

GM*N = (Pi,j) (1≤i≤M,1≤J≤N)

其中,M和N分别为G的长和宽;Pi,j 为第i行、第j列的像素点。Pi,j=1时表示一个黑像素点(前景点),Pi,j =0时表示一个白像素点(背景点)。简记为G。

一般的缩放算法是对一个区域的灰度值进行运算,由四个以上的输入像素决定输出像素的灰度值。而对于二值图像,只有黑白像素,此时可以对图G进行划分而得到一组图块g,使得每个g内黑像素点的分布是比较均匀的,记为:

gm*n = (Pa,b) (Pa,b∈G,1≤a≤m,1≤b≤n)

其中,m 和n(m≤M,n≤N)分别称为该图块的长和宽。定义了图块之后,二值点阵图像又可表示为:

GM*N =(gx,ym*n ) (1≤x≤[M/m],1≤y≤[N/n])

其中,(x,y)表示图块g在图像G中的位置。

在图块g中,值为1的像素点个数与全部像素点个数之比,称为该图块的灰度值。记为:

P(g)=( ΣPi,j/(m×n))×100%   (1≤i≤m, 1≤j≤m)

若g中所有的像素点为1,则称将g置1,若所有的像素点为0,则称将g置0。

本文所用的大小归一化算法不是简单地将g压缩为一个像素点,而是按压缩比将g缩小成为另一个图块g’,使得g’具有与g相同的特征,即二者的黑像素点分布是相似的。这样,由g’构成的缩小图G就可基本上保持原图G的特征,从而减小了由缩小所造成的失真。设:

GM*N =(gi,jm*n) (1≤i≤[M/m],1≤J≤[N/n])

G’ =(g’i,j) (g’i,j为g缩小后形成的图块)

算法描述如下:

① 读入原图G,根据G的行列数、特征及压缩比,确定图块g的行、列数及g’的行、列数;

② i=1,j=1;

③ 读人gi,j,根据第一次划分得到的图块的灰度值P(gi,j)及图块的特征构造g’i,j;

④ 若i≤[M/m]或j≤[N/n],则修改i,j的值使之指向下一个像素点,然后转向步骤③ 继续;否则结束。

算法的关键是根据原图块g的黑点分布特征来动态地构成g’。为了提高处理效率,可在分布特征基本相似的一个较大的区域采用相同的g’。而当特征发生较大变化时再重新构造新的g’。

5.2.笔画宽度归一化

对笔画宽度进行归一一化的目的是使二值图像变为仅有一个像素宽度的骨架,这个过程也称之为细化。

细化的本质就是寻找图形的中轴线或骨架。并以其骨架来取代该图形。细化后的图形的像素宽度变为1,但仍能保持原图形的结构性信息,如位置、方向、长度等。在现代模式识别系统中,细化处理已经成为最为关键的预处理步骤之一,细化效果的好坏将直接影响识别速度及识别的准确率。可以说能否进行有效的细化,已成为识别系统成功与否的关键所在。

对一个图像细化之后的骨架必须能够反映出原来物体的形状特征才具有实用价值。因此,一个好的细化算法一般需要满足以下要求:

① 保留物体形状的连通性,可以是4向连通也可以是8向连通。

② 无过度腐蚀,即保留位置重要的点(如线段终点)。

③ 骨架图像尽可能是原图像的中心线。

④ 骨架必须与原物体是拓扑等价的。

⑤ 抗噪声性能好,出现在物体边界上的噪声不应该过分影响细化结果。

细化分成串行细化和并行细化,串行细化即是一边检测满足细化条件的点,一边删除细化点;并行细化即是检测细化点的时候不进行点的删除只进行标记,而在检测完整幅图像后一次性去除要细化的点。

经典的图像细化算法有Hilditch算法,Pavlidis算法和Rosenfeld算法等。

Zhang细化算法[2] 是目前应用最为普遍的方法之一,是在上面三种细化算法的基础上演变而来的,也是本系统所采用的算法。每当人们开发出一种新的算法时,也经常引用Zhang细化算法来与新算法进行比较,以评定新算法的优劣。

定义边界点是本身标记为1而其8向连通邻域中至少有一个点标记为0的点。

以边界点为中心的8向邻域,即中心点为p1,其邻域的8个点绕中心点顺时针依次进行标记,如图所示。

首先标记同时满足下列条件的边界点:

①连接数=1。

② 2—6个零像素。

③ p2,p4,p6中至少有一个像素是背景像素(即白色点)。

④ p4,p6,p8中至少有一个像素是背景像素。

在一次迭代运算后,删除被标记的像素点,然后进行另一个迭代,其步骤和第一次迭代相同,只是把上述③ 、④ 条件替换成如下的形式:

③ p2,p4,p8中至少有一个像素是背景像素。

④ p4,p6,p8中至少有一个像素是背景像素。

第二个迭代后,同样删除所有被标记像素。然后转入下一轮循环,直到两次迭代中均无像素被删除时,算法结束。

5.3.算法修正

由于图像边界的不规则和骨架对噪声的敏感,使抽取骨架存在大量的畸变.从而使数据拟合和矢量化跟踪的结果不能正确表示原始信息,严重地影响到今后对图像的识别质量。对此,一般的修正策略是对给定骨架的两个连通成分,考查它们之间的距离与某一域值的关系,以决定这两个连通成分的连接性。较为常用的 法订:

5.3.1.固定视口法

为校正骨架化畸变,可设定固定的视口,根据固定视口各边线出口的情况来判别各连通成分可否连接。如图所示,若选视口一,则因为有两条线出口,故可以认为连通成分A和C合并,若选取为视口:二,那么三个连通成分A、B、C都合并。综上分析,要找到一个满足各种可能情况的固定形视口是比较困难的,固定视口的大小直接影响到连通成分的连接合并和后期的模式识别。

5.3.2.内接圆法

该修正方法如图所示,以连通成分A的端点a和另一连通成分B的端点b分别为圆心,r为半径作圆,如果两圆相交,则端点a和b连接合并,连通成分A和B就合二为一, 否则,认为是不同的连通成分,不作连接合并。由此可见,圆半径的选择是该方法成功的关键,在圆半径选择不当时,会使连通成分错误地增加或减少,最终将导致整个识别错误而无法再现原始信息。

5.3.3.自适应校正算法

该算法分两步:①基于知识的扩边过程,该过程是将视口从小到大逐渐扩大,直到能识别连通成分的可连性为止,在扩边的过程中可以得到视口边框大小、边线出口个数及位置、边框内连通成分的端点数及它的位置等信息。②修正过程,由扩边过程所得到的有关信息计算出连通数和出口数,再据此分类合并。该算法的关键在于知识的获取,而知识的获取则需要根据不同的处理对象。在大量分析细化骨架数据的基础上,综合各种可能的情况,归结得出具有普遍适用意义的规则和方法,显然,这样的知识是基于归纳的,不可能适合于某些复杂的情况。

基于以上三种算法的优劣性比较,本文采用内接圆法对骨架图像进行修正。这种算法的难点在于圆半径不易确定,如果半径选择过大,则可能将不应该合并的连通成分错误地合并,如果半径选择过小,则可能使本应合并的连通成分不能合并。

6.字符识别在车牌识别上的应用

汽车牌照识别系统主要由车牌定位、字符切分以及字符识别组成- 车牌定位的作用是在整幅图像中找到车牌区域。字符切分是利用车牌字符的局部与整体信息,将车牌定位得到的车牌图像中的字符提取出来。字符识别是模式识别理论的典型应用,目前字符识别技术已经相对成熟,在正常图像质量条件下,正确识别率很高。对车牌识别来说,如果车牌定位和字符切分的性能理想,整个系统的正确识别率就不会低。然而车牌定位很难精确地得到车牌的上下左右边界,而把精确定位问题留到字符切分部分解决。所以,笔者认为整个车牌识别系统的性能瓶颈在车牌精确定位和字符切分部分,尤其是字符切分,能否在车牌图像中准确地切分出字符是车牌识别系统成功的关键。

字符切分最有效也最常用的方法是:投影切分[3]。前者因为可能存在的“过切分”,即把一个字符切分成多个部分,例如可能将字符“L”和“J”下面的横向笔画切断,使得得到的区域个数不少于字符个数。后者因为字符间的粘连、字符与边框的粘连,使得到的连通区域个数不多于字符个数。这里利用车牌字符的局部和整体特征,提出了字符串的车牌相似度概念,并针对这两种切分思路的特点,在估计出字符高度的基础上,遍历各种可能存在的切分,计算字符串的车牌相似度。最终找到车牌相似度最大的那种情况,完成字符切分。

6.1.车牌字符的特征

把单个字符的占用空间称为Region。字符“1”的Region包括左右空出来的空间,其他字符的Region与其最小外接矩形所占的空间相同。把Region之间的间隔称为Gap。把第一个非汉字字符与第二个非字符之间的Gap称为KeyGap。根据制定的92式车牌与02式车牌标准,Region,Gap与KeyGap宽度之比为45:12:35。考虑到车牌字符的实际大小、一定范围内的水平倾斜、二值化误差,以及摄像机的视角在一定范围内变化,并经过统计得到车牌字符的特征如下所示。

单个字符特征:字符“1” 的高宽比大于3.0,而其他字符的高宽比属于[1.5,3.0],并认为高宽比小于1.5的字符一定存在粘连。

字符串的整体特征:各个Region的大小相等;除了KeyGap,Gap的大小相等,KeyGap的宽度是Gap的3倍;Region与Gap处于同一高度上;KeyGap右侧的Region是均匀排列的。

6.2.车牌字符切分

车牌字符切分分倾斜校正、水平切分和垂直切分。如图1所示,实线框内是整个系统的详细工作流程,3个虚线框内分别是3 个环节的工作流程。

6.2.1.倾斜校正

实际采集的车牌图像中通常无法避免会有一定角度的倾斜,这对车牌上下边框的去除带来了很大的影响,所以必须对车牌进行倾斜角度估计和校正,以便准

确得到车牌边界。考虑到车牌边框有锐利的水平边缘信息,首先对车牌图像做Sobel算子[3] 的水平边缘检测,然后采用最大类间类内距离比方法[5]将边缘图像二值化。再对二值的边缘图像做直线Hough变换,找到累计数组中最大值所对应的直线,认为它的角度是车牌的倾斜角度。最后,对车牌图像做相应角度的切错变换,即可校正倾斜的车牌。实验证明,这种方法有很好的效果,如图中(a),(b)所示。

          (a)                    (b)

6.2.2.水平切分

水平投影切除边框

首先将彩色图像灰度化,然后采用最大类间类内距离比方法将图像二值化,结果如下图(c)所示。多数图像的边框与字符有着一定距离,那么对二值图像进行水平投影,找到相应的波谷即可切除上下边框但是对于边框与字符相连的车牌图像,这种方法无效,如下图(a),(b)所示。

  (a)                 (b)               (c)              (d)

反色水平投影再次切除边框

将图像反色,白色的边框与字符变成黑色,而字符间的间隙变成白色。再做水平投影切除边框,即可粗略的将边框切掉。由上图(c),(d)可看到,反色水平投影切分可去掉大部分边框,但依然有残留的小部分边框。因为切除了粘连在字符上的大部分面积不可忽略的边框,所以虽然切除的不精确,但这一步对保证字符识别的正确率有很大贡献。

聚类分析拟合字符边界

搜索连通区域,对高宽比不小于1.5的连通区域的高度做最大最小聚类法[4]聚类。找出具有最多样本的类,并对它们的最小包围矩形的上下界做直线的最小二乘拟合。然后去掉拟合直线以外的部分图像,以及高度较小的连通区域。如上图(d)所示,由于字符“2”,“7”,“5”是符合单个字符特征的字符,所以在做边界拟合的时候,利用它们的高度和位置信息,切除了残留的边框,结果如下图(d)所示。这一步还可去掉车牌上的铆钉。最后对各个连通区域的高度求平均值,认为这个值就是车牌字符的高度估计值。

6.2.3.垂直切分

局部二值化

由下图(c)看到,图像中有粘连发生。在这一步,利用字符的高度比不小于1.5这一约束条件,对高度比小于1.5的字符所在区域调整阈值重新二值化。再

      (a)                 (b)               (c)                (d)

考察垂直投影切分得到的字符是否符合该条件,符合者停止调整,不符合者继续调整二值化阈值。直到垂直投影得到的所有字符的高度比都不小于1.5,或者调整的次数达到预先设定的上限。

垂直投影切分

首先对车牌进行垂直投影切分,然后考察切分得到的各个区域& 把高度大于字符高度估计值一半的字符标注为BLOCK。把高度不大于字符高度估计值一半的字符标注为MAYBE,MAYBE可能是被过切分下来的残缺字符,也可能是残留的边框,如下图(a),(b)所示。把切分得到的间隙标记为GAP。

  (a)                (b)               (c)                (d)

遍历切分

遍历所有可能的切分情况,寻找KeyGap并计算相应字符串的车牌相似度,最终找到车牌相似度最大的字符串,完成字符切分。

7.结束语

总体来说,近几年来国内对汉字识别的研究还是相当深入的,也取得了很大成绩,使系统的识别率不断上升。目前印刷体汉字识别系统的应用已经相当成熟。例如,刚刚通过国家教委组织的鉴定的清华TH-OCR97 综合集成汉字识别系统,对中等质量的样本,识别率已经可以达到99%左右或更高。

文字是人类获取和交换信息的主要来源,随着电子载体越来越普及,文字处理的应用领域必然涉及到人类生活和工作的方方面面。随着科学技术的发展,文字识别处理技术在航空航天、工业生产、医疗诊断、资源环境、气象及交通监测、文化教育等领域将有着广泛的应用;它必将更深入、更完善的方向发展:处理算法更优化,处理速度更快,实现文字的智能生成、处理、识别和理解。

参考文献

[1]Kohavi R, Becker B, Sommerfield D. Improving Simple Bayes[R]. (tecknical report) Data Mining and Visualization Group, Silicon Graphics Inc, Mountain View, CA.

[2] 章毓晋.图像工程[M].清华大学出版社.2002.

[3]汪涛.西安电子科技大学学报2005年12月

[4]王耀南.智能控制系统——模糊控制 专家控制 神经网络控制[M] .长沙:湖南大学出版社,1996.

[5]孙即祥.模式识别中的特征提取与计算机视觉不变量[M] .北京:国防工业出版社,2001下载本文

显示全文
专题