脱机汉字识别,简单来说就是对一张纸 上已经写好的汉字,或是前印刷的汉字进 行识别有机玻璃字印刷。乍一看,这种识别与联机手写汉字识别没有什么区别,但是,这里的汉字可以 是手写或是印刷,而且脱机识别可对许多字 同时进行识别。送对于将现有的大量印刷资料录人电脑有着巨大的意义。
最简单的脱机识别应用的例子是超市的 收款机,它是一种将图形信号转化成光信号, 从而进行自动识别的装置有机玻璃字印刷。脱机汉字识别的工作原理与超市的收款机的工作原理相同, 都是先把印在纸上或货物上的符号变换为电图像信号,再进行识别。但是由于汉字的字 数多、结构复杂,因此识别系统更加复杂,困难较多。
大家可能想当然地为,第一个研究汉 字识别系统的肯定是中国人,其实,是美国人 最先开始了对汉字识别系统的研究有机玻璃字印刷。他们早在1906年就说:"中国正在发展成为出版大 国之一。"他们认识到汉语资料数量的迅速增 长心及汉语资料收集的重要性,所他们就开始制定汉字自动输入与汉译英自动翻译的 研究计划。
像他们这种有远见和对基础研究的重视,是值得中国的科研人员好好学习的有机玻璃字印刷。 当时,是化学公司研究出了第一个巧刷汉字识别系统,能识别1000个汉字,每个字有20 个样本。虽然能识别的字较少,但是它对汉 字识别系统的研究有着非常重要的意义。由于日文当中也有汉字,而且日本的技 术发达,所他们对汉字识别的研究也比中 国早。
1977年,东芝公司就研制出能够识别 2000个汉字的汉字识别系统,而且还在不断 地进行改进有机玻璃字印刷。中国虽然起步较晚,但是也在1986年11 月研制成功一个能够识别6763个宋体汉字 的系统。虽然它只能识别宋体字,但是其识别字数达到6763个,是当时识别字数最多 的,因此是中国汉字识别研究的第一次突破。
从此,中国的印刷汉字识别技术得到了突飞 猛进的发展,再加上电脑性能的不断提高,使这种技术在复杂性、识别率、识别字数、识别 速度等方面都有了较大的提高,而且这项研究很快就投放市场,获得了巨大的经济效益有机玻璃字印刷。