如果被识别的是正规的铅印字符,一般可利用与基准图像重合比较的方法来识别字符,不必抽取字符图像中的特征。若是手写字符,则需利用轮廓跟踪法抽取相应的字符特征。抽取的特征是识别的依据,如笔划的长度、角度、端点、笔划分布、四周特征等,它们以多维数据的形式表示。作为识别标准的学习图形,也以多维矢量的形式存放在识别辞典中。
所谓判决就是将事先保存的基准字符特征与抽取的字符特征进行比较,直至找到相应的基准字符为止。
目前OCR技术在识别数字、英文字符及印刷体汉字方面已获得成功。
除了键盘、鼠标器、扫描仪之外,还有触摸屏、声音识别器等输入设备,在此就不作介绍了。
扫描不透明的材料
当扫描不透明的材料如照片,打印文本以及标牌、面板、印制板实物时,由于材料上黑的区域反射较少的光线,亮的区域反射较多的光线,而CCD器件可以检测图像上不同光线反射回来的不同强度的光通过CCD器件将反射光光波转换成为数字信息,用1和0的组合表示,最后控制扫描仪操作的扫描仪软件读入这些数据,并重组为计算机图像文件。
扫描透明材料
而当扫描透明材料如制版菲林软片,照相底片时,扫描工作原理相同,有所不同的是此时不是利用光线的反射,而是让光线透过材料,再由CCD器件接收,扫描透明材料需要特别的光源补偿-透射适配器(TMA)装置来完成这一功能。详见:扫描仪原理




