有没有哪款OCR软件可以识别出除宋体、楷体等规范的字体外的手写体或艺术体类的?
哎~!楼主啊,是在是很想帮你,做识别也很多年了,用过很多的识别软件,可是目前这些不规范的字体都不能很好的识别出来,目前许多古籍识别技术还是国家正在攻克的难题,古籍里很多都是手写字体,大家现在都没办法,有公司在做古籍识别,但也是半自动的,都是人工校正,收费好像在8元/页吧,如果楼主的字体不是太离谱,还是用平时的识别软件试一下吧,我经常用ADOBE的
reCAPTCHA是CMU设计的系统。
CMU设计了一个名叫reCAPTCHA的强大系统,让他们的电脑去向人类求助。具体做法是:将OCR软件无法识别的文字扫描图传给世界各大网站,用以替换原来的验证码;那些网站的用户在正确识别出这些文字之后,其答案便会被传回CMU。
反spam的CAPTCHA技术有了新的用途:reCAPTCHA。
根据Science的介绍,reCAPTCHA是利用CAPTCHA的原理(CAPTCHA的中文全称是全自动区分计算机和人类的图灵测试),借助于人类大脑对难以识别的字符的辨别能力,进行对古旧书籍中难以被OCR识别的字符进行辨别的技术。
也就是说,reCAPTCHA不仅可以反spam,而且同时还可以帮助进行古籍的数字化工作(可以称为人工OCR)。据称正施用于4万多个网站,并已经帮助解决了来自扫描文本文件的约4亿4千万个字词。
我就是经常做识别的,我经常用 Adobe AcroPro90,识别率都在90%以上的,你从网上下一个,大小在600多M,这是我用过功能最强的。另外你也可以用紫光ORC和尚书七号,也不错。要是你安装软件安装失败,而不是安装完使用过程中识别率低,那就是你电脑问题了,请重做系统。
另外,如果识别率低或出现乱码,是因为你的像素太低。扫描时请把像素设置在不低于300dpi。格式最好是TIF,这样现在的书籍识别率可达95%以上,当然不包括古籍和繁体字识别。
OCR是光学字符识别的缩写,OCR技术简单来说就是将文字信息转换为图像信息,然后再利用文字识别技术将图像信息转化为可以使用的输入技术。
OCR的功能:
1、OCR识别技术不仅具有可以自动判断、拆分、 识别和还原各种通用型印刷体表格,还在表格理解上做出了令人满意的实用结果。
2、OCR能够自动分析文稿的版面布局,自动分栏、并判断出标题、横栏、图像、表格等相应属性,并判定识别顺序,能将识别结果还原成与扫描文稿的版面布局一致的新文本。
3、OCR还可以支持表格自动录入技术,可自动识别特定表格的印刷或打印汉字、字母、数字,可识别手写体汉字、手写体字母、数字及多种手写符号,并按表格格式输出。提高了表格录入效率,可节省大量人力。
扩展资料:
欲经过OCR处理的标的物须透过光学仪器,如影像扫描仪、传真机或任何摄影器材,将影像转入计算机。科技的进步,扫描仪等的输入装置已制作的愈来愈精致,轻薄短小、品质也高,对OCR有相当大的帮助,扫描仪的分辨率使影像更清晰、扫除速度更增进OCR处理的效率。
影像预处理:影像预处理是OCR系统中,须解决问题最多的一个模块。影像须先将、表格及文字区域分离出来,甚至可将文章的编排方向、文章的提纲及内容主体区分开,而文字的大小及文字的字体亦可如原始文件一样的判断出来。
-OCR技术
OCR文字识别软件,点击软件界面“从读文件”选项,打开要进行识别的图形。打开之后,点击软件上方“纸面解析”,那么软件就会对里的文字进行自动解析。之后再点击“识别”,那么在软件的右侧就会自动识别出里的文字。
工具/原料:
magicbook
Windows 10
浏览器1026
1、OCR文字识别软件,点击软件界面“从读文件”选项,打开要进行识别的图形。
2、打开之后,点击软件上方“纸面解析”,那么软件就会对里的文字进行自动解析。
3、之后再点击“识别”,那么在软件的右侧就会自动识别出里的文字,软件多识别的文字是可以进行修改的。
4、修改完软件识别错误的部分文字之后,最后点击“保存为Word”,那么里的文字就转换成Word文档了。
本文2023-08-22 05:36:47发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/66577.html