有没有哪款OCR软件可以识别出除宋体、楷体等规范的字体外的手写体或艺术体类的？

栏目：古籍资讯发布：2023-08-22浏览：3收藏

有没有哪款OCR软件可以识别出除宋体、楷体等规范的字体外的手写体或艺术体类的？,第1张

哎~！楼主啊，是在是很想帮你，做识别也很多年了，用过很多的识别软件，可是目前这些不规范的字体都不能很好的识别出来，目前许多古籍识别技术还是国家正在攻克的难题，古籍里很多都是手写字体，大家现在都没办法，有公司在做古籍识别，但也是半自动的，都是人工校正，收费好像在8元/页吧，如果楼主的字体不是太离谱，还是用平时的识别软件试一下吧，我经常用ADOBE的

reCAPTCHA是CMU设计的系统。

CMU设计了一个名叫reCAPTCHA的强大系统，让他们的电脑去向人类求助。具体做法是：将OCR软件无法识别的文字扫描图传给世界各大网站，用以替换原来的验证码；那些网站的用户在正确识别出这些文字之后，其答案便会被传回CMU。

反spam的CAPTCHA技术有了新的用途：reCAPTCHA。

根据Science的介绍，reCAPTCHA是利用CAPTCHA的原理（CAPTCHA的中文全称是全自动区分计算机和人类的图灵测试），借助于人类大脑对难以识别的字符的辨别能力，进行对古旧书籍中难以被OCR识别的字符进行辨别的技术。

也就是说，reCAPTCHA不仅可以反spam，而且同时还可以帮助进行古籍的数字化工作（可以称为人工OCR）。据称正施用于4万多个网站，并已经帮助解决了来自扫描文本文件的约4亿4千万个字词。

我就是经常做识别的，我经常用 Adobe AcroPro90，识别率都在90%以上的，你从网上下一个，大小在600多M，这是我用过功能最强的。另外你也可以用紫光ORC和尚书七号，也不错。要是你安装软件安装失败，而不是安装完使用过程中识别率低，那就是你电脑问题了，请重做系统。

另外，如果识别率低或出现乱码，是因为你的像素太低。扫描时请把像素设置在不低于300dpi。格式最好是TIF，这样现在的书籍识别率可达95%以上，当然不包括古籍和繁体字识别。

OCR是光学字符识别的缩写，OCR技术简单来说就是将文字信息转换为图像信息，然后再利用文字识别技术将图像信息转化为可以使用的输入技术。

OCR的功能：

1、OCR识别技术不仅具有可以自动判断、拆分、识别和还原各种通用型印刷体表格，还在表格理解上做出了令人满意的实用结果。

2、OCR能够自动分析文稿的版面布局，自动分栏、并判断出标题、横栏、图像、表格等相应属性，并判定识别顺序，能将识别结果还原成与扫描文稿的版面布局一致的新文本。

3、OCR还可以支持表格自动录入技术，可自动识别特定表格的印刷或打印汉字、字母、数字，可识别手写体汉字、手写体字母、数字及多种手写符号，并按表格格式输出。提高了表格录入效率，可节省大量人力。

扩展资料：

欲经过OCR处理的标的物须透过光学仪器，如影像扫描仪、传真机或任何摄影器材，将影像转入计算机。科技的进步，扫描仪等的输入装置已制作的愈来愈精致，轻薄短小、品质也高，对OCR有相当大的帮助，扫描仪的分辨率使影像更清晰、扫除速度更增进OCR处理的效率。

影像预处理：影像预处理是OCR系统中，须解决问题最多的一个模块。影像须先将、表格及文字区域分离出来，甚至可将文章的编排方向、文章的提纲及内容主体区分开，而文字的大小及文字的字体亦可如原始文件一样的判断出来。

-OCR技术

OCR文字识别软件，点击软件界面“从读文件”选项，打开要进行识别的图形。打开之后，点击软件上方“纸面解析”，那么软件就会对里的文字进行自动解析。之后再点击“识别”，那么在软件的右侧就会自动识别出里的文字。

工具／原料：

magicbook

Windows 10

浏览器1026

1、OCR文字识别软件，点击软件界面“从读文件”选项，打开要进行识别的图形。

2、打开之后，点击软件上方“纸面解析”，那么软件就会对里的文字进行自动解析。

3、之后再点击“识别”，那么在软件的右侧就会自动识别出里的文字，软件多识别的文字是可以进行修改的。

4、修改完软件识别错误的部分文字之后，最后点击“保存为Word”，那么里的文字就转换成Word文档了。

上一篇：书格网上内阁文库中的古籍有的不能下载怎么办下一篇：到底有没有水怪

本文2023-08-22 05:36:47发表“古籍资讯”栏目。
本文链接：https://www.yizhai.net/article/66577.html

有没有哪款OCR软件可以识别出除宋体、楷体等规范的字体外的手写体或艺术体类的？

相关文章

阅读排行