怎么把古书扫描成文字
1 怎样利用扫描仪,把书本上的文字转换成WORD文件
方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。
还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。
提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。
这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。
点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。
扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。
就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。
以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。
用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。
然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。
不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。
保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。
第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。
其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。
三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。
几乎根本找不到木版印刷的,一般都是石印和铅印的,石印的比较早,铅印是在清末才有的,如何区分石印铅印最简单的办法是看书的边框如果连上的就是铅印,如果美联上的就是石印的。关于断代说几个简单的方法一要从字上入手,字比较大的一般比较早。二是要看纸质了,一般清末和民国的纸质差不多比较薄,而之前的由于是草纸可以看到一些纹理。三要从题材上看,一般佛经比较早。当然你要想收藏古籍的话也要注意收藏的门类。
补充:木板由于是活字印刷所以字体大小不一,而且印出来的字幽深有浅
古籍修复,历史悠久,学术界对于古籍修复萌芽说法很多,大体有4种:其一,在汉唐时代表作就是龙鳞装也叫做鱼鳞装旋风装,此装裱技艺基本失传,现在天津的竹影法师还会此项龙鳞装的装裱技艺。
古籍修复流派在历史的长河中很多。到民国时期还存在的有如下几派。沪派、苏派、扬派、京派、蜀派、徽派、岭南派、鲁派、津派。
在宋代出现,这是因为之前书籍和古画修复不分家,但是到了宋代随着印刷术的发展,古籍修复也蓬勃发展,逐渐独自发展。成为单独的技艺。第三种:认为春秋战国时期,考古发掘发现有很多绢帛上有修改、挖补的痕迹。部分学者认为此时为古籍修复的萌芽。第四种:认为夏商周时期,这个是因为考古发掘,有很多龟甲兽骨上有1、2、3等刻画符号。在册页研究的学术界,龟甲上的刻画符号在当时应该是用绳子、皮革串连在一起,作为页数标注所以刻画。串联便形成早起册页。册页出现之时,就是古籍修复成立之时。
古籍修复因为时代和流派不同修复过程也不同。大体可以分为如下几种。
1、收到修复的书籍:这个过程是修复中最重要的一个环节,一般这个环节修复师傅要检查送来的古书的破损程度、珍惜程度。和书籍的持有者商讨价格、修复要求、修复时间。因为修复古籍需要把珍藏的书相当长时间放在修复师傅手里,所以一般修复师傅只为熟人或者熟人介绍的朋友修复。从古至今修复师傅和古书持有者之间主要是口头约定为准,无凭证票据的存在,所以收到古书和客户商议领悟客户修复的要求、心情、心境、品味等成为最重要的环节。
2、对书籍资料记录:1970年之前的修复都是把每页文字都要抄录下来以便修复时方便检查和配页。津派在2000年时把照相技术引入修复,将古籍做影像资料储存。比过去更加科学,但是因为涉及古籍版权问题,自竹影法师停止修复后,影像资料的储存在修复中被取消。只有博物馆工作的部分修复师傅继续沿用古籍修复中的,影像保存环节。
3、拟定修复方法:古书的各种破损、污渍等被修复艺人叫做书病。古书艺人视书为孩子,所以修复如看病。古书修复也有望闻问切。望:指的是检查破损、污渍、纸张、绢帛等材质的的现有情况。闻:指的是通过气味判定,纸张的矾化程度、有无霉烂。问:指的是要询问书籍来历,如果书籍现在的持有者是长期居住南方则选用白芨作为浆糊,如果长期居住北方则选用面糊作为浆糊。客户不同的居住地域也决定了修复方法和修复材料。而且要向书籍的持有者询问书籍的年代、版本、曾经印刷地域,这点很重要,因为修复师傅对于古籍断代能力不高,所以询问下书籍持有者详细内容很必要。对于修复甚至是决定成败的。切:指的是修复师傅抚摸和检查书籍材质的保存状况。纸张的薄厚、是不是曾经有修复。
怎么把古书扫描成文字
本文2023-11-01 17:14:53发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/190862.html