怎么把古书扫描成文字
1 怎样利用扫描仪,把书本上的文字转换成WORD文件
方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。
还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。
提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。
这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。
点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。
扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。
就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。
以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。
用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。
然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。
不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。
保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。
第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。
其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。
三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。
古汉语中汉字的读音,一是通过查古代人编纂的字典、词典知道的,比如许慎的《说文解字》。二是通过古代人为古籍作的注考证出来的,注释中不但有释义,也有注音。例如:《春秋左氏传》《春秋谷梁传》《春秋公羊传》。
中国是一个有悠久历史的国家,古籍承载了这悠久的历史。而中国古籍数量巨大,经过历朝历代的传承,蕴含了我国文化中精髓的部分。现如今传世古籍大概有十余万种,它们的保存状况却不是很好。许多古籍修复工作者一直在拼命的修复,然而古籍修复工作依然进展得十分缓慢。为什么古籍修复那么困难呢?
其一是古籍破损严重,这是很多图书馆都出现的问题。很多古籍破损严重到不能翻阅的程度,这给修复人员带来了巨大的难题。古籍在流传的过程中不仅受到自然的侵蚀,还经历了人为的破坏。随着时间的流失,纸张变得很脆,一碰就会碎。其二是很多古籍都是通过购买,收集,捐赠等方式进入图书馆的,书籍在进馆之前保存程度不同,有些古籍甚至还有残损。其三是资金问题,古籍修复没有受到足够的重视,导致设备不足,人员不足。其四是在图书借阅过程中受到人为损坏,很多人在翻阅书籍的时候没有保护的意识,导致一些古籍在后期借阅的过程中损坏了。
那么想要传播古迹文化应该怎么做呢?其实现在随着人们对古籍保护认识程度的加深,古籍修复的过程越来越专业,主要是修复,尽量保持古籍的原汁原味。对于专业人士来说,在修复的过程中要保持书籍的原意,不要放太多的主观因素。在用于修复古籍的设备和材料中,要注意成分,不能对古籍造成不可逆的伤害。在修复的过程中要注意对古籍的保护,比如将古籍放在特定的环境中,延长古籍的寿命。对于社会大众来说,在图书馆借阅古籍时要注意轻轻翻页,尽量做到轻拿轻放,减少古籍的磨损程度。
几乎根本找不到木版印刷的,一般都是石印和铅印的,石印的比较早,铅印是在清末才有的,如何区分石印铅印最简单的办法是看书的边框如果连上的就是铅印,如果美联上的就是石印的。关于断代说几个简单的方法一要从字上入手,字比较大的一般比较早。二是要看纸质了,一般清末和民国的纸质差不多比较薄,而之前的由于是草纸可以看到一些纹理。三要从题材上看,一般佛经比较早。当然你要想收藏古籍的话也要注意收藏的门类。
补充:木板由于是活字印刷所以字体大小不一,而且印出来的字幽深有浅
石印本的价格也在不断攀升。以清光绪三十一年(1905年)石印本《钦定书经图说》为例,2000年拍卖会上以7800元落槌,2004年涨至8500元。今年5月,北京德宝春拍,2万元起拍,605万元成交。中国书店春拍,3万元起拍,66万元成交。才过一月,上海国拍春拍,3万元起拍,825万元成交。
据了解,石版印刷是清朝光绪二年(1876年)由在上海的西方传教士传入我国的一种平版印刷技术,分单色和彩色两种。它用药墨将原稿写在特制的纸上,覆于石面,揭去药纸,涂上油墨,然后用沾有油墨的石版来印书。传统的雕版印刷费工耗时、成本高、周期长,而且版片易断裂、破损。相对来说,石版印刷则成本低、速度快、效果好。因此,它到中国后很快风行于世。十九世纪末到二十世纪初,是石印最辉煌的时期。
石版印刷特别适合在宣纸上印刷,它的版面能够根据需要随意缩放,大部头的丛书、类书体积因而大为缩小。另外,一些稀见的字画碑帖、名人手迹通过石版影印,得以化身千万,给读书人阅读、鉴赏、收藏带来了极大的便利。
清末民初石印本的数量巨大,且其艺术价值与木刻本不可同日而语,所以直到上世纪80年代,石印本尚不被藏家看重。那么,石印本的收藏价值究竟体现在哪里呢
中国政法大学人文学院教授、著名藏书家陆昕说,石印技术传入后,一是翻印古籍,方便当时的人们学习考试用,它们的版本价值、经济价值还不高。一是用这种先进的印刷技术印制清末民初的东西,反映了那个时代的社会现实,它们的历史资料价值非常高,这是石印本收藏和增值的闪光点。其实,一些著名的藏书家也收藏石印本。谢国桢先生在《江浙访书记》中就说他以明崇祯刻张溥《七录斋集》六卷本换到1925年上海文瑞楼的石印本《吴友如画宝》13集26册。“知者以余为妄,不知者且以余为愚矣。”实际上,这套书描绘当时的市井风情和众生相,可谓淋漓尽致,惟妙惟肖,鲁迅先生也曾称赞过,具有很高的艺术性和资料性。上海敬华艺术品拍卖有限公司2006年春拍,这套书估价4000-8000元,结果以19800元成交。近代著名藏书家赵元方“文革”后要求退还被抄走的物品,曾手书一清单,其中石印本就有28部之多。
进入二十一世纪,一些石印本的收藏前景逐渐显现,人们开始注意到石印本的版本价值和资料价值,清末民初以石版影印的一批古代版刻和名人手迹,使今天的学人得窥珍椠秘籍的面容。比如郑板桥《四子书》真迹石印本,1999年中国书店拍卖会,只以300元落槌,2000年则升至800元,2001年为1200元,到2002年落槌价已升至1500元。
应该说,随着时间的推移,石印本也渐成“古”籍。清末距今已过百年,今年国家修订的《文物出境审核标准》,将“一律严禁出境”的文物年限由1795年(乾隆六十年)下调至1911年。这其中就包括大量的石印本。
怎么把古书扫描成文字
本文2023-10-28 17:25:38发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/178785.html