怎么把古书扫描成文字
1 怎样利用扫描仪,把书本上的文字转换成WORD文件
方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。
还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。
提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。
这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。
点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。
扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。
就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。
以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。
用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。
然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。
不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。
保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。
第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。
其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。
三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。
古籍,是指未采用现代印刷技术印制的书籍。图书在古代称作典籍,也叫文献,兼有文书、档案、书籍三重意义。随着时间的进展,将记事类文件加以编排,供人阅读,并达到传播知识经验的目的,便形成了一部图书,图书的内容日益增多,载体趋向多元,制作技术不断改进,为了方便阅读,产生了"简册"、"卷轴"、"册页"、"线装书"等不同的装帧样式。
古籍定义,"今"而来的,未采用现代印刷技术印制的书籍,皆可称之为古籍。当人们开始有意识地将文字刻写在特定形式的材料上,借以记录知识、传播思想,图书才开始出现。在《中国古籍编撰史》中提出图书必须具备以下六个构件:知识信息;著作方式;文字;物质载体;文字制作技术;装订形式。以这六条标准来衡量诸多图书起源的几种说法:"陶器说"过分强调陶文的作用,但陶文是可有可无的装饰品;"河图洛书"只是出自荒古的神话传说,不足为凭;甲骨、青铜、石刻均不能称之为图书。
先解释"古籍"的"籍"。"籍"在这里就是书,"古籍"是古书的雅称。什么样的东西才算书,殷商时龟腹甲、牛肩胛骨上的文字只是占卜后刻上去的卜辞,并未构成书。商周时青铜器上的铭文即所谓"金文"是王公贵族们对铸器缘起的记述,尽管有时为了夸耀自己的功勋,文字很长,但其性质仍和后世纪功颂德的碑刻相近似,也不能算书。中国殷商时已开始在竹木简上写文字,《尚书》的《多士》篇里说:"惟殷先人,有册有典。
古籍的结构是指一部具体古籍外在形式和内容的各个组成部分,在流传过程中,逐渐书衣形成的特定的名称。
1书衣:俗称书皮,也称封皮。是为保护书而在书的前后加的封皮,一般选用较硬的纸作为书衣的材料,并在书衣上题写书名。
2书签:用作题写书名的长方形纸条,一般贴在古籍封皮左上角。有时还有册次和题写人姓名。
3书叶:按文稿顺序排列的书写、印制的单张纸叶。
4封面:位于护叶之后、所有书叶之前。常镌刻书名、作者、刊刻时间及地点等项内容。
5护叶:也称副叶,用以保护书芯或连接书古籍书封面一般是一张空白纸。在书名叶或前或后。
6书芯:指书衣以内或未上书皮以前已订在一起的书册。
7书脑:书芯订捻、缝线以右的部分。即装订时,锥眼订线的地方。
8书背:又称书脊,与书口相对,上下封皮相隔或连接的部分,相当于书籍的厚薄度。即一书装订处的侧面,如同书的脊背,所以称书脊。
9书头:书籍上端切口处。又称为书首。
10书根:用的术语叫“书脚”,解释为:书籍下端切口处,亦称书根。)有些古籍在书根上有书名、卷数、册数,但书根上这些题名不古籍书册各部位名称一定准确,有些是刻板时印上,有些是藏书者自己为方便翻检、阅读或者保护而写上去的,多半是简名。
1《浮生六记》浮生六记的话就相当于看一个故事,趣味性强,可以使你看下去。《浮生六记》这种有点小意趣的,每篇又很短,清朝人写的,是很浅近的文言,读起来完全没有阻力,文字清新雅正,可以说是初学者完整读完第一本古文的最佳选择。
2《战国策》《左传》这些书可以帮你积累素材增长知识,可以帮你增强文学素养。
3 张中行《文言津逮》。介绍如何学习古文的。也介绍如何循序渐进挑选古籍和使用工具书阅读古文。
4《古文观止》,收录了从先秦到明朝的各种文体,根据注释读一遍会学到很多。推荐北京大学阴法鲁《古文观止译注》。另外还有繁体竖排的吴楚材吴调侯的原本《古文观止》,可以对照看看。
5 欧阳修主持编撰的《新唐书》和《新五代史》,欧阳修是古文运动改良的先驱,他力求将古文通俗化,删除了生僻晦涩的句子。历史也是有一定故事性的,不会让人看着看着睡着了。
本文2023-08-08 14:02:42发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/49473.html