怎么把古书扫描成文字

栏目:古籍资讯发布:2023-08-08浏览:1收藏

怎么把古书扫描成文字,第1张

1 怎样利用扫描仪,把书本上的文字转换成WORD文件

方法一、最简单的方法是选择一键OK的机器,直接选择带有这个快捷按键功能的机器,按一下即可转换到Word或者是Excel格式。

还有一种方法是选择汉王的软件有个文本王的版本,直接扫描进去后,选择插入WORD的图标,即可转换,明基的扫描仪最低端的机器都有配的。方法二、首先将扫描仪安装好,接下来启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。

提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。

这里也要设置为“黑白模式”,建议分辨率为300dpi。扫描完毕后回将自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。

点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到Word中去了。

如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中就行了。建议安装Office的时候选择将其附加程序完全安装 然后在XP系统下。

扫描仪连接后,双击扫描仪,会出来一个 Microsoft Office Documents Scanning 的提示 选用它来扫描。待扫描完成后上方有个带word图标的按钮按一下。

就会发现你扫描的文字已经存在于word中了只不过他存出来是web格式的doc文档。再做简单的转化就行了这个微软的OCR识别效果相当好,而且对于像书一样的一次可以扫描左右两页并且它可以自动将这两页按页码顺序排布下来。

以上是在windows XP + Office 2003下运行通过 方法三、用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。OCR软件推荐尚书OCR、汉王OCR。

用扫描议扫为Adobe Acrobat Reader 简体中文版的文件,再用快照,粘出来就行了,文字还是文字,还是,也可以直接转换用扫描仪扫描,并用OCR软件进行识别,输出成文本,粘贴到WORD就行了。举个例子:以中晶扫描仪的识别软件-尚书OCR为例,将书本放到扫描仪的平板时,最好将书本夹角有文字处尽量贴向平板!以保证文字扫描时不会扭曲,可保证识别时的正确率!将文字区域扫描到尚书OCR软件以后,先确认左上角“文件”菜单下的系统配置是识别简体中文或者纯英文(注:繁体识别率会有所下降!)。

然后做下倾斜校正(在“编辑”菜单下),如果文字区域明显倾斜,有可能识别出来是乱码或错误信息! 校正完成后,版面分析,工具栏上有图标,然后识别!最后点“输出”菜单输出到指定格式,选择“RTF”格式,这个保存出来就是Word文档了!方法四、安装OCR软件,在使用OCR软件识别前,可用用处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 文字提取(OCR)图解教程 或Microsoft Office Document Imaging(office2003中内含) OFFICE中有一个组件document image,功能一样的强大。

不仅扫描的文字,连数码相机拍的墙上的宣传告示上的字都能提取出来。第一步 打开带有文字的或电子书籍等,找到你希望提取的页面,按下键盘上的"ALT+打印屏幕键(PrintScreen)"进行屏幕取图,或者用其他抓图软件。

保存成tif格式。第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开,找到OCR识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的office安装文件。

第三步 用 Microsoft Office Document Imaging打开,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。 或用摄像头作扫描仪输入文字:我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的好多的朋友在写论文,资料的时候总是要用一些书上的资料总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题一,安装Microsoft office 2003 (仅以office 2003为例。

其它版本office均可) 二,打开“开始→Microsoft office→Microsoft office工具→Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。

三,再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到画面,该会显示在“。

古籍蝴蝶装订方法图解如下:

1、把打印好的小册子对折起来,一个对折叫做一台,一本书可以分为好多台,这里我把5张A4纸对折成一台,厚度比较合适,可以根据纸质的不同,尝试把不同张数的纸对折为一台。如下图:

2、把每台折页均匀的打上六个小孔,以方便穿针。对了,还需要折叠两个“蝴蝶页”,也叫“衬页”。我用的的厚一些的纸,比较结实,也都打好孔。如下图:

3、以蝴蝶页为最下面一台开始穿线。像图示一样,留出一个绳套,装订下一台的时候,针线需要穿过这个绳套。末尾要留出一段线绳。如下图:

4、像图示穿线一样,装订下一台。把线绳拉紧,在末尾打结,这样两台折纸就装订紧了。如下图:

5、打结之后穿入第三台,像前面一样穿线,但是从孔里穿出后,要穿过下面两台之间的锁线处,在穿回孔里,像下图这样。

6、每台都装订好后,到末尾线绳穿出以后,穿过下面两台之间的锁线处,然后打结,再穿过下一台的锁线处,再打一次结,就可以了,如果书籍比较厚,可以以此类推,多打几次结。如下图:

7、装订好以后,先下图一样,涂抹白胶,沾上纱布,再沾上和纱布同样大小的衬纸。等胶水干了以后,可以用壁纸刀,把书边裁切整齐。如下图:

8、接下来准备硬纸板和牛皮纸,准备制作硬书壳,如果有条件,也可以用布料和皮革来制作书皮,可以尽情发挥想象力,制作自己喜欢的风格,当然前提是比较结实、耐用。如下图:

9、涂上白胶,将书皮和硬纸板粘结实。把前后蝴蝶页跟书皮粘贴牢固,大功告成。书的封面,是一个发挥想象力的地方,开动大脑,做出你最喜欢的风格吧。

蝴蝶镶:蝴蝶镶在现存古籍中,只能算一种特殊的装订印刷形式,不知它出现的具体年代,也讲不清它的消亡时间,而清代内府刻书中这种形式也确实存在。

笔者近期整理内府刻书时发现几部,如:清乾隆十七年武英殿刻本《平定两金川方略二十六卷图说一卷》,嘉庆年间武英殿刊刻的《钦定大清会典》,道光十六年国子监刊刻的《钦定国子监志》,其装帧及版刻形式未见前人提及,也未见有关书目文献记载。

书籍装帧是书籍生产过程中的装潢设计工作。又称书籍艺术。书籍装帧是在书籍生产过程中将材料和工艺、思想和艺术、外观和内容、局部和整体等组成和谐、美观的整体艺术。

书籍装帧设计是书籍造型设计的总称。一般包括选择纸张、封面材料、确定开本、字体、字号,设计版式,决定装订方法以及印刷和制作方法等。

书籍装帧设计是指书籍的整体设计。它包括的内容很多,其中封面,扉页和插图设计是其中的三大主体设计要素。

用蓝色(准确说是靛青)跟当时的染色工艺水平有关。

与内容表达之类的关系不大,所谓的”色彩象征“推断更是牵强。(想想瓷器的纹饰?)

植物染料也是我国古代染色工艺的主流[1],布料和纸张染色一般使用的也是植物染料,最常见的是用蓼蓝做成藏青或靛青染色[2]。

因为书籍装帧用的胶水(即化学合成类胶)是现代才出现的。

线装是明朝中叶出现于明朝中叶,其实更早时候的包背装、蝴蝶装、册页装(旋风装经折装都算是它的过度)才是主流。之所以你看到的都是线状,除了更易保存之外,跟明清时期书籍印刷数量大幅增长也有关。

[1]另外常见的还有:赤——茜草 红花 苏枋;黄——槐花 姜黄 栀子 黄檗;黑——五倍子、苏木等等,青赤黄白黑共同构成的中国原色称为「五色」,是中国传统色彩体系的根基。

[2]「终朝采蓝,不盈一詹。——《诗经•小雅•采蓝》」和「蓝,染青草也。《说文》」中所说的「蓝」,就是指的蓼蓝。

因为古代并没有打印机,所以并没有办法大批量的生产书籍。虽然当时已经有了印刷术,但是想要印上一本书也是比较困难的,而且成本也很高,所以很多古籍都是手写的。想要抄录一本书要耗费大量的时间,而且很多书籍都是谁需要谁就去抄的,所以大部分人在抄录的时候就只会抄录一本,这样这些书就算是好不容易流传到了今天也都是孤本。

就算是有些古籍并不止一本,在一代代的流传下来,也会有破损和丢失,所以大部分的古迹都是孤本。很多人都非常喜欢收集古代的书籍,因为古代的书籍不仅非常的有文献价值,而且很有历史意义。在古籍当中有孤本和善本,还有真本的分类。在这些分类当中,孤本肯定是最有价值的,因为这些孤本在世界上就只有这一本,所以是独一无二的。

这些孤本之所以珍贵,是因为仅此一本,所以很多人都非常好奇,既然这些书非常的珍贵,为什么古人在抄录的时候不能再多抄录几本呢?古代的科学技术没有现在那么先进,现在大家在印书的时候都是直接用打印机印的,所以想印几本就印几本。但是古代的时候大家想要复制一本书籍,就只能用手抄。虽然可能在古代的时候已经有了印刷术,但是那个时候印刷术还非常的不普遍,而且耗费的时间和精力也非常的多。

所以想要抄完一本书是要耗费很多的时间的,而且像非常有价值意义的书是经过了很多人共同编写才完成的,所以根本就没有时间和精力再去抄录第二本。像是明成祖时期的《永乐大典》,就是收集了很多的古书,两千多个人一起参与编撰的。而且这本书写了很长的时间才完成的,所以想要再抄录一本是非常困难的事情。嘉靖在闲着的时候就把《永乐大典》给抄写了一遍,就单单是抄这一本书,就花了他五年的时间。

热门文章
    确认删除?
    回到顶部