求扫描版古籍转文本的工具
用office 的Document Imaging OCR文本识别功能,能从扫描文件中识别文字转换成文本或word格式文件;
从开始-程序-office-打开软件
先打开扫描的Tag图像文件格式的文件,点 工具-‘使用OCR识别文本’识别出来,然后另存为文本文件。
古籍、档案、字画仿真复制系统主要由图像采集设备、图像处理设备、打印输出设备等三部分组成,外加统一套专业的仿真复制控制软件。其中最关键的设备就是图像采集设备,即扫描设备。只有获得高清的数字图像,在后期的图像处理和输出打印时才能得到完美的效果。
因为古代并没有打印机,所以并没有办法大批量的生产书籍。虽然当时已经有了印刷术,但是想要印上一本书也是比较困难的,而且成本也很高,所以很多古籍都是手写的。想要抄录一本书要耗费大量的时间,而且很多书籍都是谁需要谁就去抄的,所以大部分人在抄录的时候就只会抄录一本,这样这些书就算是好不容易流传到了今天也都是孤本。
就算是有些古籍并不止一本,在一代代的流传下来,也会有破损和丢失,所以大部分的古迹都是孤本。很多人都非常喜欢收集古代的书籍,因为古代的书籍不仅非常的有文献价值,而且很有历史意义。在古籍当中有孤本和善本,还有真本的分类。在这些分类当中,孤本肯定是最有价值的,因为这些孤本在世界上就只有这一本,所以是独一无二的。
这些孤本之所以珍贵,是因为仅此一本,所以很多人都非常好奇,既然这些书非常的珍贵,为什么古人在抄录的时候不能再多抄录几本呢?古代的科学技术没有现在那么先进,现在大家在印书的时候都是直接用打印机印的,所以想印几本就印几本。但是古代的时候大家想要复制一本书籍,就只能用手抄。虽然可能在古代的时候已经有了印刷术,但是那个时候印刷术还非常的不普遍,而且耗费的时间和精力也非常的多。
所以想要抄完一本书是要耗费很多的时间的,而且像非常有价值意义的书是经过了很多人共同编写才完成的,所以根本就没有时间和精力再去抄录第二本。像是明成祖时期的《永乐大典》,就是收集了很多的古书,两千多个人一起参与编撰的。而且这本书写了很长的时间才完成的,所以想要再抄录一本是非常困难的事情。嘉靖在闲着的时候就把《永乐大典》给抄写了一遍,就单单是抄这一本书,就花了他五年的时间。
本文2023-08-07 01:24:27发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/37788.html