文字资料数字化

栏目:古籍资讯发布:2023-08-05浏览:1收藏

文字资料数字化,第1张

一、文字资料数字化原则

现存的航空物探资料是中心开展航空物探50年来勘查和科研成果的积累,真实记录了中心航空物探技术进步和发展历程,反映了航空物探在地质找矿等方面的先行作用和突出贡献。为实现航空物探资料的信息化管理和永久利用,扩大航空物探服务领域,航空物探文字资料数字化和信息化原则是“尊重历史,忠实原著,保持原貌,统一要求,加强监控,确保质量”。

二、文字资料数字化流程

航空物探资料文字资料数字化是把航空物探勘查和科研项目纸质文字资料录入成电子文档,同时把手写、油印的文字资料扫描成图像格式保存,并编写项目成果简介(图8-5)。

图8-5 文字资料数字化流程图

三、文字资料数字化方法

文字资料数字化实质是对中心现存的航空物探勘查和科研成果报告采用扫描识别和人工录入两种方法输入计算机中,并按航空物探信息系统规定的格式和版式重新编辑,形成Word文档(DOC格式)和Adobe Acrobat文档(PDF格式)以满足入库要求。

(一)文字资料介质质量分类

为采取合理的数字化方法进行文字资料数字化,通过对中心库存的文字资料进行较详细的调查,按纸质资料介质质量好坏、字迹和插图清晰程度等将639份勘查和科研成果文字资料(报告)划分为较差、中等、较好、良好4类(表8-4)。其中,1973年前资料均较差,较差和中等质量的资料都出现在20世纪80年代中期以前。20世纪80年代中期以后的项目资料质量均属较好和良好。

表8-4 文字资料介质质量分类统计表

(二)文字资料数字化方法

以资料分类为基础,根据文字资料数字化原则,确定了文字资料数字化具体方法。

1人工录入法

由于较差和中等类资料多数是手写、复写或油印本,少数是铅印本;存放时间长,几经辗转搬迁,破损严重,字迹模糊;无法采用扫描、识别方法输入,只能人工录入。对录入工作提出了具体要求,以保证人工录入质量。

2扫描识别输入法

较好和良好类资料都是正规铅印或Word文档(DOC格式)印刷出版,字迹清晰,可用扫描识别方法予以输入,与人工录入方法相比效率较高。

人工录入、编辑航空物探勘查项目文字报告608份,约27396751万字;人工录入、编辑航空物探科研项目文字306份,约8390241万字。

为了保证中心资料获得长久保存,同时对已人工录入的全部较差和中等类617份约9719页的文字资料(其中,勘查115份,约3240页;科研502份,约6479页)进行了扫描输入,以PDF格式直接刻制光盘保存。

四、校对和检查

文字资料由人工录入或扫描识别,经自检形成的Word电子文档全部校样必须通过二校和部分三校或抽检,才能进入编辑排版,最终生成统一的DOC格式的Word文档。

由于历史原因,在早期原稿(包括文字和插图)中存在着其他一些错误或不规范等现象。在保持原稿真实性的前提下,尽可能地在校样中对问题予以纠正和变通处理,有些则因本身遗漏或模糊无法弥补,留下空缺。按原文字资料所附的勘误表对文字逐一进行了更正,原有勘误表基本已失去存在意义了。

五、插图扫描矢量化

使用MapGIS软件对原文字报告中的测区示意图、剖面图、地质解释图等1260幅插图按照原插图进行矢量化,原插图比例尺使用数字比例尺表示的换算成线性比例尺,单剖面图加上剖面比例尺,统一了地质图中的地质符号等,提高文字报告的插图质量(图8-6)。

六、编辑排版

除勘查项目与科研项目文字报告在内容上客观存在的不同外,既使是同一类报告在报告内容、排版编辑上也都有较大的差别。这是航空物探技术进步必然的反映,也与以往文字资料缺乏统一标准和要求有关。在本次文字资料数字化过程中,根据项目统一要求,便于计算机管理和服务,在保持报告内容不变的前提下,将所有录入的文字成果报告采用Word编辑排版软件按规定的编辑模版自动生成目录,并在报告封面等形式上力求做到统一(校样最终稿与原稿在报告封面、目录级别、插图和页码位置等方面都存在着差别,但报告内容没有改变)。按此要求完成了799份约47645页文字资料的排版工作,并把文字资料格式由DOC格式转换为PDF格式。

图8-6a 矢量化前的插图

图8-6b 矢量化后插图

七、项目简介编写

为了使用户不阅读项目成果报告全文,能够快速地了解该项目概貌,获得该成果报告的主要内容和信息,按照航空物探信息系统建库要求,编写了航空物探勘查和科研项目简介455份,约28万字。其中,航空物探勘查成果报告423份,约26万字;科研成果报告32份,约2万字。以浓缩的形式概括项目成果的主要内容,包括工作方法或研究方法、质量评价,取得的主要成果和最终结论。

相信很多朋友在这段时间已经看到过一则非常让人震惊的消息,那就是在5月18日的时候,20万页的古籍以数字化的方式回归到了我们的眼前。这让很多网友在表示非常震惊的时候也表示非常的疑惑,究竟这群专家是用怎样的方式来做到这样的地步的,下面小编就带领大家来看一下。

根据网络上相关的信息表明,在世界博物馆日的这一天,海外古籍数字化回归发布会,在中国的科技馆直接进行了相关的发布会。一大批珍藏于加州大学伯克利分校的中文古籍善本以数字化的方式回归到了自己的家乡,并且直接落地在了这样的平台之上。我们可以看到的是首批20万页古籍首先回归到自己的家乡里面,并且通过这样的方式以后可以方便更多的人来去检索和查询这样的书籍。

而在这一切的最后的最大的功臣就是一位七旬的老人。这位老人家就是中央文史馆馆员,四川大学的教授成陈立,这位老人家花费了两年的时间,并且直接奔走联系了加州的大学伯克利分校,希望你用现代化的技术,能够让收藏在这所学校的中文古籍得到相关的修复,并且能够以数字化的方式回归到自己的本土里面。所以这才有我们所看到的一面,才能够最终看到有四十多种宋元真本向公众开放。才能让这一批流失在外面的书籍最终回到自己的家乡,这对我们来说是非常重要的。

通过这样的技术,能够将这些古籍回归到自己的家乡,我觉得是非常了不起的,也是非常的去佩服的。也很佩服这些技术团队和专家,能够联手开发这样的系统识别,这不仅仅是对这批古籍有着非常好的作用,对于以后流失在外国的相关的书籍也有着非常强大的作用。

古籍修复的原则包括最少干预原则、整旧如旧原则、可逆性原则、最大限度保留历史信息的原则

1、最少干预原则

在古籍的修复中,摈弃传统的整卷整叶托裱的方法,对文献各部分的残破现状做具体分析,对不同情况予以不同处理。尽量少地在藏品上添加修复材料,避免因过度修复而造成的保护性破坏,尽量保留古籍文献的各种研究信息。

2、整旧如旧原则

在修复中尽可能保持古籍文献的原貌,保留文献的装帧风格。这里所谓的“整旧如旧”,并不是企图回复该文献没有损坏以前的原貌,“如”古代的“旧”。古代的那个“旧”,不可能再恢复,而是尽可能保持该文献修复前的原貌,就是在修复工作中仅使该文献的残破部分得到养护,决不使其它部分的现有状况产生任何形态上的改变。

3、可逆性原则

即修复措施是可逆的,可重复的。如果将来 发现有更科学更适宜的保护修复技术,随时可以更换修复材料,回到修复前的原来状态。同时可逆性原则对于我们改正工作中的失误而尽量不损害古籍非常必要。

4、最大限度保留历史信息的原则

即修复中所用的修复材料(纸张、线、颜料、墨等)必须与原始文件的材料有一定的色差,避免与藏品本身固有的历史信息混淆。

扩展资料

古籍修复选取纸张的注意事项:

选取修补古籍的纸张,首先要注意纸张的酸碱度,不能用酸性纸张去修补古籍,以免引起或加速古籍纸张的酸化;其次,如果选用旧纸修复古籍,要注意旧纸的纸张强度不能太低。

同时,还要注意所选纸张的纤维组成应该与古籍的纸张相近,厚薄相近,颜色相似但不能相同。补纸的吸水性要强,才易于粘合,纸张帘纹的宽窄也要相近。

具体修复工作中还要注意补纸与古籍纸张的帘纹方向要一致。总之这些都适宜了,才能使修复处纸张粘结的牢固服帖,与原来的书叶协调自然。

-古籍修复

热门文章
    确认删除?
    回到顶部