国外古书能否全部扫描成电子版
海外古籍数字化回归:如何做到“为天下人所用”?
南方周末
原创
2021-6-2 00:09 · 《南方周末》官方账号
陈力和何梦超讨论古籍数字化方法。 (达摩院供图/图)
流散海外八十多年后,文澜阁本《四库全书》中的《宋百家诗存》重现大众视野。
在扫描影像中,这本中国古籍上的水浸、虫噬、霉变历历可见,每一处都是历史的风霜。1790年左右,《宋百家诗存》随《四库全书》入藏杭州文澜阁,清咸丰年间在太平军入杭后散失,1861年左右被嘉业堂收藏。抗战时期,部分嘉业堂藏书流落到了上海,可能被日本人收购,并于1949年辗转到了美国,如今藏于加州大学伯克利分校东亚图书馆。
东亚图书馆收藏了大量中国古籍善本,截至2021年5月18日,其中二十万页被扫描影像、读取文字,以数字化形式回归祖国。
这是海外古籍回归项目“汉典重光”的成果之一。这批数字化古籍善本中既有宋元本,也有明清至民国时期著名学者的稿本、抄本,其中一些是以前很少有人见过的珍贵藏本,比如清文澜阁本《宋百家诗存》。
古籍流散海外的原因多种多样,实体回归几乎是不可能的,比较可行的办法是数字化回归。
此前的古籍数字化平台,大多是展示扫描后的古籍,读者只能在这些平台阅读,无法就书中内容进行检索分析。此次汉典重光的数字化团队不仅将古籍扫描,还将扫描下来的识别转化成了电子文字。搜索某一字词,可以跳转到字词所在书本的具体章节段落。
这些古籍资源将向公众免费开放。阿里达摩院院长张建锋表示,汉典重光古籍数字化平台将被捐赠给权威公共机构长期运营。
“让蒙尘的古籍重焕新生”
四川大学历史文化学院教授陈力是汉典重光项目的古籍专家。陈力的父亲是教历史的,1977年,陈力作为恢复高考的第一届考生,填报的所有志愿都与历史、中文、图书馆相关,最后被省内第一志愿四川大学历史系录取,从此“一辈子都在做这个”,对古籍积累下一份深厚的感情。
在汉典重光项目之前,陈力已经参与过古籍数字化项目。他曾经在国家图书馆工作18年,其中一半的时间分管古籍,经手过哈佛大学燕京图书馆的一个古籍数字化回归项目。2009年,燕京图书馆馆长郑炯文专门从美国飞到中国商量相关事宜,目录都筛选完成了,也做完了一部分书的扫描,但项目最终因为资金、技术等没能达到预期而搁浅。
这次未竟的合作在某种程度上成为汉典重光项目的起源。在哈佛大学访问期间,高晓
赛数OS12002V非接触式古籍扫描仪是一款专为古籍、珍贵图书扫描设计的非接触式扫描仪,独有90°V型稿台,特别适用于装订成册不能完全打开的古籍的数字化,具有扫描精度高、扫描轻柔、智能化等特点。因此,该款设备在工作中主要用于老旧的或较为珍贵的古籍善本的数字化工作,广泛应用于各大图书馆、博物馆。
用office 的Document Imaging OCR文本识别功能,能从扫描文件中识别文字转换成文本或word格式文件;
从开始-程序-office-打开软件
先打开扫描的Tag图像文件格式的文件,点 工具-‘使用OCR识别文本’识别出来,然后另存为文本文件。
这个标准是随着时代的发展而改变的,而现在所公认的则是"三性"与"九条"
"三性":历史文物性,学术资料性,艺术代表性
"九条":“九条”是“三性”的补充和具体规定,主要包括:元代及元代以前刻印抄写的图书;明代刻、抄写的图书;清代乾隆以前流传较少的刻本、抄本;太平天国及历代农民革命政权所刊印的图书;辛亥革命前,在学术研究上有独到见解,或有学派特点,或集众说较有系统的稿本以及流传很少的刻本、抄本;辛亥革命以前,反映某一时期、某一领域或某一事件资料方面的稿本以及流传很少的刻本、抄本;辛亥革命以前的名人学者批校、题跋或过录前人批校而有参考价值的印本、抄本;在印刷术上能反映古代印刷术发展,代表一定时期技术水平的各种活字印本、套印本或有精校版画、插画的刻本;明代的印谱、清代的集古印谱、名家篆刻印谱的钤印本,有特色的亲笔题记等。应该指出的是,善本是一个历史概念,随着时代的发展,其内容会不断发展、更新。比如善本的时代下限,丁丙认为明本是善本;现在从书籍流传的实际出发,一般确定在乾隆六十年(公元1795年),就是一个发展的过程。
何谓古籍善本?清朝版本目录学家张之洞的解释为:一是足本,没有删节和缺卷;二是精本,精校精注,错误极少;三是旧本,即传世很久的木刻本、传抄本和线装书。当代学者对古籍善本的解释为:一是年代久远而且有文物性;二是印刷插图精美而具有艺术性;三是书籍内容精辟具有学术资料性。国家文物法对古籍善本曾明文规定,凡是乾隆六十年(1795年)以前出品的文物和图书,均受国家法律保护,不得私自出口。于是收藏家们往往将这一时限之前的清代初期或更早期的精刻本和精抄本视为珍宝,因为最起码它的历史文物价值和学术资料价值是显而易见的,从而决定了其收藏和投资价值也是相当高的。古籍善本由于是纸质品,很容易受到损毁,如水灾、火灾、虫蛀等自然及人为因素的影响,保存几百年甚至更长时间实属不易,这就导致了流传下来的古籍善本十分稀少,许多古书现已绝迹,留存下来的古籍善本中不乏孤品、珍品,有的存世量也不过是寥寥几部,因此,古籍善本的价值珍贵也就不难理解了。
一、评判古籍善本价值的标准
1、文献价值 古书籍所描述记载的史料非常丰富,是研究古代社会不可缺少的第一手材料,因此古籍的价值首先体现于它的文献价值。
2、版本价值 古籍的版本种类很多,一般来说,稿本(作者的原稿)、旧抄本、原刻本、精刻本、初印本以及各类活字印刷本等版本的价值更高。
3、艺术价值 有些古籍字体雕刻精美,印刷水平较高,如精写本、精刻本、各种套印本、红印本、拱花等。
4、学术价值 如名家稿本、精校本以及在某一学术领域有独到见解或较为少见的稿本、写本、批校本、过录本等,都有很高的学术价值。
5、文物价值 有些古书,抄写或刻印本年代久远,流传又稀少,如宋版书存世不多,无论从纸质、墨迹、印刷技能、装帧水平等方面都具有很高的文物考古价值。
二、各种古籍善本的市场价格
近年来,我国古籍善本在拍卖市场上行情十分走俏,价格不断向上攀升。如一册《唐人写经遗墨》以88万元成交,《续华严经疏》以40万元成交,《四库全书珍本》以29万元成交,明代版《陀罗尼经》成交价9万元,清乾隆年间《汪由敦诗翰》成交价165万元,民国版《朱拓千叶莲花造像》成交价055万元等等,可见古籍善本近年来已成为拍卖会的重头戏,购买者十分踊跃。古籍善本现已成为收藏家们苦苦追求的收藏精品。
目前,市场上的古籍善本价格还在不断攀升,特别是宋版书或更早的古籍涨幅更是惊人,眼下一般宋版书都是按页论价,而不是以本论价。一页品相上好的宋版书市场价大致在1 万元左右,换句话说,一册100页左右的宋版书价值可达到100万元左右。由于宋版书十分珍稀,其市场价格有可能还会进一步上升。元版书市场价与宋版书相差不是很大,市场价也随着宋版书的上扬而升值。明版书市场价要比宋版书低不少,其价格目前还比较平稳,但明版书要比以后的清版书的价格昂贵。明代初期的版本因流传下来的比较少,所以明初版本的升值潜力千万不可小视。明代中叶及明未的各种版本由于尚有一定的存世量,在相当一段时期内其市场价格仍将平稳地维持着原状。清版书由于存世量较大,清中叶及晚清的版本,市场价还不是很高。但清初康熙、乾隆年间的版本仍具有很高的收藏和投资价值。清代图书以木刻为主,晚清时有一部分石印版出现。清代版本尽管目前价格不是很高,但在这部分存世量较大的图书中仍不乏精品善本,这就要看收藏者的识别能力了。此外,民国初期的石印版和二十世纪30年代的一部分铅印版、影印版虽然不属于很珍贵的古籍善本,但也值得投资者收藏。古籍善本由于近年来在收藏品市场上十分受宠,因而各种伪造的古籍善本也应运而生。
三、古籍善本的几种作伪手法。
1、纸张做旧:纸张是文字的载体,没有纸张就没有书籍,因此判断古籍的真伪,首先要看纸张是否古旧。所以制作古籍伪本必须将纸做旧。将纸做旧有两类:一类是“染纸”,包括用糖水,或用栗子壳熬水,或用茶水,或用其它方法等将纸染成黄褐色,也有用烟将水熏黄的,以求使纸显旧色;二类是用“旧纸新印”,如果作伪者存有古纸,就可在纸上面新印古书内容,然后订成“古籍”,这种作伪方法尽管较少,但却使人很难从纸张上辨别其为赝本。
2、伪造序跋:一些重复刻印本上,除保留有原书的序跋外,又增刻新有序跋,叙述重印的原因,序跋后还著有姓名、年月等。这些都表明了书籍的真实年代。作伪者往往裁掉对其作伪不利的序跋,或涂改其中的年代,也有重新伪造对其作伪有利的序跋。
3、伪造名人题跋,藏章印记。
4、伪造牌记:保留旧牌记,挖掉复刻牌记,或挖补,涂改复刻牌记的年代。
5、裁截目录:将原目录裁去部分或全部,使人不知收全该书究竟有多少卷,以便用残本充当全本。
6、利用著录书:有些著录书的记载是错误的,作伪者便故意以此为据来兜售自己制作的伪本。
总之,古籍善本作伪的手法有多种多样,有时只采用一、两种,有时则可能是各种手法混合应用。收藏者在实际辨别时,应该运用自己掌握的学识和有关资料进行全面考察被鉴定的古籍,并可请专家一起鉴定,应注意去伪取真,才能真正做到所购古籍物有所值。
本文2023-08-03 21:36:30发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/3135.html