国外古书能否全部扫描成电子版

栏目:古籍资讯发布:2023-08-08浏览:8收藏

国外古书能否全部扫描成电子版,第1张

海外古籍数字化回归:如何做到“为天下人所用”?

南方周末

原创

2021-6-2 00:09 · 《南方周末》官方账号

陈力和何梦超讨论古籍数字化方法。 (达摩院供图/图)

流散海外八十多年后,文澜阁本《四库全书》中的《宋百家诗存》重现大众视野。

在扫描影像中,这本中国古籍上的水浸、虫噬、霉变历历可见,每一处都是历史的风霜。1790年左右,《宋百家诗存》随《四库全书》入藏杭州文澜阁,清咸丰年间在太平军入杭后散失,1861年左右被嘉业堂收藏。抗战时期,部分嘉业堂藏书流落到了上海,可能被日本人收购,并于1949年辗转到了美国,如今藏于加州大学伯克利分校东亚图书馆。

东亚图书馆收藏了大量中国古籍善本,截至2021年5月18日,其中二十万页被扫描影像、读取文字,以数字化形式回归祖国。

这是海外古籍回归项目“汉典重光”的成果之一。这批数字化古籍善本中既有宋元本,也有明清至民国时期著名学者的稿本、抄本,其中一些是以前很少有人见过的珍贵藏本,比如清文澜阁本《宋百家诗存》。

古籍流散海外的原因多种多样,实体回归几乎是不可能的,比较可行的办法是数字化回归。

此前的古籍数字化平台,大多是展示扫描后的古籍,读者只能在这些平台阅读,无法就书中内容进行检索分析。此次汉典重光的数字化团队不仅将古籍扫描,还将扫描下来的识别转化成了电子文字。搜索某一字词,可以跳转到字词所在书本的具体章节段落。

这些古籍资源将向公众免费开放。阿里达摩院院长张建锋表示,汉典重光古籍数字化平台将被捐赠给权威公共机构长期运营。

“让蒙尘的古籍重焕新生”

四川大学历史文化学院教授陈力是汉典重光项目的古籍专家。陈力的父亲是教历史的,1977年,陈力作为恢复高考的第一届考生,填报的所有志愿都与历史、中文、图书馆相关,最后被省内第一志愿四川大学历史系录取,从此“一辈子都在做这个”,对古籍积累下一份深厚的感情。

在汉典重光项目之前,陈力已经参与过古籍数字化项目。他曾经在国家图书馆工作18年,其中一半的时间分管古籍,经手过哈佛大学燕京图书馆的一个古籍数字化回归项目。2009年,燕京图书馆馆长郑炯文专门从美国飞到中国商量相关事宜,目录都筛选完成了,也做完了一部分书的扫描,但项目最终因为资金、技术等没能达到预期而搁浅。

这次未竟的合作在某种程度上成为汉典重光项目的起源。在哈佛大学访问期间,高晓

原理就是采用矩阵式CCD技术点对点的扫描,在加上自动翻页模拟人工手臂自动翻页的技术这就是全自动书刊扫描仪的原理。虽然是机械手臂但是我看到过用来扫描古籍翻页甚至比人手还要轻柔,古籍纸质陈旧,扫描速度就需要防慢,这样的化还不会损坏古籍。

用office 的Document Imaging OCR文本识别功能,能从扫描文件中识别文字转换成文本或word格式文件;

从开始-程序-office-打开软件

先打开扫描的Tag图像文件格式的文件,点 工具-‘使用OCR识别文本’识别出来,然后另存为文本文件。

热门文章
    确认删除?
    回到顶部