史学的数字化对史学研究的推动
最近十几年,中国的古籍数字化步骤在加快。《四库全书》、《四部丛刊》、《汉籍电子文献》(台湾中央研究院)及建设中的《中国基本古籍库》、《四库全书存目丛书》等大型丛书的电子化,则使古籍的使用完全上升到了现代化水平。在电子版背景下,省略了复印与打字程序,使古籍资料的搜集与使用实现了“零接口”。几秒种的复制与粘贴,就可以使古籍资料变成自己想要的文本格式资料。明代史著的由由分散到集中,由“线装版”到“影印版”再到“电子版”,使读者足不出户,就可以自由纵情阅读、随意复制,极大地便利了史学的研究工作,推动了史学研究的向前发展。
2017年,甘肃人民出版社有限责任公司一次性购置赛数OS15000专业非接触式古籍扫描仪十余台,承办文溯阁《四库全书》的数字化工作。赛数OS15000专业非接触式古籍扫描仪是功能强大的数字化处理工具,简单易用,扫描精细,可轻松实现古籍的高精度数字化,也是目前国内古籍数字化工作中最常用的扫描仪之一。2022年,甘肃人民出版社有限责任公司再次购置赛数OS12002V专业非接触式古籍扫描仪两台,加速推进文溯阁《四库全书》数字化工作进度。赛数OS12002V非接触式古籍扫描仪是一款专为古籍、珍贵图书扫描设计的非接触式扫描仪,独有90°V型稿台,特别适用于装订成册不能完全打开的古籍的数字化,具有扫描精度高、扫描轻柔、智能化等特点。
这些珍藏在加州伯克利分校的中国古籍之所以能以数字化的方式成功回归,一方面有赖于四川大学教授陈力的奔走联系,另一方面有赖于阿里达摩院技术团队与四川大学专家联手研发的针对古籍识别的Ai系统。
近日,20万页的中国古籍以数字化的形式从加州伯克利分校回归的消息激动人心,根据相关媒体的报道,此次古籍的回归实属不易,其背后有四川大学教授陈力这位63岁的老人长达两年的奔走联系,也有阿里达摩院技术团队与四川大学专家利用先进的机器学习方法研发出超高准确率的古籍识别系统,个人认为,古籍是中国文化中一笔宝贵的财富,此次回归的古籍补充了中国文化的一块空白,应该被好好珍惜。
陈力教授前后联系奔走两年
四川大学教授陈力先生一辈子都在与古籍打交道,许多年来不论岗位如何变迁,一直心系古籍的保护和传承,而正是源于这份发自内心的坚持,这位63岁的老人忘我地前往加州伯克利分校奔走联系长达两年,最终促使20万页的中国古籍回归祖国。
Ai识别系统准确率高达975%
在此次的古籍回归中,先进的Ai识别系统扮演着重要的角色,据了解,该系统是由阿里达摩院技术团队与四川大学专家联手研发,他们针对古籍识别的特点利用先进的机器学习设计了一套边识别古籍、边训练模型的系统,而最终成型的系统准确率高达975%。
古籍是中国文化的一笔财富
许多年前,大量的中国古籍由于各种原因流失到了海外,中国文化因此缺失了宝贵的一部分,此次回归的20万页的中国古籍,填补了中国文化曾经被撕裂开的伤痕,是中国文化的一笔宝贵的财富。
古籍的数字化最早是从计算机技术发达的美国开始的。20 世纪 70 年代末,OCLC 和RLIN 先后推出了《朱熹大学章句索引》、 《王阳明传习录索引》、《戴震原善索引》等数据库,到 20 世纪 80 年代以后,中国的台湾、香港和大陆才相继开始了中文古籍数字化项目。 从 20 世纪 80 年代起,大陆地区开始出现了古籍数字化的工作,但是研究和成果少。直至进入 90 年代以后,随着我国计算机的普及网络技术的介入,才有了古籍数字化的雏形。90 年代中期以后,国家图书馆制订了一个庞大的古籍特藏文献数字化计划 ,如碑砧菁华、西夏碎金、敦煌遗珍、数字方志以及甲骨文、永乐大典等。北京大学《中国基本古籍光盘库》,计划收录古籍1万种 。迪志文化出版有限公司、上海人民出版社推出了文渊阁《四库全书》全文检索版。书同文数字化技术有限公司推出了《四部丛刊》的全文检索版。国学公司推出了《国学宝典》等系列产品。截止 2004 年底,网上可见的中文古籍数据库约 70 多个。北京大学主持的 CALIS 项目及南京大学图书馆 CANAL项目古籍子项目已取得阶段性成果。
本文2023-08-05 22:05:18发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/25476.html