数据库是什么?
如果我们想向南京图书馆借阅一册《永乐大典》,只须坐在电脑旁,点击中国教育科研网连接南京图书馆的站点,打开古籍书目数据库,键入书名:《四库全书》,系统响应后会显示该库中收藏《四库全书》的情况,于是便可以进一步办理借阅手续。
数据库可以通俗地比喻为存放大量数据的仓库。以科学的术语讲,数据库是存储在计算机存储设备上的数据集合。举例来说,如果我们把一本书的书名、作者名、出版单位、出版年月、主要内容等等,按照著录条例进行规范,就可以得到这本书的书目数据。目此,把许多的书目数据有序地长期存放在计算机磁盘上,使广大用户均可共享,这些书目数据于是就成为书目数据库。数据库的建立、运用和维护,全都依靠数据库管理系统软件来完成,并由人统一管理和控制。只要在图书馆的计算机上建立起书目数据库,使用计算机进行查询和检索就成为可能了。
数据库在计算机科学与技术中的发展是最快的重要分支之一。只要将数据库技术与其他学科的技术相结合,可以根据需要设计出各种各样的数据库。例如,把数据库技术与图书情报学结合可做成书目数据库;演绎数据库是将数据库技术与人工智能学结合而成的;多媒体数据库是数据库技术与多媒体技术相结合而成等等。数据库对大量信息具有进行有效存储和快速存取的能力,所以它成为大型信息系统的基础和核心,相关应用领域已从传统的商业和事务处理,扩展到科技、经济、军事、社会生活的各个领域,发挥着越来越大的作用。
1古籍善本异体字识别录入于正形技术。
2基于unicod的ocr中文善本古籍光学字符识别技术。
3古籍善本书籍文献档案全文数字化工程技术。
4古籍文献有的汉字关联的全文检索技术
5古籍文献古籍地名,人名,关联词技术应用。
6生冷僻字显示检索浏览。
7多种形式及内容的保真及还原技术。忠实原文文字版式,随时可切换对应。
8各种数字化产品展现,全文数字化,图文索引,全文本,全图像。
古籍的数字化最早是从计算机技术发达的美国开始的。20 世纪 70 年代末,OCLC 和RLIN 先后推出了《朱熹大学章句索引》、 《王阳明传习录索引》、《戴震原善索引》等数据库,到 20 世纪 80 年代以后,中国的台湾、香港和大陆才相继开始了中文古籍数字化项目。 从 20 世纪 80 年代起,大陆地区开始出现了古籍数字化的工作,但是研究和成果少。直至进入 90 年代以后,随着我国计算机的普及网络技术的介入,才有了古籍数字化的雏形。90 年代中期以后,国家图书馆制订了一个庞大的古籍特藏文献数字化计划 ,如碑砧菁华、西夏碎金、敦煌遗珍、数字方志以及甲骨文、永乐大典等。北京大学《中国基本古籍光盘库》,计划收录古籍1万种 。迪志文化出版有限公司、上海人民出版社推出了文渊阁《四库全书》全文检索版。书同文数字化技术有限公司推出了《四部丛刊》的全文检索版。国学公司推出了《国学宝典》等系列产品。截止 2004 年底,网上可见的中文古籍数据库约 70 多个。北京大学主持的 CALIS 项目及南京大学图书馆 CANAL项目古籍子项目已取得阶段性成果。
本文2023-08-04 12:56:01发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/10666.html