读者可以在书目检索计算机上做什么
通过本系统,读者可以查到首都图书馆馆藏的1949年以来的中文普通图书、港台图书、1900年之后的报刊资料,以及古籍善本、北京地方文献、电子文献和视听资料。
古籍善本图书采用本馆编制的《中文古籍分类表》。分经、史、子、集、丛五部,部下再分细类。查询古籍文献时,在“分类号”中输入部和类,中间加间隔号“·”。
例如“经部·易类”,在检索时所有“经部·易类”的古籍或“易类”下各细类的古籍,都为符合条件的书目信息。具体参见“中文古籍分类简表”。
分类号--文献的学科属性标识:
1. 中文图书采用《中国图书馆图书分类法》进行分类。分类号由字母和数字组配而成,共22大类。如:红楼梦,分类号为I24247。具体参见“中国图书馆法分类法简表”。
2. 地方文献图书采用采用本馆编制的《北京地方文献分类表》。分类号由字母和数字组配而成,共19大类。例:《北京十六景》分类号为“C4” 具体参见“北京地方文献分类简表”。
古籍书目查询,包括四部丛刊、四库全书、续修四库全书、四库未收书辑刊、四库存目丛书、四库禁毁书、古本小说集成、古本小说丛刊、石刻史料新编1-4辑、中华大藏经、中华道藏、六十种曲、笔记小说大观、丛书集成初编、丛书集成新编等。可查约55万种古籍。
台湾中央研究院汉籍电子文献全文检索系统(瀚典全文检索系统)
目前最主要的古籍全文检索系统几乎全部集中在台湾。中央研究院汉籍电子文献 中央研究院汉籍电子文献(旧称瀚典全文检索系统)是迄今最具规模的中文古籍数据库,也目前网络中资料整理最为严谨的中文全文数据库。它包含整部二十五史、整部阮刻十三经、超过2000万字的台湾史料、1000万字的大正藏以及其它典籍,合计字数13400万字,并以每年至少1000万字的速率增长,蔚为壮观。 汉籍电子文献所有资料包括二十五史、诸子、古籍十八种、古籍三十四种、大正新修大藏经、上古汉语语料库大部分资料则免费开放,不仅提供查询,还可全文浏览古籍。 在汉籍资料库的一级栏目的最后,有一个不太引人注目的人文资料库师生版,是为普及文史教育而向台湾大中
全文检索是一种将文件中所有文本与检索项匹配的文字资料检索 方法 。那么你对全文检索了解多少呢以下是由我整理关于什么是全文检索的内容,希望大家喜欢!
全文检索的简介
基本介绍
全文检索是将存储于数据库中整本书、整篇 文章 中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章、节、段、句、词等信息,也就是说类似于给整本书的每个字词添加一个标签,也可以进行各种统计和分析。例如,它可以很快的回答“《红楼梦》一书中“林黛玉”一共出现多少次”的问题。
与之相关的议题
语根处理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
断词/分词 word segmentation
倒排索引 inverted index
算法、搜寻策略之模型
布尔式 boolean
统计模型 Probabilistic model
向量空间模型 vector base model
隐性语义模型 Latent semantic model
系统检索的介绍
评量之准则
判断检索效果的两个指标:
查全率=被检出相关信息量/相关信息总量(%)
查准率=被检出相关信息量/被检出信息总量(%)
开放源代码之全文检索系统
Apache Solr
BaseX
Clusterpoint Server(freeware licence for a single-server)
DataparkSearch
Ferret
Ht-//Dig
Hyper Estraier
KinoSearch
Lemur/Indri
Lucene
mnoGoSearch
Sphinx
Swish-e
Xapian
ElasticSearch
议题优化的概念
和中文有关的议题
断词(分词)
语法解析
古籍议题
多语言混合
优化
剔除字(Stopwords)
词性标注
权威档(authority file)
知识体系,本体论(ontology)
超链接分析(page rank)技术
历史及未来之趋势
自由语句搜寻
不支持。根据查询《国学宝典中华古籍全文检索系统》信息得出,《国学宝典中华古籍全文检索系统》支持反复制功能,即不支持文字复制。《国学宝典中华古籍全文检索系统》是以一种专门开发给古籍研究者的专业检索系统。
读者可以在书目检索计算机上做什么
本文2023-11-02 23:18:39发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/194735.html