十六、什么是元数据?

栏目:古籍资讯发布:2023-08-05浏览:1收藏

十六、什么是元数据?,第1张

谢海洋 王素娟 元数据,英文拼写为Metadata,目前已被广泛应用于各种信息资源的管理领域中。在档案界,最早使用“元数据”的是美国的电子文件管理专家戴维比尔曼,他在20世纪90年代初发表的有关电子文件管理方面的论文中首先使用了元数据这一术语。 元数据的概念目前在档案界还没有一个统一的定论,目前比较有代表性的描述有: 1元数据是“关于数据的数据(Data about Data)”,其中,后一个Data是指被描述的信息资源,前一个Data则是指为理解该信息资源而存储的有关信息,即元数据。这是元数据目前公认最为经典、通俗和简洁的定义。 2国际档案理事会《电子文件管理指南》(1997)认为“元数据是关于文件的背景信息和结构的数据,是有关电子文件的技术性信息。” 3《澳大利亚联邦机构电子文件保管元数据标准》(1999)认为“文件保管元数据是关于电子文件背景的描述信息。” 4英国国家档案馆《电子文件管理指南》(1999)认为“元数据是关于文件和文件集合的背景及其相互关系的结构化描述和编目数据。” 5冯惠玲主编的《电子文件管理教程》认为元数据是“由电子文件系统自动记录的关于文件形成时间、地点、人员、活动、文件系统、结构及内容方面的具体数据。” 6“元数据可以理解为用来描述资源的属性与特征的信息。”-刘家真《电子文件管理理论与实践》,科学出版社2003年版。 7“元数据是对数据对象规范描述所形成的数据集合,通过计算机可读的开放语言来标记元数据,就能在系统间发现、交换、转换和理解相应的数字对象,支持系统间互操作。”-张晓林《开放元数据机制:理念与原则》,《中国图书馆学报》2003年3期。 以上描述虽然表述各不相同,但我们可以发现一个共同点,即元数据主要是动态地描述电子文档各种特征的信息数据集合,并且它能为分散的、由多种数字化资源有机构成的档案信息体系提供整合的工具与纽带。随着研究的深入,我们对元数据的认识在逐步深化。 档案工作人员为便于理解,可以简单把电子文档的元数据视为两方面:一是“著录信息或著录数据”。其中,“元数据元素就是著录项目,元数据格式就是著录项目之间关系的结构化表示,元数据编码就是著录信息的编制。”(刘越南《对电子文件管理元数据的再认识》,《档案学通讯》2005年2期);二是电子文档的内容、背景和结构等方面的信息。 国外学者将元数据喻为电子文件管理系统中的“血液”,足见元数据在数字档案馆电子文件管理中发挥着举足轻重的作用。元数据的作用主要可以概括为以下几方面: 1元数据能协助数字档案馆构建信息检索机制。元数据具有动态跟踪功能,能够即时动态地获取电子文件管理的各项信息。在数字档案馆的海量信息库中,借助元数据,可以快速发现并获取特定的信息单元。 2元数据能维护信息的识别与读取。电子文件所携带的元数据信息可以完整地记录电子文件的原始状态,能够系统地映射出电子文件的信息内容、背景和结构等;还能够映射出电子文件的生成环境和行政管理环境。只有在获取数据对象的同时也获取这些元数据信息,被检索到的数据单元才是可理解的、可读的。 3元数据能保障电子文件的真实性与凭证性。元数据系统能够跟踪记录电子文件从产生那一刻起的载体、设备及所用技术的变迁史以及使用干预该文件的整个历史过程,即不论载体、设备、技术如何更新换代,不论使用者、使用人数的多少都全部作为历史数据保存下来,记录备案。这些为数字信息单元真实性和凭证性提供了重要的佐证。

国家图书馆网上有一批免费历史学数据库,网址是 http://wwwnlcgovcn/newgj

中国古籍善本书目导航:把线装书局的排印本《中国古籍善本书目》数字化,总数据量达29万余条。

·甲骨世界:国图珍藏甲骨35651片,此库包括甲骨元数据3764条,影像7532幅。

·碑帖菁华:现有元数据23000余条,影像29000余幅。

·敦煌遗珍:IDP数据库,包括中国国内散藏敦煌文献联合目录和研究论著目录数据等等。

·西夏碎金:收录馆藏西夏古籍书目数据125条,馆藏西夏古籍原件影像近5000拍。

·数字方志:收有1949年前纂修的6868种古旧地方志类图书,跨越明清和民国三个朝代。

·年画撷英:国图收藏4000余幅年画作品,此库现有元数据278条,影像278幅。

·民国专栏:收有民国图书15028种,民国法律8117种,民国期刊4350种,影像全文浏览。

·中华古籍善本国际联合书目系统:收录三十余家海内外图书馆所藏古籍善本,数据有两万多条,配一万四千余幅书影。

·东京大学东洋文化研究所汉籍全文影像数据库:东洋文化研究所将所藏中文古籍4000余种,以数字化方式无偿提供给中国国家图书馆。

  相关范文:

  数字图书馆元数据方案设计有关问题探讨

  内容提要在阐述数字图书馆元数据方案设计原则的基础上,对数字图书馆元数据方案的设计有关问题进行较为深入的思考,并且提出若干建议。

  摘 要 题专题探讨

  英文摘要This article begins with the illustration of&n

  1 数字图书馆元数据方案设计原则

  元数据方案就是数字图书馆中所使用的信息描述方法。数字图书馆的运作,无论是存取过程还是检索过程,都是以元数据方案为基础实现的。换言之,元数据方案为数字图书馆分布式信息资源的发现和检索奠定了基础。因此,元数据方案决定了数字图书馆的功能特征、运行模式和系统运行的总体性能。为了实现这一总体性能,达到共建共享信息资源的目的,数字图书馆元数据方案应遵循下列原则。

  11 元数据方案的标准化原则

  在数字图书馆建设中,标准问题最重要的是元数据的制作,而与元数据的制作紧密相关的问题是元数据方案的设计。

  然而,目前在元数据方案的标准化方面存在很多问题。首先,就DC系列元数据而言,在同一元素的著录内容上存在较大的差异。如,北京大学拓片元数据要求在权限(Rights)元素中著录馆藏地址、允许使用的用户范围,而在《数字式中文全文文献通用格式》规定著录有关权限管理的声明,包括知识产权等。其次,对于同类型信息资源的组织,有的图书馆已经采用DC元数据,有的则仍然采用MARC元数据。这种著录内容和同类信息资源所用元数据的不一致都会给数据交换的带来困难。最后,各个元数据所采用的编码语言也是各不相同,有的采用HTML,有的采用SGML或XML。由于各个编码语言的标签设置、内容、可扩展性的不同,则会影响元数据的通用性。

  元数据方案的标准化原则具有广泛的内涵。它包括元素著录内容的标准化、同类型数字化信息资源的著录所采用元数据的一致性、元数据方案所采用编码语言的统一性这几个方面。

  12 元数据方案的准确性原则

  所谓准确性原则一方面指元数据方案中元素的定义、使用的术语等不能模棱两可,容易产生歧义,导致不同的理解;另一方面指元数据方案能够准确地描述信息资源。也就是说,元数据方案不仅要规定元素的设置、著录规则、标记语言的使用,而且要规定著录所依据的标准、传输交换语言等。

  当前困扰各个搜索引擎的问题是如何提高其查准率。搜索引擎的低查准率究其原因是其对信息资源特征的揭示不够准确、深入。数字图书馆的信息资源类型多样,既有文字信息,也有音频、视频信息,只有准确地揭示它们的特征,提供高质量的元数据,才能保证较高的查准率。

  13 元数据方案的通用性与专用性原则

  元数据方案的通用性与专用性都是相对而言的。所谓通用性是指元数据方案可用于数字图书馆多种信息资源的元数据制作。所谓专用性是指元数据方案只适用于数字图书馆某一特定类型信息资源的元数据制作。具有通用性的元数据适用于组织多种类型的信息资源。通用性元数据有两种:一种通用性元数据的结构非常庞大、复杂,但是具有很好的描述深度,因为所有的情况都已经定义了,比如MARC元数据。另一种通用性元数据,其结构非常简单,好学易用,仅仅只有几个非常普遍的属性,但对特定类型的信息资源的描述能力不够。而具有很好专用性的元数据,其对于某一特定类型的信息资源描述能力很强,但无法覆盖其它类型的信息资源。数字图书馆信息资源类型多样,过分强调专用性会导致多种元数据各自为政。因此,在设计元数据方案时,设计人员需要在通用性和专用性之间加以协调、平衡,才能产生更好的效果。

  14 元素设置的可扩展性原则

  所谓元素设置的可扩展性原则是指在元数据方案设计时,为元素、元素的限定词以及属性值的扩充留有一定的余地。数字图书馆要处理的数字化信息资源非常广泛,而且各类数字化信息资源的应用背景更为复杂。如果元数据方案只提供最广泛意义上的描述,一些针对特定应用背景的内容并不纳入,那么,应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下,扩充一些元素或属性值。此外,元数据是一个发展活跃的领域,新的元数据元素会不断出现,老的元数据元素会不断修改完善。数字图书馆的生存环境是一个不断变化的环境,新的信息源也会层出不穷。这就要求元数据方案允许将新的元数据元素容纳于其中,或者要求修改更新已经注册的元数据方案。

  15 元数据方案的互操作性原则

  所谓元数据方案的互操作性,是指在由不同的组织制定与管理且技术规范不尽相同的元数据环境下,要向用户提供一个统一的数据检索界面,确保系统对用户的一致性服务。在具体应用上,互操作性表现为易转换性,即在所携信息损失最小的前提下,可方便地转换为其它系统常用的元数据。

  2 数字图书馆元数据方案设计应注意的问题

  21 非MARC元数据与数字图书馆信息资源组织的质量问题

  在此,根据我国当前引进、研制元数据的状况,将现存的元数据分为两类,即MARC元数据和非MARC元数据。MARC元数据包括USMARC、UNIMARC、CNMARC等。非MARC元数据包括DC系列元数据和非DC系列元数据。DC系列元数据是指我国在数字图书馆建设的过程中,对DC元数据加以引进并改造而生成的针对特殊类型信息资源的元数据,也就是说这些新出现的元数据是在DC元数据的基础上进行了扩充、改进。例如,DC元数据、北京大学拓片元数据、《数字式中文全文文献通用格式》以及清华大学的建筑元数据。非DC系列元数据包括TEI头标、EAD、GILS等。目前将非DC系列元数据用于数字图书馆信息资源组织的呼声很高。美国图书馆协会(the American Library Association,简称ALA)编目:著录与检索委员会(Committee on Cataloging: Description and Access,简称CC:DA)在《元数据与编目规则研究报告》(CC:DA Task Force on metadata and Cataloging Rules:Final Report)中以TEI头标、EAD等元数据为例,就非DC系列元数据作为编目源的情况做出评估,得出三点重要结论。第一,非MARC元数据在专门针对其用途而设计的系统中效率最高,但在图书馆目录系统中的效率就不是最高的。第二,不符合AACR的普通元数据进入图书馆目录的时候,总是需要图书馆编目人员对其进行严格审查。第三,绝大多数非MARC元数据方案没有提供足够的信息以区别相似的信息资源或者内容基本相同而不同版本信息资源。[1]也就是说,只有充分地利用各种编目规则和其它一些质量保证手段,非MARC元数据才能具有较高的质量,才能用于图书馆信息资源组织。

  众所周知,非MARC元数据大多数是一些资源描述机构针对自己的需要而开发的。在这些元数据方案中,元数据的制作可以由专业的编目人员完成,也可以由根本没有任何经验信息资源的提供者自己完成。非专业人员制作的元数据具有费用低、元数据的专指性较好的优点。但是,这样做会导致对数字化信息资源的属性和特征的揭示程度差别很大,进而影响元数据的总体质量。到目前为止,绝大多数元数据仍然由专业人员提供。例如,TEI头标是一种复杂的元数据,绝大多数TEI文本都是由人文科学领域非图书馆专业人员创建,而TEI头标通常是由图书馆员创建或维护。如果让非专业人员参与元数据的制作,那么数字图书馆元数据方案设计就应解决元数据制作质量的检测与管理问题。

  22 DC系列元数据与MARC元数据的关系

  目前,有些数字图书馆纷纷采用DC元数据作为描述数字化信息资源的格式。例如,清华大学图书馆的建筑数字图书馆项目以DC元数据作为基本框架,结合建筑资料的实际情况对DC元数据进行改造,扩充为THDL——清华大学建筑数字图书馆元数据格式。北京大学依据DC元数据开发了拓片元数据格式。上海图书馆也使用了DC元数据。自从DC元数据产生以来,图书馆界争论不休的问题是,图书馆是继续使用MARC元数据,还是舍弃MARC元数据,改用DC元数据?具体到我国,在任何一个数字图书馆元数据方案的设计过程中,必然要涉及到MARC元数据与DC系列元数据关系的处理。

  DC元数据最初的定位是处于全文索引和复杂格式的元数据之间,提供简单明了的元数据格式。DC元数据与MARC元数据的最主要的区别在于DC元数据结构简单,而MARC元数据复杂。DC元数据经过数次研讨会后,对其进行扩展,使用修饰限定词使得DC元数据不可避免地复杂起来。其扩展的原因有两个。一是应用领域比较复杂,DC元数据没有足够的元素来描述信息资源的各种重要特征;二是人们希望DC元数据应用于多个领域。实际上,无论如何扩展,DC元数据不可能解决所有数字化信息资源的描述问题。笔者建议:由国家标准化权威机构——全国信息与文献标准化技术委员会来制定适应于各类数字化信息资源的元数据方案。这样做,可以在全国范围内,就某一类数字化信息资源采用何种元数据著录达成共识。目前,在MARC元数据与DC系列元数据并存的情况下,信息资源的存储与检索必然涉及MARC元数据与DC系列元数据两者之间的转换,是将全部MARC元数据转换为DC元数据,还是将DC元数据转换为MARC元数据?笔者认为,MARC元数据与DC元数据之间转换的目的是实现一条记录可以以MARC元数据和DC元数据两种格式来显示以及数据的交换与共享。但是,如果用户没有这种需求或者两者之间不转换并不影响数据交换,则没有必要进行转换。也就是说,根据实际需要来决定是否需要MARC元数据与DC元数据之间相互转换。MARC元数据与DC元数据之间的转换会产生很多问题。由于MARC元数据的描述能力大大丰富于DC元数据,如何尽量解决两者之间转换所产生的歧义与不确定性以及信息丢失等难题。

  23 元数据的编码语言问题

  元数据的编码语言是指针对元数据元素和结构进行定义和描述的具体语法和语义规则。目前,各种元数据使用的编码语言是不同的,包括标准通用标记语言(Standard General Markup Language,简称SGML)、超文本标记语言(Hypertext Markup Language,简称HTML)、可扩展标记语言(Extensible Markup Language,简称XML)三种形式。有些元数据明确规定使用何种标记语言,如TEI头标、EAD和美国联邦地理数据委员会《数字地理空间元数据内容标准》使用SGML。也有些元数据没有规定使用何种编码语言,如DC元数据,有使用HTML,也有使用XML的。从数据交换和共享的需要出发,元数据的作用是传递计算机系统可以理解的描述信息和存储数据。计算机首先要理解元数据的各个元素或字段序列化的方式,即按怎样的顺序和结构来组织各个元素及其内容。所使用的编码语言不同,元数据编码规则以及记录格式也存在差异。这样则不利于数据的交换和信息资源的共享。因此,从长远利益来看,有必要对元数据的编码语言进行统一。

  3 对我国数字图书馆元数据方案设计的若干建议

  31 推进元数据标准化进程,提高元数据的互操作能力

  目前,国内出现了许多种元数据,例如,拓片元数据、建筑元数据、古籍元数据、中文数字化全文文献元数据等,由于每种元数据都是由不同图书馆研制而成的,并且针对不同类型的数字化信息资源。因此,就会出现DC系列元数据与MARC元数据并存的局面。这种局面有利于DC系列元数据与MARC元数据形成优势互补,也可以使某些适合用DC系列元数据描述的特定类型信息资源被充分地揭示和利用。同时,这种局面也会带来一些问题。目前,我国DC系列元数据至少有4种以上,那么对DC系列元数据是否一体化;那些特定类型信息资源以前的机读记录该如何处理等。

  笔者主张DC系列元数据一体化,反对各自为政。DC系列元数据都是在DC元数据的基础上根据用户的需求与信息资源特点进行了修正,所以这些元数据的核心或实质仍然是DC元数据。这一点可以作为DC系列元数据一体化的基础,但是,这种一体化工作完成就需要各个研制单位之间的协调与合作,需要以国家标准的形式出现加以强制执行,从而结束元数据结构各自为政的局面。对于那些原由MARC元数据著录的信息资源来说,MARC记录已为受编信息资源提供了著录内容详尽,查全率高的机读格式,在受编信息资源数字化的过程中没有必要舍弃原有的元数据,而采用其它元数据方案。

  32 选择适用的编码语言

  在数字图书馆元数据方案设计中,编码语言的选择也是关键步骤之一。目前,在DC系列元数据中通常使用HTML、SGML或XML。有比较才有鉴别和选择,我们不妨对这三种编码语言的优劣进行分析比较。

  XML是SGML语言的一个子集,同HTML一起成为SGML家族的主要成员。SGML是一种元语言,可以用来定义其它更专门的标记语言。HTML是由SGML定义出来的,专门使用在WWW上的标记语言。SGML是很好的资料存储格式,适用于任何复杂的文件,但不便于网络传输,SGML非常复杂,不易学习掌握。XML与HTML不同,XML是SGML的一个简化版本,实际上,XML也是一种元语言。与HTML不同的是,XML并没有语义上的元素定义,也没有预先定义好的一套标记系统。在实际应用中,可以根据需要定义自己的标记。XML是可扩展的

  ,具有较强的灵活性和适用能力,同时它很有可能在今后成为应用最为广泛的标记语言。但是,目前,XML在网络上的应用不如HTML广泛。由于HTML文档本身的结构性不强,扩展能力差,描述内容的能力也较弱,因此不太可能成为今后数字图书馆元数据方案的主要编码语言。笔者建议,数字图书馆元数据方案的编码语言采用XML。

  33 数字图书馆元数据方案的设计应面向专业编目人员

  信息资源编目实际上是信息资源进行分析、判断和组织的过程。组织过程包括分类、描述、归并及格式化等过程;分析过程则包括区分、验证、评估、比较、解释及综合过程。[2]总之,信息资源编目是一个复杂的、信息增值的过程。目前,困扰信息资源编目的主要问题是费用。一是时间的花费,二是金钱的花费。费用问题使得许多元数据方案的设计者希望所研制的元数据可以由非专业人员制作。毫无疑问,非专业人员制作元数据的费用低,然而这种低费用是以牺牲元数据的质量为代价的。笔者认为,对于数字图书馆的建设而言,元数据的总体质量是不容忽视的。如果没有高质量的元数据,数字化信息资源的利用也就成为一句空话,甚至会像搜索引擎一样,查准率很低。所以,建议数字图书馆元数据方案的设计应面向专业编目人员。只有专业编目人员利用编目规则及书目控制等手段,才能够提供具有较高质量的元数据。

  34 数字图书馆元数据方案的设计中应考虑到其它技术运用

  在数字图书馆建设的过程中,必然要涉及到许多技术,其中包括数据库技术、全文检索技术、开放式网络词表/分类技术、地理信息系统(GIS)等。在数字图书馆元数据方案的设计中,我们需要与这些技术进行衔接并加以应用。以联合在线资源目录(Cooperative Online Resource Catalog,简称CORC)为例加以说明。CORC是建立在网络环境下的为本地或网络电子资源创建书目元数据的系统,是一种为电子资源编目的数据库和工具包。CORC利用了网上杜威分类法数据库,实现了编目过程中DDC号码和主题标目自动分配。同时,CORC数据库的软件平台采用Mantis,这是一种适用于任何元数据定义与界面的网络资源编目系统工具箱。Mantis用XML存储记录,使得记录的输出非常容易,且有MARC、DC HTML和DC RDF、XML多种格式可供选择。CORC的成功在于其能够充分利用各种技术。因此,我国在数字图书馆元数据方案的设计过程中,也需要考虑其它技术的运用。

  参考文献

  [1]CC:DA Task Force on metadata and Cataloging Rules:Final Report,August 21,1998[EB/OL][2001—03—05] http://wwwalaorg/alcts/organization/ccs/ccda

  [2]真溱矛盾重重的元数据世界[J]中国图书馆学报,2001,(6):56—59

  仅供参考,请自借鉴

  希望对您有帮助

1 缺乏整体规划,重复建设严重

2 文献购置和设备购置成为制约古籍数字化的两大难题

3 古籍整理技术成果未得到充分利用

4 检索技术急待完善

5 数字化文件格式数量多,不统一

6 人才的知识不全面性难以适应古籍数字化

截至2015年底,总、分馆文献资源累积量约1100余万册(件)。其中纸质藏书800余万册,以及近年来大量引进和自建的中国国内外数字资源,包括各类数据库、电子期刊、电子图书和多媒体资源约300余万册(件)。馆藏中有150万册中文古籍,其中20万件5至18世纪的珍贵书籍,是中华民族的文化瑰宝,被国务院批准为首批国家重点古籍保护单位。外文善本、金石拓片、1949年前出版物的收藏均名列中国国内图书馆前茅,为研究家所珍视。此外,还有燕京大学学位论文、名人捐赠等特色收藏。

1书刊报纸

据2016年1月北京大学图书馆官网信息显示,北京大学图书馆总馆收藏中外文图书263万余种,其中外文图书含有30多个语种;中外文报刊4万余种,外文报刊以英文为主。收藏图书年增长量在5万种以上、报刊年增长量在5千种以上。

2古籍文献

古籍是北京大学图书馆最重要的馆藏之一,据2016年1月北京大学图书馆官网信息显示,古籍文献总量达150万册,其中善本古籍约2万余种、20余万册。2008年以来,北大图书馆共有352部古籍善本分别入选由文化部确定、国务院批准的第一、二、三批国家珍贵古籍名录。

北京大学图书馆的古籍收藏具有规模宏大、种类齐全、特藏丰富、珍品众多的特点。重要的馆藏中,以年代划分,有敦煌卷子288号,宋、元刻本300余种,明刻本近万种;以出版国别划分,有日本本2000余种、朝鲜本200余种;以制作方式划分,有抄、稿、写本9000余种,活字本3000余种;以内容类型划分,有方志近5000种,家谱2200余种,还有多个小说戏曲专藏,如车王府曲本1536种,马廉不登大雅之堂藏戏曲小说928种,程砚秋御霜簃藏曲本1400余种。馆藏金石拓片4万余种、8万余件,包括了缪荃孙艺风堂、张仁蠡柳风堂二家的全部藏拓。此外还收藏有2000余种中国古代舆图。

北大馆在CALIS技术支持下建设的“秘籍琳琅——北京大学数字图书馆古文献资源库”,是完整展示北京大学图书馆藏古籍的网络平台。北大馆牵头建设的“学苑汲古——高校古文献资源库”,更是汇集了包括北大图书馆在内的中国国内24所高校图书馆藏古籍元数据60余万条、书影20余万幅,电子图书835万册,是世界上规模最大的古籍书目数据库之一。北大图书馆古籍阅览室收藏有一百余部大型古籍影印本丛书,约含古籍8万种。不少分馆也有古籍收藏,其中考古文博学院分馆、中文系分馆、信息管理系分馆的部分古籍书目数据已经录入古文献资源库中,其他分馆所藏古籍的书目数据今后也将陆续进入该资源库。

3特藏文献

据2016年1月北京大学图书馆官网信息显示,北京大学图书馆特藏文献有:地方志、晚清民国旧报刊、民国图书、西文东方学文库、中德学会旧藏、中法大学旧藏、侯仁之赠书、方志彤赠书、侯思孟赠书、欧盟文献、英美政府外交档案的微缩胶卷和胶片、珍贵西文文献、学位论文、北大文库、季羡林赠书、张芝联赠书、钱端生赠书、段宝林赠书、宿白赠书、台湾文献。

4学位论文

据2016年1月北京大学图书馆官网信息显示,北京大学图书馆学位论文体系建有:北京大学学位论文、燕京大学学位论文、北大名师学位论文等体系。其中:

北京大学学位论文:收藏1981年以后自北京大学毕业的所有博、硕士学位论文,以及部分优秀学士论文。阅览地点为西区309学位论文阅览室,可通过OPAC或北京大学学位论文库检索。

燕京大学学位论文:收藏有燕京大学的学士和硕士论文,共2600多篇,其中包括许多当代著名学者的论文手稿真迹,十分珍贵。燕大论文内容涉及的学科范围较广,对研究近代中国社会、历史、政治等有重要的参考作用。阅览地点为西区318特藏室。具体可通过燕京大学学位论文库检索。

北大名师学位论文:存于西区313北京大学文库,共收藏有12种: 北大名师学位论文  姓名论文题目毕业院校学位论文形式陈岱孙 The Relation Between Local Governmental Expenditures and Density of Population in Massachusetts 美国哈佛大学 博士 论文原件之复印件 陈翰笙 The Conference of Ambassadors in London, 1912-13, and the Creation of Albanian State 美国芝加哥大学 硕士 论文原件之复印件 陈振汉 The Location of the Cotton Manufacturing Industry in the United States 美国哈佛大学 博士 论文副本 董申保 The Crystalline Schists of Lower Allagnon Valley, Central Massive, France 法国克莱蒙非朗大学 博士 论文原件 费孝通 亲迎婚俗之研究 燕京大学 学士 论文原件 冯友兰 A Comparative Study of Life Ideals 美国哥伦比亚大学 博士 正式出版之复印件 侯仁之 An Historical Geography of Peiping 英国利物浦大学 博士 论文原件之复印件 胡适 The Development of the Logical Method in Ancient China 美国哥伦比亚大学 博士 正式出版 李宪之 Die Kälteeinbrüche in Ostasien 德国洪堡大学 博士 正式出版 王力 Une Prononciation Chinoise de Po-Pei 法国巴黎大学 博士 正式出版 乐森璕 Die Korallenfauna des Mitteldevons aus der Provinz Kwangsi, Südchina 德国马堡大学 博士 正式出版 赵乃抟 Richard Jones:An Early English Institutionalist 美国哥伦比亚大学 博士 正式出版 5民国旧报刊

据2016年1月北京大学图书馆官网信息显示,北京大学图书馆所藏晚清至民国期间的报刊达一万余种,旧报纸六百余种,有不少孤本、珍本,为收藏和研究者所珍视。这一珍贵特藏主要源于老北大及燕京大学的旧藏,也有少量原中法大学和中德学会的旧藏。晚清至民国报刊对于了解研究中国近代化的进程,以及这一动荡巨变时期思想学术、军事政治、教育文化、语言文学、社会风俗等方方面面的嬗变都具有重要的参考价值。 为保证各项业务工作的顺利进行,图书馆陆续引进和开发了各类应用系统,如数字图书馆门户系统、统一检索平台、统一认证系统、学科导航系统、电子资源导航系统、虚拟咨询系统、网络培训系统、科技查新系统、馆际互借和文献传递系统,以及数字资源加工系统群、数字化服务系统群、元数据著录系统等,形成了较为完整的信息服务和信息加工平台。为进一步发现、挖掘和揭示图书馆特色资源,还先后推出了学位论文提交、编目和发布系统、古文献编目和发布系统(秘籍琳琅)、北大名师人物数据库、北京历史地理数据库、民国报刊数据库等宝贵的数字特藏。

2000年,图书馆与校内其他单位联合成立的北京大学数字图书馆研究所开展了有关数字图书馆模式、标准规范(元数据、数字加工标准等)、关键技术、互操作层与互操作标准、数字图书馆门户等的研究,取得了一系列的成果,并开始进行大规模应用实践,为北京大学数字图书馆的建设奠定了技术基础。在进行研究和应用实验的同时,还开始进行部分项目的建设,并本着“边建设、边服务”的原则,逐步实现在校园网上提供服务,如电子资源导航系统、学位论文提交与检索系统、多媒体点播系统、古籍拓片示范数据库检索系统、北大名师档案、教学参考书系统、网络课程服务等。2006年建成北京大学数字图书馆门户,将统一检索、统一认证、资源调度与整合等各种新技术融入到数字图书馆建设当中。

信息系统在企业里帮助实现了

1、资源采集模块。

2、资源管理模块

3、资源利用模块

4、系统维护模块。

5、资源采集模块:既可接收馆藏传统档案数字化扫描成果,又可在线实时或离线定时接收各立档单位产生的档案信息,还可按照征集工作要求,通过网络广泛征集相关档案资源和资料。

6、资源管理模块。涵盖数字档案标准化,专业信息标准化,分类号、主题词自动标引,多媒体档案标引,元数据著录,信息鉴定,目录管理,报表打印,信息统计等档案工作的业务流程。

7、资源利用模块。包括档案编研、综合智能查询、档案信息资源发布等档案工作的业务流程。

8、系统维护模块。包括基础数据维护、权限管理、网络安全、加密存储、数字签名、版权保护、日志管理、数据备份恢复等管理功能。

热门文章
    确认删除?
    回到顶部