古籍分类的历史沿革是?
中华古籍难以数计,对古籍的分类整理自古已有。第一次大规模的古籍整理,始于公元前26年西汉成帝时,由刘向、刘歆父子先后主持,内容包括搜辑、校勘、分类、编目等,最终编成了中国最早的国家图书馆目录《七略》。《七略》将当时搜集整理的典籍分为六艺、诸子、兵书、数术、方技、诗赋六大类,加上概论性质的辑略,总题《七略》。
汉代以后,各种官修,私撰的古籍分类目录不断涌现,分类方法也不断有所改进。西晋荀勖的《晋中经簿》将六略改为四部,即甲部录经书(相当于六艺),乙部录子书(包括诸子、兵书、数术、方技),丙部录史书,丁部为诗赋等,这就奠定了四部分类的基础。东晋李充所编《晋元帝书目》根据当时古籍的实际情况,将史书改入乙部,子书改入丙部,这样,经、史、子、集四部分类已略具雏形。
四部体制的最终确立体现在《隋书·经籍志》中,这部实际上由唐初名臣魏征所编的目录,正式标注经、史、子、集四部的名称,并进一步细分为40个类目。从此,四部分类法为大多数史志、书目所沿用。清代编纂的《四库全书总目》分为四部44类,有较大的权威性。
五四以来,我国借鉴西方的图书分类法,按现代学科体系进行图书分类。目前,我国各类图书馆普遍采用的是90年代修订的《中国图书馆图书分类法》,但是,由于不少古籍很难纳入中图法的分类体系,因此一般古籍图书馆(库)的庋藏和检索,仍袭用传统的四部分类法
1、输入码
输入码是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等。
2、交换码
计算机内部处理的信息是用二进制代码表示的,而二进制代码使用起来是不方便的,于是需要采用信息交换码。
3、机内码
根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。
4、汉字的字形码
字形码输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。
5、汉字地址码
汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。
-汉字编码
所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一
内部特征,这个字符排列顺序被称为“编码”。
字库的编码是字库组织的依据,也是文字处理的基础。不同国家和地区有不同的编
码标准,和中文字库有关的常见编码有:单字节编码、GB2312-80、GB12345-90、GBK、U
nicode编码、ISO10646 / Unicode字符集、GB18030-2000、BIG5编码,下面简要介绍一
下:
单字节编码
MS Windows:Windows Latin 1(ANSI)
MS-DOS:MS-DOS Latin US
Macintosh:Macintosh Roman
GB2312-80
全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信
息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯
一中文编码。P-Windows32和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则
以GBK为基本汉字编码、但兼容支持GB2312。
双字节编码
范围:A1A1~FEFE
A1-A9:符号区,包含682个符号
B0-F7:汉字区,包含6763个汉字
GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排
序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了
很大作用。
GB12345-90
1990年制定了繁体字的编码标准GB12345-90《信息交换用汉字编码字符集 第一辅助
集》,目的在于规范必须使用繁体字的各种场合,以及古籍整理等。该标准共收录6866
个汉字(比GB2312多103个字,其它厂商的字库大多不包括这些字),纯繁体的字大概有
2200余个。
双字节编码
范围:A1A1~FEFE
A1-A9:符号区,增加竖排符号
B0-F9:汉字区,包含6866个汉字
Unicode编码(Universal Multiple Octet Coded Character Set)
国际标准组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组,针对各国文字、符号
进行统一性编码。1991年美国跨国公司成立Unicode Consortium,并于1991年10月与WG2
达成协议,采用同一编码字集。目前Unicode是采用16位编码体系,其字符集内容与ISO1
0646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf
International Standard),目前版本V20于1996公布,内容包含符号6811个,汉字209
02个,韩文拼音11172个,造字区6400个,保留20249个,共计65534个。
ISO10646 / Unicode字符集
全球可以共享的编码字符集。
UCS-4:组八位 平面八位 行八位 字位八位
UCS-2:00组中的00平面是基本多文种平面(BMP),4E00~9FFF 中日韩文字
Ext A(CJK):3400~4DB7,共6584字
Ext B(CJK):42,807个汉字,在第2平面的0100~A836
GBK编码(Chinese Internal Code Specification)
GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组
于1995年10月,同年12月完成GBK规范。该编码标准兼容GB2312,共收录汉字21003个、
符号883个,并提供1894个造字码位,简、繁体字融于一库。
Windows95/98简体中文版的字库表层编码就采用的是GBK,通过GBK与UCS之间一一对应的
码表与底层字库联系。
英文名:Chinese Internal Code Specification
中文名:汉字内码扩展规范10版
双字节编码,GB2312-80的扩充,在码位上和GB2312-80兼容
范围:8140~FEFE(剔除xx7F)共23940个码位
包含21003个汉字,包含了ISO/IEC 10646-1中的全部中日韩汉字
GB18030-2000
英文名:Chinese Internal Code Specification
中文名:信息技术 信息交换用汉字编码字符集
基本集的扩充( 2000-03-17发布和实施)
单字节、双字节、四字节编码
向下与国家标准GB 2312信息处理交换码所对应的事实上的内码标准兼容。
在字汇上支持GB 130001的全部中、日、韩(CJK)统一汉字字符和全部CJK统一汉字扩
充A的字符。
BIG5编码
是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准,包括440个符号,一级
汉字5401个、二级汉字7652个,共计13060个汉字。
进行编目分类和命名。中国古籍总目的代码是指对中国传统文化遗产中所涉及的各种古籍、经书、文献等进行编目分类和命名的一套代码体系,用于整理、保护和传承中国古代文化遗产。编码系统由中国国家图书馆和中国古籍保护修复中心联合开发,于2006年正式发布,采用了数字、汉字组合的方式,共有三级代码,包括十大类别、五十小类别和二百五十子类别,每个代码都有其独立的含义和文化内涵。
古籍分类的历史沿革是?
本文2023-10-15 20:06:58发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/135012.html