古代汉语常用工具书有哪些

古代汉语常用工具书有哪些,第1张

1、《说文解字》2、《康熙字典》《康熙字典》：清康熙年间,由张玉书、陈廷敬等人编写收字四万七千多字该书所收字按照部首笔画排列,分为214个部首\x0d3、《汉语大字典》《汉语大字典》：解释汉字形、音、义的大

所谓编码，是以固定的顺序排列字符，并以此做为记录、存贮、传递、交换的统一

内部特征，这个字符排列顺序被称为“编码”。

字库的编码是字库组织的依据，也是文字处理的基础。不同国家和地区有不同的编

码标准，和中文字库有关的常见编码有：单字节编码、GB2312-80、GB12345-90、GBK、U

nicode编码、ISO10646 / Unicode字符集、GB18030-2000、BIG5编码，下面简要介绍一

下：

单字节编码

MS Windows：Windows Latin 1（ANSI）

MS-DOS：MS-DOS Latin US

Macintosh：Macintosh Roman

GB2312-80

全称是GB2312-80《信息交换用汉字编码字符集基本集》，1980年发布，是中文信

息处理的国家标准，在大陆及海外使用简体中文的地区（如新加坡等）是强制使用的唯

一中文编码。P-Windows32和苹果OS就是以GB2312为基本汉字编码， Windows 95/98则

以GBK为基本汉字编码、但兼容支持GB2312。

双字节编码

范围：A1A1~FEFE

A1-A9：符号区，包含682个符号

B0-F7：汉字区，包含6763个汉字

GB码共收录6763个简体汉字、682个符号，其中汉字部分：一级字3755，以拼音排

序，二级字3008，以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了

很大作用。

GB12345-90

1990年制定了繁体字的编码标准GB12345-90《信息交换用汉字编码字符集第一辅助

集》，目的在于规范必须使用繁体字的各种场合，以及古籍整理等。该标准共收录6866

个汉字（比GB2312多103个字，其它厂商的字库大多不包括这些字），纯繁体的字大概有

2200余个。

双字节编码

范围：A1A1~FEFE

A1-A9：符号区，增加竖排符号

B0-F9：汉字区，包含6866个汉字

Unicode编码(Universal Multiple Octet Coded Character Set)

国际标准组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组，针对各国文字、符号

进行统一性编码。1991年美国跨国公司成立Unicode Consortium，并于1991年10月与WG2

达成协议，采用同一编码字集。目前Unicode是采用16位编码体系，其字符集内容与ISO1

0646的BMP（Basic Multilingual Plane）相同。Unicode于1992年6月通过DIS（Draf

International Standard），目前版本V20于1996公布，内容包含符号6811个，汉字209

02个，韩文拼音11172个，造字区6400个，保留20249个，共计65534个。

ISO10646 / Unicode字符集

全球可以共享的编码字符集。

UCS-4：组八位平面八位行八位字位八位

UCS-2：00组中的00平面是基本多文种平面（BMP），4E00~9FFF 中日韩文字

Ext A（CJK）：3400~4DB7，共6584字

Ext B（CJK）：42，807个汉字，在第2平面的0100~A836

GBK编码(Chinese Internal Code Specification)

GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组

于1995年10月，同年12月完成GBK规范。该编码标准兼容GB2312，共收录汉字21003个、

符号883个，并提供1894个造字码位，简、繁体字融于一库。

Windows95/98简体中文版的字库表层编码就采用的是GBK，通过GBK与UCS之间一一对应的

码表与底层字库联系。

英文名：Chinese Internal Code Specification

中文名：汉字内码扩展规范10版

双字节编码，GB2312-80的扩充，在码位上和GB2312-80兼容

范围：8140~FEFE（剔除xx7F）共23940个码位

包含21003个汉字，包含了ISO/IEC 10646-1中的全部中日韩汉字

GB18030-2000

英文名：Chinese Internal Code Specification

中文名：信息技术信息交换用汉字编码字符集

基本集的扩充（ 2000-03-17发布和实施）

单字节、双字节、四字节编码

向下与国家标准GB 2312信息处理交换码所对应的事实上的内码标准兼容。

在字汇上支持GB 130001的全部中、日、韩（CJK）统一汉字字符和全部CJK统一汉字扩

充A的字符。

BIG5编码

是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准，包括440个符号，一级

汉字5401个、二级汉字7652个，共计13060个汉字。

1、输入码

输入码是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等。

2、交换码

计算机内部处理的信息是用二进制代码表示的，而二进制代码使用起来是不方便的，于是需要采用信息交换码。

3、机内码

根据国标码的规定，每一个汉字都有了确定的二进制代码，在微机内部汉字代码都用机内码，在磁盘上记录汉字代码也使用机内码。

4、汉字的字形码

字形码输出汉字时都采用图形方式，无论汉字的笔画多少，每个汉字都可以写在同样大小的方块中。

5、汉字地址码

汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。

-汉字编码

古籍破损的原因形形色色有很多，归纳起来大致有虫蛀鼠啮、霉蚀、酸化、老化、使用中的磨损等。针对不同的病因，古籍修复师都要开出不同的修补方案。

①对于那些刚出库等待修复的古籍，首先需要建立修复档案，拍摄每一页的破损情况，建立图像和文字档案。再根据破损情况设计修复方案。

②拆书，揭页。面对一些破损严重的古籍，将粘连的古籍分页也绝非易事，得使用“干揭”、“湿揭”、“蒸揭”等手法。揭好页后，需要为每一页书籍编号，否则书籍顺序会被打乱。

③古籍修复有两种方法，一种是全手工修复，另一种是使用纸浆补孔设备修复。在开始修补之前，需要先为古籍配纸。古籍修复手工纸可以分为麻纸、竹纸、皮纸、混料纸等。修复古籍需要选用古法造纸的纸，即仿造古时候的原材料、帘纹、工艺生产的纸张。修书不是选择最贵的纸，而是要选择最恰当的纸。有些制纸工艺现在已经失传，为古籍修复带来很多不便。选配的纸张通常要与待修的古籍材质、帘纹相同、颜色相仿。如遇材质特殊或带有颜色的纸张，还需要自行调配纸浆或为纸张染色。

④选好配纸，就进入正式手工修补环节。古籍修复过程中最常遇到的是修补破洞，所用工具即是最简单的一张纸、一支毛笔、一碗浆糊。具体步骤为用沾上浆糊的毛笔在破洞处涂刷，将补纸快速粘在破洞上填补破洞。修补过程中所选用的浆糊必须是去筋的小麦淀粉所调制，这样的浆糊一则浆性温和、稳定性好，而且具有操作的可逆性，一则因为所用修复材料需要天然不含化学成分。

⑤纸浆补孔机修复一般适用于虫蛀破损严重的古籍。这种机器修复机由国外进口，上海仅两台，操作步骤包括放入修复纸和文献、加盖注水、倒入纸浆、放水，最后在书页上垫保护纸，放到冷吸力台上，进行干燥处理。

⑥所有修补完的书页，需要进行压平处理。在书页上喷上水，放在吸水纸内压平，等书页干燥、压平整之后，再拿出来折页，修剪书页上多余的补纸。修剪完后，在装订前还需将所有书页放入压书机进行压平处理。

⑦经过压平处理后的书页将被复原装订成册。装订过程包括搓纸捻钉、理齐、打眼、穿纸捻钉……搓纸捻钉是一个手工活，没学过的人肯定搓不好，搓出来的钉头要硬硬的，里边则是空心的。

⑧理齐、打眼均是细致活，每一针下去都要对准古籍原先留下的钉孔，不能有丝毫误差，否则会对古籍造成新的损害。

⑨穿纸捻钉。这是流传上千年的古籍装订方法。纸捻钉可以保持长久不坏，古人很聪明，用纸捻钉来固定书叶，即便订书的线断了，书叶也不会散。最后一步是粘上封面，用真丝线装订。

1、《古汉语常用字字典》（第5版）

由著名语言学家王力、岑麒祥、林焘、戴澧、唐作藩、蒋绍愚等十余位专家学者编写，是学习古汉语的必备工具书。在第4版的基础上修订。收古汉语常用字和复音词约一万条，先秦两汉传世文献比较常用的字一般都收入。

2、《古代汉语词典》(第2版)

语文教师、中学生、文字工作者案头必备。学习古代汉语和阅读古籍使用的中型语文工具书。收词范围是古代以正统书面语言写作的有代表性的典籍，诸如《论语》《孟子》《国语》《战国策》《荀子》《老子》《庄子》《孙子》《吕氏春秋》《论衡》《史记》《汉书》《后汉书》《三国志》《唐宋文举要》。

3、《辞源》(第三版)

通往传统文化的桥梁。中国现代史上第一部大型语文性工具书，一部兼收古汉语语词和百科的大型综合性辞书。阅读古籍必备，古典文史研究工作者常备。

《辞源》之本在字。太初有字，道在其中，理在其中，文献语词在其中，百科名物在其中，五千年文化基因、文明传统在其中，某些外来文化元素亦在其中。只有明白字的文化功用，文化渊源，才可明白《辞源》价值之所在。

网上好象没相关信息，以下是个人理解：

文献知识是古籍整理的基础和必要工具，更是整理好古籍的前提与必要条件。

说文献知识是古籍整理的基础和必要工具，是因为：没有文献上的历史记载，古籍的整理用什么做依据，最基本的按朝代、按地区分类就不可能做到，没有历史依据的整理只可能是破坏，不可能达到保护性目的；一些古籍可能有缺损、残缺，要修补、整理就要有相关知识，知道缺失了什么才能知道该补什么，又该到哪里去找这些可以补上的信息，这时候，文献就是很好的查阅资料，没有文献，就好比航海中的船只没有罗盘，它是指引古籍整理的必要工具。

做同样一项工作，不同的人来做也能区分出好坏，古籍整理也是这样，要整理好古籍，没有丰富的文献知识做后盾，在碰到问题时不可能及时、准确地做出反应，甚至可能会破坏原有的古籍信息，因此文献知识又是整理好古籍的前提与必要条件。

常见的文字编码格式有GB2312、BIG5、GBK、UTF-8等。

1、GB2312

简体中文编码，一个汉字占用2字节，在大陆是主要编码方式。当文章或者网页中包含繁体中文、日文、韩文等时，这些内容可能无法被正确编码。

2、BIG5

属于一种繁体中文编码。

3、GBK

支持简体及繁体中文，但对别的国家，非拉丁字母语言还是有问题。

4、UTF-8

俗称“万国码”，可以同屏显示多语种，一个汉字占用3字节。Unicode用一些基本的保留字符制定了三套编码方式，是以8位序列来编码的，用一个或几个字节来表示一个字符。这种方式的最大好处，是UTF-8保留了ASCII字符的编码作为自己的一部分。

常见文字字体：

1、微软雅黑

清晰简洁，广泛应用于各种场合。

2、宋体

传统正式的中文宋体字体，常用于报纸、书籍和公文等正式场合。

3、黑体

粗壮有力，适合用于标题和海报等设计作品中。

4、仿宋

优美流畅，用于文学作品和装饰艺术中较为常见。

5、楷体

古朴典雅，多用于书法、古籍文字、印章和名片等领域。

6、新宋体

是一种更加现代化的宋体字体，适合用于电脑屏幕上显示的小字体。

7、隶书

古老的汉字书法体系之一，以其独特的笔画和线条风格而广受欢迎。

8、幼圆

圆润可爱，适合用于宣传资料、广告、海报等设计中使用。

‐GBK字库

‐UTF-8

古代汉语常用工具书有哪些

相关阅读

栏目

最新发布

热门标签