古代汉语常用工具书有哪些
1、《说文解字》2、《康熙字典》 《康熙字典》:清康熙年间,由张玉书、陈廷敬等人编写收字四万七千多字该书所收字按照部首笔画排列,分为214个部首\x0d3、《汉语大字典》 《汉语大字典》:解释汉字形、音、义的大
所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一
内部特征,这个字符排列顺序被称为“编码”。
字库的编码是字库组织的依据,也是文字处理的基础。不同国家和地区有不同的编
码标准,和中文字库有关的常见编码有:单字节编码、GB2312-80、GB12345-90、GBK、U
nicode编码、ISO10646 / Unicode字符集、GB18030-2000、BIG5编码,下面简要介绍一
下:
单字节编码
MS Windows:Windows Latin 1(ANSI)
MS-DOS:MS-DOS Latin US
Macintosh:Macintosh Roman
GB2312-80
全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信
息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯
一中文编码。P-Windows32和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则
以GBK为基本汉字编码、但兼容支持GB2312。
双字节编码
范围:A1A1~FEFE
A1-A9:符号区,包含682个符号
B0-F7:汉字区,包含6763个汉字
GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排
序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了
很大作用。
GB12345-90
1990年制定了繁体字的编码标准GB12345-90《信息交换用汉字编码字符集 第一辅助
集》,目的在于规范必须使用繁体字的各种场合,以及古籍整理等。该标准共收录6866
个汉字(比GB2312多103个字,其它厂商的字库大多不包括这些字),纯繁体的字大概有
2200余个。
双字节编码
范围:A1A1~FEFE
A1-A9:符号区,增加竖排符号
B0-F9:汉字区,包含6866个汉字
Unicode编码(Universal Multiple Octet Coded Character Set)
国际标准组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组,针对各国文字、符号
进行统一性编码。1991年美国跨国公司成立Unicode Consortium,并于1991年10月与WG2
达成协议,采用同一编码字集。目前Unicode是采用16位编码体系,其字符集内容与ISO1
0646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf
International Standard),目前版本V20于1996公布,内容包含符号6811个,汉字209
02个,韩文拼音11172个,造字区6400个,保留20249个,共计65534个。
ISO10646 / Unicode字符集
全球可以共享的编码字符集。
UCS-4:组八位 平面八位 行八位 字位八位
UCS-2:00组中的00平面是基本多文种平面(BMP),4E00~9FFF 中日韩文字
Ext A(CJK):3400~4DB7,共6584字
Ext B(CJK):42,807个汉字,在第2平面的0100~A836
GBK编码(Chinese Internal Code Specification)
GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组
于1995年10月,同年12月完成GBK规范。该编码标准兼容GB2312,共收录汉字21003个、
符号883个,并提供1894个造字码位,简、繁体字融于一库。
Windows95/98简体中文版的字库表层编码就采用的是GBK,通过GBK与UCS之间一一对应的
码表与底层字库联系。
英文名:Chinese Internal Code Specification
中文名:汉字内码扩展规范10版
双字节编码,GB2312-80的扩充,在码位上和GB2312-80兼容
范围:8140~FEFE(剔除xx7F)共23940个码位
包含21003个汉字,包含了ISO/IEC 10646-1中的全部中日韩汉字
GB18030-2000
英文名:Chinese Internal Code Specification
中文名:信息技术 信息交换用汉字编码字符集
基本集的扩充( 2000-03-17发布和实施)
单字节、双字节、四字节编码
向下与国家标准GB 2312信息处理交换码所对应的事实上的内码标准兼容。
在字汇上支持GB 130001的全部中、日、韩(CJK)统一汉字字符和全部CJK统一汉字扩
充A的字符。
BIG5编码
是目前台湾、香港地区普遍使用的一种繁体汉字的编码标准,包括440个符号,一级
汉字5401个、二级汉字7652个,共计13060个汉字。
1、输入码
输入码是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等。
2、交换码
计算机内部处理的信息是用二进制代码表示的,而二进制代码使用起来是不方便的,于是需要采用信息交换码。
3、机内码
根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。
4、汉字的字形码
字形码输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。
5、汉字地址码
汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。
-汉字编码
古籍破损的原因形形色色有很多,归纳起来大致有虫蛀鼠啮、霉蚀、酸化、老化、使用中的磨损等。针对不同的病因,古籍修复师都要开出不同的修补方案。
①对于那些刚出库等待修复的古籍,首先需要建立修复档案,拍摄每一页的破损情况,建立图像和文字档案。再根据破损情况设计修复方案。
②拆书,揭页。面对一些破损严重的古籍,将粘连的古籍分页也绝非易事,得使用“干揭”、“湿揭”、“蒸揭”等手法。揭好页后,需要为每一页书籍编号,否则书籍顺序会被打乱。
③古籍修复有两种方法,一种是全手工修复,另一种是使用纸浆补孔设备修复。在开始修补之前,需要先为古籍配纸。古籍修复手工纸可以分为麻纸、竹纸、皮纸、混料纸等。修复古籍需要选用古法造纸的纸,即仿造古时候的原材料、帘纹、工艺生产的纸张。修书不是选择最贵的纸,而是要选择最恰当的纸。有些制纸工艺现在已经失传,为古籍修复带来很多不便。选配的纸张通常要与待修的古籍材质、帘纹相同、颜色相仿。如遇材质特殊或带有颜色的纸张,还需要自行调配纸浆或为纸张染色。
④选好配纸,就进入正式手工修补环节。古籍修复过程中最常遇到的是修补破洞,所用工具即是最简单的一张纸、一支毛笔、一碗浆糊。具体步骤为用沾上浆糊的毛笔在破洞处涂刷,将补纸快速粘在破洞上填补破洞。修补过程中所选用的浆糊必须是去筋的小麦淀粉所调制,这样的浆糊一则浆性温和、稳定性好,而且具有操作的可逆性,一则因为所用修复材料需要天然不含化学成分。
⑤纸浆补孔机修复一般适用于虫蛀破损严重的古籍。这种机器修复机由国外进口,上海仅两台,操作步骤包括放入修复纸和文献、加盖注水、倒入纸浆、放水,最后在书页上垫保护纸,放到冷吸力台上,进行干燥处理。
⑥所有修补完的书页,需要进行压平处理。在书页上喷上水,放在吸水纸内压平,等书页干燥、压平整之后,再拿出来折页,修剪书页上多余的补纸。修剪完后,在装订前还需将所有书页放入压书机进行压平处理。
⑦经过压平处理后的书页将被复原装订成册。装订过程包括搓纸捻钉、理齐、打眼、穿纸捻钉……搓纸捻钉是一个手工活,没学过的人肯定搓不好,搓出来的钉头要硬硬的,里边则是空心的。
⑧理齐、打眼均是细致活,每一针下去都要对准古籍原先留下的钉孔,不能有丝毫误差,否则会对古籍造成新的损害。
⑨穿纸捻钉。这是流传上千年的古籍装订方法。纸捻钉可以保持长久不坏,古人很聪明,用纸捻钉来固定书叶,即便订书的线断了,书叶也不会散。最后一步是粘上封面,用真丝线装订。
1、《古汉语常用字字典》(第5版)
由著名语言学家王力、岑麒祥、林焘、戴澧、唐作藩、蒋绍愚等十余位专家学者编写,是学习古汉语的必备工具书。在第4版的基础上修订。收古汉语常用字和复音词约一万条,先秦两汉传世文献比较常用的字一般都收入。
2、《古代汉语词典》(第2版)
语文教师、中学生、文字工作者案头必备。学习古代汉语和阅读古籍使用的中型语文工具书。收词范围是古代以正统书面语言写作的有代表性的典籍,诸如《论语》《孟子》《国语》《战国策》《荀子》《老子》《庄子》《孙子》《吕氏春秋》《论衡》《史记》《汉书》《后汉书》《三国志》《唐宋文举要》。
3、《辞源》(第三版)
通往传统文化的桥梁。中国现代史上第一部大型语文性工具书,一部兼收古汉语语词和百科的大型综合性辞书。阅读古籍必备,古典文史研究工作者常备。
《辞源》 之本在字。太初有字,道在其中,理在其中,文献语词在其中,百科名物在其中,五千年文化基因、文明传统在其中,某些外来文化元素亦在其中。只有明白字的文化功用,文化渊源,才可明白《辞源》 价值之所在。
网上好象没相关信息,以下是个人理解:
文献知识是古籍整理的基础和必要工具,更是整理好古籍的前提与必要条件。
说文献知识是古籍整理的基础和必要工具,是因为:没有文献上的历史记载,古籍的整理用什么做依据,最基本的按朝代、按地区分类就不可能做到,没有历史依据的整理只可能是破坏,不可能达到保护性目的;一些古籍可能有缺损、残缺,要修补、整理就要有相关知识,知道缺失了什么才能知道该补什么,又该到哪里去找这些可以补上的信息,这时候,文献就是很好的查阅资料,没有文献,就好比航海中的船只没有罗盘,它是指引古籍整理的必要工具。
做同样一项工作,不同的人来做也能区分出好坏,古籍整理也是这样,要整理好古籍,没有丰富的文献知识做后盾,在碰到问题时不可能及时、准确地做出反应,甚至可能会破坏原有的古籍信息,因此文献知识又是整理好古籍的前提与必要条件。
常见的文字编码格式有GB2312、BIG5、GBK、UTF-8等。
1、GB2312
简体中文编码,一个汉字占用2字节,在大陆是主要编码方式。当文章或者网页中包含繁体中文、日文、韩文等时,这些内容可能无法被正确编码。
2、BIG5
属于一种繁体中文编码。
3、GBK
支持简体及繁体中文,但对别的国家,非拉丁字母语言还是有问题。
4、UTF-8
俗称“万国码”,可以同屏显示多语种,一个汉字占用3字节。Unicode用一些基本的保留字符制定了三套编码方式,是以8位序列来编码的,用一个或几个字节来表示一个字符。这种方式的最大好处,是UTF-8保留了ASCII字符的编码作为自己的一部分。
常见文字字体:
1、微软雅黑
清晰简洁,广泛应用于各种场合。
2、宋体
传统正式的中文宋体字体,常用于报纸、书籍和公文等正式场合。
3、黑体
粗壮有力,适合用于标题和海报等设计作品中。
4、仿宋
优美流畅,用于文学作品和装饰艺术中较为常见。
5、楷体
古朴典雅,多用于书法、古籍文字、印章和名片等领域。
6、新宋体
是一种更加现代化的宋体字体,适合用于电脑屏幕上显示的小字体。
7、隶书
古老的汉字书法体系之一,以其独特的笔画和线条风格而广受欢迎。
8、幼圆
圆润可爱,适合用于宣传资料、广告、海报等设计中使用。
‐GBK字库
‐UTF-8
古代汉语常用工具书有哪些
本文2023-10-27 01:12:36发表“古籍资讯”栏目。
本文链接:https://www.yizhai.net/article/173147.html